RAG Pipeline
RAG Pipeline は、ナレッジベース機能のフローオーケストレーションの中核であり、「ファイル処理・ナレッジ検索・プラグイン拡張」の3種類の機能を連携させ、設定可能・再利用可能・最適化可能な RAG 実行チェーンを構築するために使用されます。
その中核的な価値は、企業が単一の固定フローに依存する必要をなくし、異なるドキュメントタイプ、異なる Agent、異なる業務目標に応じて、検索拡張生成(RAG)フローを柔軟に設計し、継続的に最適化できるようにすることです。
💡 ヒント:この機能は V4.2 以降のバージョンでのみサポートされています。
コア機能
- フローをオーケストレーション可能:前処理、検索、再ランキング、変数処理などの機能をノードとして組み合わせ、必要に応じて業務チェーンを構築できます。
- 機能を疎結合化可能:前処理、検索、プラグインの3つの部分をそれぞれ独立して設定・反復でき、全体調整コストを削減します。
- 戦略を再利用可能:組み込みのデフォルトフローとカスタムフローの共存をサポートし、テンプレートを複製して迅速に適用できます。
- 実行を可観測化可能:試運転、ログ確認、ノードレベルの入出力特定をサポートし、最適化や障害切り分けを容易にします。
- 拡張を継続可能:プラグイン機構を通じて独自アルゴリズムやサードパーティサービスを接続し、エンタープライズ向けのカスタマイズ要件を満たします。
RAG Pipeline の機能構成
RAG Pipeline は、以下の3種類の機能で構成されています:
⚠️ 権限説明:RAG Pipeline の作成、変更、公開操作にはいずれも管理者権限が必要です。一般ユーザーは、管理者によって承認・公開された Pipeline のみ使用できます。
検索 Pipeline
ナレッジのリコール戦略と実行ロジックを定義するために使用され、RAG 質疑応答の効果における重要な要素です。
- 基本オーケストレーションと高度なオーケストレーションの2つのモードをサポートし、標準検索から複雑なマルチパスリコールのシナリオまで対応します。
- フィルタリング、再ランキング、分かち書き、テンプレート、プラグインなどのノードと組み合わせることで、リコール品質を精密に制御できます。
- Agent 単位で設定し、コンテキストパラメータを継承することで、異なるインテリジェントエージェント向けの差別化された検索戦略を実現できます。
前処理 Pipeline
ファイル登録前の解析、分割、強化、ベクトル化フローを定義するために使用され、ナレッジの検索可能性を支える基盤です。
- ファイルタイプごとに異なる前処理ルールを適用でき、一致しない場合はデフォルトフローにフォールバックします。
- テキスト抽出、テキストチャンク分割、フィールド抽出、後処理、データ処理、プラグイン拡張などの機能を網羅しています。
- 試運転と結果プレビューをサポートし、本番登録前に処理効果を検証できます。
プラグイン Pipeline
プラットフォームのデフォルト機能を拡張するために使用され、カスタム Python コードまたはプラグインパッケージのアップロードによって、個別の処理ロジックを接続できます。
- 手動作成とローカルパッケージアップロードの2つの方式をサポートし、異なる開発スタイルに対応します。
- 前処理または検索の工程で使用でき、独自アルゴリズム、外部 API、サードパーティサービス統合の要件を満たします。
- 独立した実行テスト機能を提供し、プラグインのデバッグやバージョン反復を容易にします。
適用シナリオ
- マルチソースドキュメント管理:PDF、Office、表計算、音声・動画など、異なるコンテンツに対して差別化された前処理戦略を設計します。
- 複数 Agent 向け高精度 Q&A:異なる業務インテリジェントエージェントごとに独立した検索フローを設定し、「1つの戦略ですべてのシナリオに対応する」ことを回避します。
- 継続的な最適化運用:試運転とログ追跡によってボトルネックを特定し、リコール品質と応答効果を継続的に改善します。
- 企業向けプライベート拡張:プラグインを通じて企業内部システム、独自モデル機能、または業界専用アルゴリズムを接続します。
使用上の推奨事項
- 初回利用時は、まず組み込みのデフォルト Pipeline を優先的に採用し、実行可能な標準チェーンを構築することを推奨します。
- 「前処理品質 → 検索戦略 → プラグイン拡張」の順で段階的に最適化することを推奨し、デバッグの複雑さを軽減します。
- 調整のたびに試運転とログで効果を検証し、その後段階的に本番環境へ公開してください。