RAG Pipeline 実践事例
本シリーズでは、実際の企業向け技術ドキュメントのインテリジェントQ&Aシナリオを例に、RAG Pipeline を用いてドキュメント登録からインテリジェントQ&Aまでの完全な流れを、手順を追って解説します。
シナリオ概要
あるテクノロジー企業では、社内技術ドキュメント(PDF 形式、テキスト・表・フローチャートを含む)向けに、以下の要件を満たすインテリジェントQ&Aシステムの構築を希望しています。
- テキスト、表、画像など複数のコンテンツタイプを高精度に検索できること
- マルチターン対話をサポートし、文脈上の参照関係を理解できること
- 回答を元のドキュメント断片まで追跡できること
このため、RAG Pipeline の機能を前処理と検索の 2 つの Pipeline に分けてそれぞれ編成し、2 本のチュートリアルを通じて段階的に完成させます。
チュートリアル一覧
| 序号 | チュートリアル | 内容 |
|---|---|---|
| 1 | 前処理 Pipeline とナレッジベース登録の設定 | 前処理 Pipeline(テキスト抽出、インテリジェント分割、要約/画像/表の拡張、ベクトル化保存)を編成し、ナレッジベースを作成してドキュメントをアップロードします |
| 2 | 検索 Pipeline と Agent Q&A の設定 | 検索 Pipeline(クエリ書き換え、デュアルチャネル検索、多段階リランキング、LLM による回答生成)を編成し、Agent をバインドしてQ&A効果を検証します |
前提条件
- SERVICEME V4.2 以上
- 操作ユーザーが管理者権限を持っていること
- 処理対象の PDF 技術ドキュメントが準備済みであること
💡 順番に読むことを推奨します。2 本目は 1 本目のナレッジベースデータに依存します。