Skip to main content

RAG Pipeline 実践事例

本シリーズでは、実際の企業向け技術ドキュメントのインテリジェントQ&Aシナリオを例に、RAG Pipeline を用いてドキュメント登録からインテリジェントQ&Aまでの完全な流れを、手順を追って解説します。

シナリオ概要

あるテクノロジー企業では、社内技術ドキュメント(PDF 形式、テキスト・表・フローチャートを含む)向けに、以下の要件を満たすインテリジェントQ&Aシステムの構築を希望しています。

  • テキスト、表、画像など複数のコンテンツタイプを高精度に検索できること
  • マルチターン対話をサポートし、文脈上の参照関係を理解できること
  • 回答を元のドキュメント断片まで追跡できること

このため、RAG Pipeline の機能を前処理検索の 2 つの Pipeline に分けてそれぞれ編成し、2 本のチュートリアルを通じて段階的に完成させます。

チュートリアル一覧

序号チュートリアル内容
1前処理 Pipeline とナレッジベース登録の設定前処理 Pipeline(テキスト抽出、インテリジェント分割、要約/画像/表の拡張、ベクトル化保存)を編成し、ナレッジベースを作成してドキュメントをアップロードします
2検索 Pipeline と Agent Q&A の設定検索 Pipeline(クエリ書き換え、デュアルチャネル検索、多段階リランキング、LLM による回答生成)を編成し、Agent をバインドしてQ&A効果を検証します

前提条件

  • SERVICEME V4.2 以上
  • 操作ユーザーが管理者権限を持っていること
  • 処理対象の PDF 技術ドキュメントが準備済みであること

💡 順番に読むことを推奨します。2 本目は 1 本目のナレッジベースデータに依存します。