跳到主要内容

RAG Pipeline 实战案例

本系列以一个真实的企业技术文档智能问答场景为例,手把手演示如何通过 RAG Pipeline 实现从文档入库到智能问答的完整链路。

场景概述

某科技公司希望为内部技术文档(PDF 格式,含文字、表格、流程图)构建一套智能问答系统,要求:

  • 对文字、表格、图片等多种内容类型均能精准检索
  • 支持多轮对话,能理解上下文指代
  • 回答可追溯到原始文档片段

为此,我们将 RAG Pipeline 的能力拆分为预处理检索两条 Pipeline 分别编排,通过两篇教程逐步完成。

教程目录

序号教程内容
1配置预处理 Pipeline 与知识库入库编排预处理 Pipeline(文本提取、智能分段、摘要/图片/表格增强、向量化存储),创建知识库并上传文档
2配置检索 Pipeline 与 Agent 问答编排检索 Pipeline(查询改写、双通道检索、多级重排、LLM 生成回答),绑定 Agent 并验证问答效果

前置条件

  • SERVICEME V4.2 及以上版本
  • 操作用户具备管理员权限
  • 已准备好待处理的 PDF 技术文档

💡 建议按顺序阅读,第二篇依赖第一篇的知识库数据。