RAG Pipeline 实战案例
本系列以一个真实的企业技术文档智能问答场景为例,手把手演示如何通过 RAG Pipeline 实现从文档入库到智能问答的完整链路。
场景概述
某科技公司希望为内部技术文档(PDF 格式,含文字、表格、流程图)构建一套智能问答系统,要求:
- 对文字、表格、图片等多种内容类型均能精准检索
- 支持多轮对话,能理解上下文指代
- 回答可追溯到原始文档片段
为此,我们将 RAG Pipeline 的能力拆分为预处理和检索两条 Pipeline 分别编排,通过两篇教程逐步完成。
教程目录
| 序号 | 教程 | 内容 |
|---|---|---|
| 1 | 配置预处理 Pipeline 与知识库入库 | 编排预处理 Pipeline(文本提取、智能分段、摘要/图片/表格增强、向量化存储),创建知识库并上传文档 |
| 2 | 配置检索 Pipeline 与 Agent 问答 | 编排检索 Pipeline(查询改写、双通道检索、多级重排、LLM 生成回答),绑定 Agent 并验证问答效果 |
前置条件
- SERVICEME V4.2 及以上版本
- 操作用户具备管理员权限
- 已准备好待处理的 PDF 技术文档
💡 建议按顺序阅读,第二篇依赖第一篇的知识库数据。