跳到主要内容

知识库管理

Knowledge 模块中,用户可在 我的空间企业空间 中创建知识库,用于统一管理文档、文件夹、检索配置与访问权限。

知识库的创建入口统一位于 我的空间企业空间 页面右上角。创建知识库时,需选择以下两种模式之一:

  • 基础模式:适用于标准知识库接入场景,配置简单,便于快速上线。
  • Pipeline 模式:适用于需要自定义处理链路的场景,支持通过 Pipeline 规则实现更细粒度的文件处理与检索控制。

下表对比了 我的空间企业空间 在知识库管理方面的主要差异:

我的空间企业空间
创建知识库
创建子级知识库
文件夹

说明

  • 我的空间:仅支持创建一级知识库,不支持创建子知识库。初始默认包含两个系统知识库:默认知识库聊天文件
  • 企业空间:支持创建一级知识库,并可在其下继续创建子知识库。

如何新建知识库?

创建步骤

  1. 进入 知识库 → 我的空间企业空间
  2. 点击页面右上角的 创建知识库
  3. 选择知识库模式:基础模式Pipeline 模式
  4. 填写相关信息并完成配置。
  5. 点击 创建,完成知识库创建。

💡 提示:在企业空间下创建知识库需要具备相应的管理权限。

通用配置

无论选择哪种模式,都需完成以下基础配置:

  • 名称:知识库名称。
  • 描述:知识库说明信息。
  • 排序:用于控制知识库在列表中的展示顺序。
  • 文件支持格式:从下拉列表中选择允许上传的文件类型。
  • 向量数据库
    • 平台自带:使用平台内置向量数据库。
    • 外置数据库:接入外部向量数据库。
  • 向量模型:用于文本向量化嵌入。
    • 若向量数据库选择 外置数据库,向量模型中将新增 数据库内置模型 选项(使用数据库自身的向量化能力,数据入库时自动生成向量);此时需填写 模型名称维度
  • 存储配额:限制知识库的总存储空间。
  • 文件大小限制:限制单个上传文件的大小。

💡 提示:自定义上传文件大小及格式限制后,若上传的文件不符合要求,系统将给出相应提示。

Pipeline 模式配置

若需要自定义文件处理流程、检索策略或接入不同处理链路,可选择 Pipeline 模式。除通用配置外,还需设置以下内容:

检索设置

  • 文件预览:控制知识库中的文件(文档、图片、视频、音频)是否支持在线预览。
  • 文件索引:设置各类资源是否加入全局搜索索引。关闭后,对应资源将无法通过关键词检索到。

Pipeline 配置规则

用于为不同文件类型、来源或路径指定对应的预处理 Pipeline,实现差异化处理。

  • 导入默认规则:点击 导入,可一键载入系统预设的 Pipeline 分配规则,快速完成基础配置。
  • 规则列表:每条规则展示以下信息:
    • Pipeline 名称:所采用的预处理 Pipeline。
    • 文件类型:适用的文件格式。
    • 来源:文件的来源。
    • 文件名:匹配的文件名,支持通配符,默认值为 *(匹配所有文件)。
    • 文件路径:匹配的文件路径,支持通配符,默认值为 *(匹配所有路径)。
  • 规则操作
    • 详情:点击可查看该条规则绑定的 Pipeline 工作流,允许修改流程或保持默认。
    • 删除:移除该条规则。

说明:通过文件名和文件路径的通配符配置,可以精准限定处理范围(如仅处理 /report 目录下的 *.pdf 文件),未指定时将匹配所有文件。

添加向量数据库

  1. 导航至 管理 → 知识库管理 → 向量数据库
  2. 点击页面右上角的 “添加向量数据库” 按钮。
  3. 填写基本信息:
    • 向量数据库名称:用于标识该数据库连接。
    • 向量数据库描述:补充说明数据库用途或环境信息。
    • 向量数据库类型:当前仅支持 Snowflake
  4. 配置连接参数:
    • User:数据库用户名。
    • Role:数据库角色。
    • Database:目标数据库名称。
    • Account:Snowflake 账户标识符。
    • Warehouse:计算仓库名称。
    • Schema:数据库架构名称。
    • Private Key Password:私钥文件的解密密码(如私钥未加密可留空)。
    • Private Key Data:上传私钥文件,支持 .p8.pem.key.txt 格式。点击上传区域选择本地密钥文件。
  5. 点击 “测试连接” 验证配置是否正确。验证通过后点击 “保存” 完成添加。

如何添加子知识库?

只有 企业空间 支持添加子级知识库。添加步骤如下:

  1. 在企业空间页面,点击目标知识库卡片进入详情页。
  2. 在页面左侧的知识库目录中,定位到作为父级的知识库。
  3. 点击该知识库名称右侧的 “+” 图标,选择 “添加子级知识库”。
  4. 在弹出的创建窗口中,选择 基础模式Pipeline 模式,填写相关配置项(配置方式与创建知识库一致)。
  5. 点击 “创建” 完成添加。

子知识库创建成功后,可依照上述步骤在其下继续新增下一级子知识库,层级上限为五级

如何进行知识库设置?

知识库设置 可通过以下两种入口打开:

  • 在知识库卡片上点击 ✏️ 图标;
  • 进入知识库后,点击名称旁的 齿轮 图标。

不同模式下的可配置项有所差异:

  • 基础模式:支持 常规设置、文件设置、文件源、元数据模板、用户设置
  • Pipeline 模式:支持 常规设置、Pipeline、文件源、用户设置

常规设置

知识库常规设置就是创建知识库时填写的信息,包括知识库名称、类型、描述、向量数据库、向量模型、存储配额、文件限制大小、文件支持格式。

文件设置

文件设置用于控制知识库中文件的解析、分段、检索与摘要行为。

索引方式

  • 基础解析:适用于通用文本识别,仅支持文字提取,不包含表格和图片解析。
  • OCR 智能解析:适用于复杂文档、扫描件、表格类文档等场景。
    • 智能模型解析:通过系统内置模型进行语义识别与结构化提取,适用于含表格或复杂排版的文档。
    • Azure AI 文档智能
      • 基础:提供更准确的文本提取,适用于复杂文档,支持印刷和手写文本识别。
      • 布局:具备文本识别、表格重建和图像识别能力,可更好保留文档布局结构。

OCR能力扩展

平台支持接入多种第三方 OCR 服务,以增强对复杂文档、特殊版式及多语言内容的识别精度。

  • TextIn:主要面向非微软生态用户,提供高质量的 OCR 替代方案,擅长处理特殊版式和高难度文档。
  • Alibaba Cloud OCR:提供云端文档识别能力,需完成服务配置后使用,适合图片、扫描件及多语言文本的高精度识别。

分段模式

  • 默认分段:按系统默认方式进行切分。
  • 细分模式:先按最大 1024 字符切分,再在片段内按 200 字符细分。
  • 自定义模式:允许用户自定义每片的最大字符数。

检索设置

  • 文件预览:控制文件是否支持在线预览。
  • 文件索引:控制文件是否加入全局搜索索引。

文件摘要生成:控制是否为新上传文档自动生成摘要。

文件源

知识库支持接入文件源,用于同步云端或第三方存储中的内容。

元数据

元数据用于描述文件或知识库本身的属性信息,例如 名称、位置、标签、类别 等。

元数据在 SERVICEME 中的作用

文件级元数据

  • 上传文件时,系统自动保存基础元数据,如 文件大小、名称、存储位置 等。
  • 用户也可补充自定义元数据,例如 标签、类别、上传者 等。
  • 检索知识库文件时,可结合元数据筛选条件提高搜索命中率。

知识库级元数据

  • 知识库本身也可配置元数据,如 主题、行业类别、权限信息 等。
  • 通过知识库级元数据,可提升知识管理与分类检索效率。

元数据的自动继承与填充机制

  • 若某个文件夹配置了元数据模板,则该文件夹下新上传或同步的文件会自动继承相应的元数据 Key。
  • 若文件开启了“总结(Summarization)”功能,系统会在处理过程中结合文件内容与元数据自动填充相关字段信息,以增强总结与检索效果。

用户管理

所有者:拥有该知识库的全部权限,包括 管理、编辑、访问

访客:仅可查看知识库内容,无法修改知识库内容。

提示
  • 可以通过角色管理成员权限,但角色权限页面只有管理员才可访问。
  • 具体配置方式见下文“知识库成员权限配置”。

知识库成员权限配置

在通过角色管理知识库成员权限前,需要先理解三个概念:角色、用户授权、功能授权

  • 角色:用于定义一组权限。
  • 用户授权:将用户绑定到某个角色。
  • 功能授权:为角色分配可用功能范围。

💡 提示:可以理解为:功能授权 + 用户授权 = 为某个用户授予某项权限

示例:为 DemoUser 授予 Demo 知识库的 管理 权限。

  • 在角色列表右侧点击 新增,创建一个名为 知识库管理 的角色;
  • 创建角色后,点击该角色对应的 功能授权,在空间管理下找到并勾选 Demo 知识库;
  • 再点击该角色对应的 用户授权,选择并勾选 DemoUser
  • 完成以上操作后,即可成功授予对应权限。

如何删除知识库?

可通过以下方式删除知识库:

  • 通过知识库卡片:在知识库概述页找到对应的知识库卡片,点击卡片右下角的 🗑 图标即可删除。
  • 通过知识库内列表:进入知识库后,在左侧知识库列表中定位目标知识库,点击其后的 🗑 图标进行删除。子知识库同样适用此方式。

⚠️ 注意

  • 若知识库下存在子知识库,需先删除所有子级知识库后,才能删除上级知识库。
  • 删除操作通常不可逆,请在执行前确认数据影响与权限范围。