环境检查与确认
功能说明
在 SERVICEME 平台部署完成后,管理员需要进行环境检查与确认操作,以确保模型配置、系统依赖及授权均处于有效状态。
此步骤是保证系统功能(如文档识别、语音识别、翻译、RAG 等)稳定运行的关键环节。
检查范围
环境检查主要包括以下模块:
| 检查项 | 说明 | 是否必须 |
|---|---|---|
| Model Set(模型集) | 检查是否包含标准支持范围内的模型(GPT、Embedding、OCR、STT 等)。 | 是 |
| Model Group(模型组) | 检查各模型组是否配置正确、可用。 | 是 |
| Default Model Setting(默认模型设置) | 检查默认模型与场景绑定关系是否正确, | 是 |
| System / ENV 环境变量 | 检查关键系统变量及模型连接状态(如 OCR、Whisper、Embedding 模型的可用性)。 | 是 |
检查步骤
打开模型管理
进入 管理 > 模型管理,依次检查以下内容:
模型集
- 确认是否存在以下标准模型:
- LLM
- Embedding
- 若缺失,请联系系统管理员重新导入模型集。
模型组
- 检查是否已根据业务场景配置模型组,例如:
- Chat / RAG / Translation / PDF Parsing / OCR 等。
- 确认各模型组中引用的模型与实际支持范围一致。
默认模型设置
- 进入「默认模型设置」页面,逐项确认默认绑定模型(如下示例):
- translate →
gpt-4.1-mini - gallery rednote →
gpt-4.1-mini - recommend config →
gpt-4.1-mini - gallery chat lead →
gpt-4.1 - optimize prompt →
gpt-4.1 - rag →
gpt-4.1 - i18n translation →
gpt-4.1-mini - gallery mindmap →
gpt-4.1-mini
- translate →
提示:对于计算量较大或对推理能力要求较高的任务(如知识检索、复杂问题分析、Prompt 优化等),应优先选择性能更强的模型;
提示:对于轻量级场景(如文本翻译、摘要生成、日常文案处理等),可选择响应速度更快、成本更低的模型,以平衡性能与效率。
常见问题与处理
| 问题 | 可能原因 | 解决方式 |
|---|---|---|
| OCR 调用失败 | API Key 失效或未配置正确 | 重新在环境变量中更新密钥 |
| Whisper 无响应 | 模型未启用或服务端未部署 | 检查模型组配置与部署状态 |
| 默认模型设置为空 | License 不完整或导入失败 | 确认 License 文件及授权范围 |
| 调用延迟过高 | 访问外部 API 网络不稳定 | 建议使用与部署地同区域的模型服务 |