模型支持
模型支持范围说明
为确保 SERVICEME 平台在多云、多模型环境下的稳定性与可维护性,我们对接入的 大语言模型(LLM)、向量模型(Embedding)、语音与文档识别模型 制定了统一的支持规范。
该规范旨在:
- 降低多模型兼容与运维复杂度
- 提升整体性能与可控性
- 确保新功能在主流模型上的稳定可用性
模型支持等级
标准支持(Standard Support)
- 指全面纳入产品支持范围的模型。
- 由Medalsoft统一完成功能、性能、稳定性等完整测试流程,并通过产品级验证。
- 可在生产环境中稳定使用,提供服务可用性保障(SLA)。
试验性支持(Experimental Support)
- 指模型已完成接入并可在主流程中使用,用于功能验证或场景试点。
- 仅完成基础功能测试(如接口连通性、主流程可跑通),
- Medalsoft尚未对其性能和稳定性进行验证。
- 性能、稳定性相关评估需由用户自行测试与验证。
- 在产品文档中将明确标识为“试验性支持”。
模型类别与支持情况
| 模型类型 | 示例模型 | 当前支持等级 | 备注 |
|---|---|---|---|
| 大语言模型(LLM) | GPT-4、GPT-4o、GPT-5 | 标准支持 | 已完成多轮测试与集成 |
| 大语言模型(LLM) | Amazon Titan | 试验性支持 | 性能、稳定性相关评估未完成 |
| 向量模型(Embedding) | text-embedding-3-large | 标准支持 | 适用于知识检索与语义匹配 |
| 向量模型(Embedding) | Titan Embedding | 试验性支持 | 性能、稳定性相关评估未完成 |
| 图像识别 / OCR | Azure Document Intelligent | 标准支持 | 仅限于文本识别场景 |
| 图像识别 / OCR | Amazon Textract | 试验性支持 | 性能、稳定性相关评估未完成 |
| 语音识别(STT) | Azure Whisper | 标准支持 | 已完成多轮测试与集成 |
| 语音识别(STT) | Amazon Transcribe | 试验性支持 | 性能、稳定性相关评估未完成 |
| 搜索(Search) | Google搜索、腾讯搜索 | 标准支持 | 已完成多轮测试与集成 |
| 文本转图片(Text-to-Image) | 无 | 标准支持 | 标准图片生成模型都可适配 |
| 文本转语音(TTS) | Azure Speech、OpenAI TTS | 试验性支持 | 功能可用,性能验证中 |
接入与验证要求
-
接口规范统一
- 所有模型均需通过统一的模型网关服务调用(Model Gateway)。
- 请求与响应格式需遵循 SERVICEME 模型接口规范。
-
安全与合规
- 禁止调用无安全验证的第三方公开 API。
- 接入模型需符合公司数据合规要求(隐私、安全、地域限制等)。
-
性能与可观测性
- 模型需支持调用日志与性能监控。
- 对标准支持模型建立健康检查与熔断机制。