模型支持
模型支持范围说明
为确保 SERVICEME 平台在多云、多模型环境下的稳定性与可维护性,我们对接入的 大语言模型(LLM)、向量模型(Embedding)、语音与文档识别模型 制定了统一的支持规范。
该规范旨在:
- 降低多模型兼容与运维复杂度
- 提升整体性能与可控性
- 确保新功能在主流模型上的稳定可用性
模型支持等级
标准支持(Standard Support)
- 指经过全面验证并纳入产品标准测试流程的模型。
- 这些模型在功能、性能和稳定性方面均通过完整测试,并提供服务可用性保障(SLA)。
试验性支持(Experimental Support)
- 指已具备接入能力、可在主流程中使用的模型。
- 仅完成基础功能测试(接口连通性、主流程验证),不保证长期性能或稳定性。
- 在产品文档中将明确标识为“试验性支持”。
模型类别与支持情况
| 模型类型 | 示例模型 | 当前支持等级 | 备注 |
|---|---|---|---|
| 大语言模型(LLM) | GPT-4、GPT-4o、Claude 3、Gemini 1.5 | 标准支持 | 已完成多轮测试与集成 |
| 向量模型(Embedding) | text-embedding-3-small / large | 标准支持 | 适用于知识检索与语义匹配 |
| 文本转语音(TTS) | Azure Speech、OpenAI TTS | 试验性支持 | 功能可用,性能验证中 |
| 图像识别 / OCR | Azure Vision、百度 OCR | 标准支持 | 仅限于文本识别场景 |
| 语音识别(STT) | Azure Speech-to-Text | 试验性支持 | 后续计划纳入标准支持范围 |
接入与验证要求
-
接口规范统一
- 所有模型均需通过统一的模型网关服务调用(Model Gateway)。
- 请求与响应格式需遵循 SERVICEME 模型接口规范。
-
安全与合规
- 禁止调用无安全验证的第三方公开 API。
- 接入模型需符合公司数据合规要求(隐私、安全、地域限制等)。
-
性能与可观测性
- 模型需支持调用日志与性能监控。
- 对标准支持模型建立健康检查与熔断机制。
后续计划
- 持续扩展主流模型的标准支持范围(如 Mistral、Yi、Qwen 系列)。
- 提供模型性能基准测试(Benchmark)与兼容性报告。
- 推出模型接入认证机制(Model Certification)。