模型支持范围说明
为确保 SERVICEME 平台在多云、多模型环境下的稳定性与可维护性,我们对接入的 大语言模型(LLM)、向量模型(Embedding)、语音与文档识别模型 制定了统一的支持规范。
该规范旨在:
- 降低多模型兼容与运维复杂度
- 提升整体性能与可控性
- 确保新功能在主流模型上的稳定可用性
模型支持等级
标准支持(Standard Support)
- 定义:全面纳入产品支持范围。
- 要求:功能、性能和稳定性均已完成完整测试,并提供服务可用性保障(SLA,Service Level Agreement)。
试验性支持(Experimental Support)
- 定义:模型已集成到主流程,确保功能可用。
- 要求:仅进行基础功能测试(如接口连通性、主流程可跑通),未做性能/稳定性验证。
- 标识:在产品文档中明确标记为“试验性支持”(experimental)。
模型类别与支持情况
大语言模型(LLM)
| 接口/厂商 | 支持模型 | 当前支持等级 | 备注 |
|---|
| Azure OpenAI | GPT-5.4、GPT-5.5 | 标准支持 | |
| OpenAI | GPT-5.4、Qwen3.6-Max-Preview、Qwen3.6-Plus、Qwen3.6-Flash、DeepSeek V3.2 | 标准支持 | |
| Anthropic | Claude Sonnet 4.6、Claude Opus 4.6 | 标准支持 | |
| Google Vertex | Gemini 3.1 Pro、Gemini 3.1 Flash | 标准支持 | |
| AWS Bedrock | Claude Sonnet 4.6、Claude Opus 4.6、Llama 4 | 标准支持 | |
文生图模型
| 厂商 | 支持模型 | 当前支持等级 | 备注 |
|---|
| Azure | GPT-Image-1.5、GPT-Image-2 | 标准支持 | |
| 阿里云 | Qwen Image 2.0 | 标准支持 | |
| AWS | Titan Image v2 | 标准支持 | |
向量模型(Embedding)
| 厂商 | 支持模型 | 当前支持等级 | 备注 |
|---|
| Azure | text-embedding-3-large | 标准支持 | |
| 阿里云 | text-embedding-v4 | 标准支持 | |
| AWS | Amazon Nova Embed | 标准支持 | |
图像识别 / OCR
| 厂商 | 支持模型 | 当前支持等级 | 备注 |
|---|
| Azure | Azure AI Document Intelligence | 标准支持 | |
| AWS | Amazon Textract | 标准支持 | |
| 阿里云 | 阿里云-文字识别 | 标准支持 | |
| 第三方 | TextIn | 标准支持 | |
语音识别(STT)
| 厂商 | 支持模型 | 当前支持等级 | 备注 |
|---|
| Azure | Whisper | 标准支持 | |
数据源(Data Source)
| 类型 | 示例 | 当前支持等级 | 备注 |
|---|
| RDB/DW | Knowledge Base、Sharepoint | 标准支持 | |
| MySQL | | 标准支持 | |
| SQLServer | | 标准支持 | |
| Azure Databricks | | 标准支持 | |
| Snowflake | | 标准支持 | |
| Azure Fabric | | 标准支持 | |
搜索引擎(Search Engine)
| 类型 | 支持模型 | 当前支持等级 | 备注 |
|---|
| 标准支持 | G-bing Search、Meta Search、Tencent Search | 标准支持 | |
接入与验证要求
-
接口规范统一
- 所有模型均需通过统一的模型网关服务调用(Model Gateway)。
- 请求与响应格式需遵循 SERVICEME 模型接口规范。
-
安全与合规
- 禁止调用无安全验证的第三方公开 API。
- 接入模型需符合公司数据合规要求(隐私、安全、地域限制等)。
-
性能与可观测性
- 模型需支持调用日志与性能监控。
- 对标准支持模型建立健康检查与熔断机制。