跳到主要内容

模型支持


模型支持范围说明

为确保 SERVICEME 平台在多云、多模型环境下的稳定性与可维护性,我们对接入的 大语言模型(LLM)、向量模型(Embedding)、语音与文档识别模型 制定了统一的支持规范。

该规范旨在:

  • 降低多模型兼容与运维复杂度
  • 提升整体性能与可控性
  • 确保新功能在主流模型上的稳定可用性

模型支持等级

标准支持(Standard Support)

  • 指经过全面验证并纳入产品标准测试流程的模型。
  • 这些模型在功能、性能和稳定性方面均通过完整测试,并提供服务可用性保障(SLA)。

试验性支持(Experimental Support)

  • 指已具备接入能力、可在主流程中使用的模型。
  • 仅完成基础功能测试(接口连通性、主流程验证),不保证长期性能或稳定性。
  • 在产品文档中将明确标识为“试验性支持”。

模型类别与支持情况

模型类型示例模型当前支持等级备注
大语言模型(LLM)GPT-4、GPT-4o、Claude 3、Gemini 1.5标准支持已完成多轮测试与集成
向量模型(Embedding)text-embedding-3-small / large标准支持适用于知识检索与语义匹配
文本转语音(TTS)Azure Speech、OpenAI TTS试验性支持功能可用,性能验证中
图像识别 / OCRAzure Vision、百度 OCR标准支持仅限于文本识别场景
语音识别(STT)Azure Speech-to-Text试验性支持后续计划纳入标准支持范围

接入与验证要求

  1. 接口规范统一

    • 所有模型均需通过统一的模型网关服务调用(Model Gateway)。
    • 请求与响应格式需遵循 SERVICEME 模型接口规范。
  2. 安全与合规

    • 禁止调用无安全验证的第三方公开 API。
    • 接入模型需符合公司数据合规要求(隐私、安全、地域限制等)。
  3. 性能与可观测性

    • 模型需支持调用日志与性能监控。
    • 对标准支持模型建立健康检查与熔断机制。

后续计划

  • 持续扩展主流模型的标准支持范围(如 Mistral、Yi、Qwen 系列)。
  • 提供模型性能基准测试(Benchmark)与兼容性报告。
  • 推出模型接入认证机制(Model Certification)。