モデルサポート
モデルサポート範囲の説明
SERVICEMEプラットフォームがマルチクラウド、マルチモデル環境での安定性と保守性を確保するために、接続される大規模言語モデル(LLM)、ベクトルモデル(Embedding)、音声およびドキュメント認識モデルに対して統一されたサポート規範を制定しています。
この規範の目的は:
- マルチモデルの互換性および運用の複雑さを低減すること
- 全体のパフォーマンスと制御性を向上させること
- 主流モデルにおける新機能の安定した利用可能性を確保すること
モデルサポートレベル
標準サポート(Standard Support)
- 完全に検証され、製品の標準テストプロセスに組み込まれたモデルを指します。
- これらのモデルは機能、性能、安定性の面で完全なテストを通過しており、サービスの可用性保証(SLA)を提供します。
実験的サポート(Experimental Support)
- 接続能力があり、主なプロセスで使用可能なモデルを指します。
- 基本的な機能テスト(インターフェースの接続性、主プロセスの検証)のみ完了しており、長期的な性能や安定性は保証しません。
- 製品ドキュメントには「実験的サポート」と明確に表示されます。
モデルカテゴリとサポート状況
| モデルタイプ | 例示モデル | 現在のサポートレベル | 備考 |
|---|---|---|---|
| 大規模言語モデル(LLM) | GPT-4、GPT-4o、Claude 3、Gemini 1.5 | 標準サポート | 複数回のテストと統合を完了 |
| ベクトルモデル(Embedding) | text-embedding-3-small / large | 標準サポート | 知識検索および意味マッチングに適用 |
| テキスト読み上げ(TTS) | Azure Speech、OpenAI TTS | 実験的サポート | 機能は利用可能、性能検証中 |
| 画像認識 / OCR | Azure Vision、百度 OCR | 標準サポート | テキスト認識シナリオに限定 |
| 音声認識(STT) | Azure Speech-to-Text | 実験的サポート | 今後標準サポート範囲に含める予定 |
接続および検証要件
-
インターフェース規範の統一
- すべてのモデルは統一されたモデルゲートウェイサービス(Model Gateway)を通じて呼び出す必要があります。
- リクエストおよびレスポンスのフォーマットはSERVICEMEモデルインターフェース規範に準拠する必要があります。
-
セキュリティおよびコンプライアンス
- セキュリティ認証のない第三者公開APIの呼び出しは禁止されています。
- 接続モデルは会社のデータコンプライアンス要件(プライバシー、安全性、地域制限など)を満たす必要があります。
-
パフォーマンスおよび可観測性
- モデルは呼び出しログおよびパフォーマンス監視をサポートする必要があります。
- 標準サポートモデルに対してはヘルスチェックおよびサーキットブレーカー機構を構築します。
今後の計画
- 主流モデルの標準サポート範囲を継続的に拡大(例:Mistral、Yi、Qwenシリーズ)。
- モデルの性能ベンチマークテスト(Benchmark)および互換性レポートの提供。
- モデル接続認証機構(Model Certification)の導入。