メインコンテンツまでスキップ

音声認識言語

language で認識言語を設定します。

  • whisper 利用時は必須です。
  • sommers では任意です。対応言語は ko(韓国語)、ja(日本語)。省略時は ko が既定値です。

対応言語

Sommers モデル

  • 韓国語(ko)と日本語(ja)に対応
  • language を設定しない場合、ko(韓国語)が既定になります

Whisper モデル

  • ISO 639-1 の 2 文字コード。完全リストは whisper 公式を参照。

言語検出と多言語(Whisper 専用)

  1. detect: 単一言語の自動検出
  2. multi: 文ごとに異なる複数言語に対応

language_candidates(Whisper 専用)

detect/multi 使用時に候補言語を指定して精度を高められます。

  • 既定: ["ko", "ja", "zh", "en"]
注意
  • whisper では language が必須
  • sommers では language は任意(ko/ja をサポート、既定は ko
  • detect/multi および language_candidates は Whisper 専用機能(sommers では非対応)
  • 候補を増やしすぎると精度低下

POST のリクエストボディlanguage を設定します(whisper では必須)。detect/multi の場合は language_candidates の指定も可能です。

POST example: Example

Unified example (presets): Example