メインコンテンツまでスキップ

文字起こし結果の補正

文字起こし結果の補正は、音声を基準に文字起こし結果を再確認し、テキストの誤りを補正する機能です。

文字起こし結果の補正機能の利用には Enterprise ライセンスが必要です。詳細は料金をご参照ください。

設定方法

POST のリクエストボディconfig に、以下のパラメータを設定します。

NameTypeDefault説明
use_refinementBooleanfalsetrue にすると、文字起こし結果の補正を要求します。

キーワードブースティングのために keywords を設定した場合、同じキーワードは文字起こし結果の補正でも参考ヒントとして使用されます。 keywords の設定方法はキーワードブースティングを参照してください。

リクエスト例

{
"use_refinement": true
}

POST example: Batch STT sample code

Unified example (presets): Batch STT sample code

結果取得の流れ

文字起こしリクエスト後は、まず既存のバッチ STT 結果取得 API で基本の文字起こし結果を確認します。

GET https://openapi.vito.ai/v1/transcribe/{TRANSCRIBE_ID}

文字起こし結果の補正を要求した場合は、基本の文字起こし結果とは別に、result=refined クエリパラメータを付けて補正済みの文字起こし結果を取得できます。

GET https://openapi.vito.ai/v1/transcribe/{TRANSCRIBE_ID}?result=refined
ヒント

文字起こし結果の補正は、基本の文字起こし処理が完了した後に別の後処理として実行されます。 そのため、基本の文字起こし結果が先に completed になり、補正済み結果は後から利用可能になる場合があります。

補正結果の応答例

result=refined の応答では、基本の文字起こし状態と補正状態を確認できます。 基本の文字起こしがまだ処理中、または失敗した場合は、基本の文字起こし状態のみ返されます。 基本の文字起こしが完了した後は、refine_status で補正状態を確認できます。

文字起こし結果の補正は、発話時刻と話者情報を維持しながら、音声に基づいてテキストの誤りを補正します。 補正が不要な発話は、元のテキストと同じ内容で返される場合があります。

基本の文字起こし結果補正済み結果
商品の配送予定を格人したくて連絡しました。商品の配送予定を確認したくて連絡しました。
本日午後産時に再度ご案内します。本日午後3時に再度ご案内します。
Name説明TypeValue
status基本の文字起こし状態stringtranscribing, completed, failed
refine_status補正処理の状態stringqueued, processing, completed, failed
refine_error.code補正処理の失敗コードstringrefiner_enqueue_failed, refiner_input_unavailable, refiner_failed
results.utterances補正済み発話情報array

status: transcribing

基本の文字起こし処理がまだ完了していない場合です。

{
"id": "{TRANSCRIBE_ID}",
"status": "transcribing"
}

status: failed

基本の文字起こし処理が失敗した場合です。

{
"id": "{TRANSCRIBE_ID}",
"status": "failed",
"error": {
"code": "{ERROR_CODE}",
"message": "{MESSAGE}"
}
}

refine_status: queued / processing

基本の文字起こしは完了していますが、補正処理がまだ完了していない場合です。 この場合、results は含まれず、現在の補正状態のみ返されます。

{
"id": "{TRANSCRIBE_ID}",
"status": "completed",
"refine_status": "processing"
}

refine_status: completed

{
"id": "{TRANSCRIBE_ID}",
"status": "completed",
"refine_status": "completed",
"results": {
"utterances": [
{
"start_at": 4737,
"duration": 2360,
"msg": "商品の配送予定を確認したくて連絡しました。",
"spk": 0,
"lang": "ja"
},
{
"start_at": 8197,
"duration": 3280,
"msg": "本日午後3時に再度ご案内します。",
"spk": 1,
"lang": "ja"
}
]
}
}

refine_status: failed

{
"id": "{TRANSCRIBE_ID}",
"status": "completed",
"refine_status": "failed",
"refine_error": {
"code": "refiner_failed"
}
}

制限事項

  • use_refinementuse_multi_channel と一緒に使用できません。
  • 補正済み結果には utterances のみ含まれます。
  • 補正済み結果は、基本の文字起こし結果よりも後から利用可能になる場合があります。