文字起こし結果の補正
文字起こし結果の補正は、音声を基準に文字起こし結果を再確認し、テキストの誤りを補正する機能です。
文字起こし結果の補正機能の利用には Enterprise ライセンスが必要です。詳細は料金をご参照ください。
設定方法
POST のリクエストボディの config に、以下のパラメータを設定します。
| Name | Type | Default | 説明 |
|---|---|---|---|
| use_refinement | Boolean | false | true にすると、文字起こし結果の補正を要求します。 |
キーワードブースティングのために keywords を設定した場合、同じキーワードは文字起こし結果の補正でも参考ヒントとして使用されます。
keywords の設定方法はキーワードブースティングを参照してください。
リクエスト例
{
"use_refinement": true
}
POST example: Batch STT sample code
Unified example (presets): Batch STT sample code
結果取得の流れ
文字起こしリクエスト後は、まず既存のバッチ STT 結果取得 API で基本の文字起こし結果を確認します。
GET https://openapi.vito.ai/v1/transcribe/{TRANSCRIBE_ID}
文字起こし結果の補正を要求した場合は、基本の文字起こし結果とは別に、result=refined クエリパラメータを付けて補正済みの文字起こし結果を取得できます。
GET https://openapi.vito.ai/v1/transcribe/{TRANSCRIBE_ID}?result=refined
文字起こし結果の補正は、基本の文字起こし処理が完了した後に別の後処理として実行されます。
そのため、基本の文字起こし結果が先に completed になり、補正済み結果は後から利用可能になる場合があります。
補正結果の応答例
result=refined の応答では、基本の文字起こし状態と補正状態を確認できます。
基本の文字起こしがまだ処理中、または失敗した場合は、基本の文字起こし状態のみ返されます。
基本の文字起こしが完了した後は、refine_status で補正状態を確認できます。
文字起こし結果の補正は、発話時刻と話者情報を維持しながら、音声に基づいてテキストの誤りを補正します。 補正が不要な発話は、元のテキストと同じ内容で返される場合があります。
| 基本の文字起こし結果 | 補正済み結果 |
|---|---|
| 商品の配送予定を格人したくて連絡しました。 | 商品の配送予定を確認したくて連絡しました。 |
| 本日午後産時に再度ご案内します。 | 本日午後3時に再度ご案内します。 |
| Name | 説明 | Type | Value |
|---|---|---|---|
| status | 基本の文字起こし状態 | string | transcribing, completed, failed |
| refine_status | 補正処理の状態 | string | queued, processing, completed, failed |
| refine_error.code | 補正処理の失敗コード | string | refiner_enqueue_failed, refiner_input_unavailable, refiner_failed |
| results.utterances | 補正済み発話情報 | array |
status: transcribing
基本の文字起こし処理がまだ完了していない場合です。
{
"id": "{TRANSCRIBE_ID}",
"status": "transcribing"
}
status: failed
基本の文字起こし処理が失敗した場合です。
{
"id": "{TRANSCRIBE_ID}",
"status": "failed",
"error": {
"code": "{ERROR_CODE}",
"message": "{MESSAGE}"
}
}
refine_status: queued / processing
基本の文字起こしは完了していますが、補正処理がまだ完了していない場合です。
この場合、results は含まれず、現在の補正状態のみ返されます。
{
"id": "{TRANSCRIBE_ID}",
"status": "completed",
"refine_status": "processing"
}
refine_status: completed
{
"id": "{TRANSCRIBE_ID}",
"status": "completed",
"refine_status": "completed",
"results": {
"utterances": [
{
"start_at": 4737,
"duration": 2360,
"msg": "商品の配送予定を確認したくて連絡しました。",
"spk": 0,
"lang": "ja"
},
{
"start_at": 8197,
"duration": 3280,
"msg": "本日午後3時に再度ご案内します。",
"spk": 1,
"lang": "ja"
}
]
}
}
refine_status: failed
{
"id": "{TRANSCRIBE_ID}",
"status": "completed",
"refine_status": "failed",
"refine_error": {
"code": "refiner_failed"
}
}
制限事項
use_refinementはuse_multi_channelと一緒に使用できません。- 補正済み結果には
utterancesのみ含まれます。 - 補正済み結果は、基本の文字起こし結果よりも後から利用可能になる場合があります。