전사 결과 보정
전사 결과 보정은 오디오를 기준으로 전사 결과를 다시 확인하여 텍스트 오류를 교정하는 기능입니다.
전사 결과 보정 기능을 사용하기 위해서는, "enterprise" 라이선스 계약이 필요합니다. 아래 바로가기를 통해 문의해주세요.
구축형(On-premise) 혹은 Enterprise 기능 문의 바로가기
설정 방법
요청 바디의 config에 아래 파라미터를 설정합니다.
| Name | Type | Default | Desc |
|---|---|---|---|
| use_refinement | Boolean | false | true로 설정할 경우, 전사 결과 보정을 요청합니다. |
키워드 부스팅을 위해 keywords를 설정한 경우, 같은 키워드가 전사 결과 보정 과정의 참고 힌트로도 사용됩니다.
keywords 설정 방법은 키워드 부스팅을 참고하세요.
요청 예시
{
"use_refinement": true
}
POST 요청 예제: 일반 STT 샘플 코드
전체 예제: 일반 STT 샘플 코드
결과 조회 흐름
전사 요청 후에는 먼저 기존 일반 STT 결과 조회 API로 기본 전사 결과를 확인합니다.
GET https://openapi.vito.ai/v1/transcribe/{TRANSCRIBE_ID}
전사 결과 보정을 요청한 경우, 기본 전사 결과와 별도로 result=refined 쿼리 파라미터를 추가하여 보정된 전사 결과를 조회할 수 있습니다.
GET https://openapi.vito.ai/v1/transcribe/{TRANSCRIBE_ID}?result=refined
전사 결과 보정은 기본 전사 작업이 완료된 뒤 별도 후처리로 진행됩니다.
따라서 기본 전사 결과가 먼저 completed 상태가 되고, 보정된 결과는 이후에 준비될 수 있습니다.
보정 결과 응답 예시
result=refined 조회 응답은 기본 전사 상태와 보정 상태를 함께 확인할 수 있도록 구성되어 있습니다.
기본 전사가 아직 진행 중이거나 실패한 경우에는 기본 전사 상태만 반환됩니다.
기본 전사가 완료된 뒤에는 refine_status로 보정 상태를 확인할 수 있습니다.
전사 결과 보정은 발화 시간과 화자 정보는 유지하면서, 오디오를 근거로 텍스트 오류를 교정합니다. 수정이 필요 없는 발화는 원문과 동일하게 반환될 수 있습니다.
| 기본 전사 결과 | 보정된 결과 |
|---|---|
| 상품 배송 일정 팔인하려고 연락드렸습니다. | 상품 배송 일정을 확인하려고 연락드렸습니다. |
| 확인 후 오늘 오후 세시에 다시 안내드리겠습니다. | 확인 후 오늘 오후 3시에 다시 안내드리겠습니다. |
| Name | Desc | Type | Value |
|---|---|---|---|
| status | 기본 전사 결과 상태 | string | transcribing, completed, failed |
| refine_status | 전사 결과 보정 상태 | string | queued, processing, completed, failed |
| refine_error.code | 전사 결과 보정 실패 코드 | string | refiner_enqueue_failed, refiner_input_unavailable, refiner_failed |
| results.utterances | 보정된 발화 정보 | array |
status: transcribing
기본 전사 작업이 아직 완료되지 않은 경우입니다.
{
"id": "{TRANSCRIBE_ID}",
"status": "transcribing"
}
status: failed
기본 전사 작업이 실패한 경우입니다.
{
"id": "{TRANSCRIBE_ID}",
"status": "failed",
"error": {
"code": "{ERROR_CODE}",
"message": "{MESSAGE}"
}
}
refine_status: queued / processing
기본 전사는 완료되었지만 보정 작업이 아직 완료되지 않은 경우입니다.
이 경우 results 없이 현재 보정 상태만 반환됩니다.
{
"id": "{TRANSCRIBE_ID}",
"status": "completed",
"refine_status": "processing"
}
refine_status: completed
{
"id": "{TRANSCRIBE_ID}",
"status": "completed",
"refine_status": "completed",
"results": {
"utterances": [
{
"start_at": 4737,
"duration": 2360,
"msg": "상품 배송 일정을 확인하려고 연락드렸습니다.",
"spk": 0,
"lang": "ko"
},
{
"start_at": 8197,
"duration": 3280,
"msg": "확인 후 오늘 오후 3시에 다시 안내드리겠습니다.",
"spk": 1,
"lang": "ko"
}
]
}
}
refine_status: failed
{
"id": "{TRANSCRIBE_ID}",
"status": "completed",
"refine_status": "failed",
"refine_error": {
"code": "refiner_failed"
}
}
제한 사항
use_refinement는use_multi_channel과 함께 사용할 수 없습니다.- 보정된 결과에는
utterances만 포함됩니다. - 보정된 결과는 기본 전사 결과보다 늦게 준비될 수 있습니다.