키워드 부스팅
keywords 파라미터는 특정 키워드에 대한 전사 정확도를 높이기 위해 사용됩니다. 이 파라미터에 리스트 형태로 단어를 지정하면, 해당 단어들이 포함된 음성 데이터에 대한 전사 결과가 개선될 수 있습니다.
현재 키워드 부스팅은 한글만 지원합니다.
Name | Type | Description | Example |
---|---|---|---|
keywords | array | 전사 정확도를 높일 키워드 리스트 | ["리턴제로", "음성인식", "에스티티"] |
caution
keywords
에 입력하는 단어는 한글 발음대로 적어야 합니다. <예시: STT (X), 에스티티 (O)>keywords
에 입력하는 단어는 한글만 구성되어야 하며 음절이어야 합니다. <예시: 에스TT (X), 에스ㅌㅌ (X), 에스티티2 (X), 에스티티 (O)>- 각 단어의 길이는 20자 이하로 제한되며, 단어의 개수는 최대 100개까지 지원합니다.
- 키워드 부스팅은
whisper
모델과 함께 사용할 수 없습니다.
사용법
- cURL
- Python
curl -X "POST" \
"https://openapi.vito.ai/v1/transcribe" \
-H "accept: application/json" \
-H "Authorization: Bearer ${YOUR_JWT_TOKEN}" \
-H "Content-Type: multipart/form-data" \
-F "file=@sample.wav" \
-F 'config={
"keywords": ["리턴제로", "음성인식", "에스티티"]
}'
import requests
config = {
"keywords": ["리턴제로", "음성인식", "에스티티"]
}
files = {'file': ('sample.wav', open('sample.wav', 'rb'))}
resp = requests.post(
'https://openapi.vito.ai/v1/transcribe',
headers={'Authorization': 'Bearer {YOUR_JWT_TOKEN}'},
files=files,
data={'config': json.dumps(config)}
)
resp.raise_for_status()
print(resp.json())
keywords를 넣었을 때의 응답 결과 개선 예시
전사 요청시 keywords
에 ["음성인식"]을 지정했을 때,
화자의 발음이 불분명해서 "리턴제로는 음성의식을 하는 회사입니다."라고 발음으로 전사한 경우 이를 "음성인식"으로 교정합니다.
{
"id": "G6j7wIYxSCCz3gYtQbeYdQ",
"status": "completed",
"results": {
"utterances": [
{
"start_at": 1187,
"duration": 600,
"spk": 0,
"spk_type": "NORMAL",
- "msg": "리턴제로는 음성의식을 하는 회사입니다."
+ "msg": "리턴제로는 음성인식을 하는 회사입니다."
}
]
}
}