Skip to main content

음성인식 모델

사용할 음성인식 모델을 설정하는 기능입니다. 제공하는 모델의 종류는 기본 모델인 sommers 와 리턴제로가 직접 파인튜닝한 OpenAPI의 whisper 가 있습니다.

특히 whisper 모델을 사용하는 경우 반드시 language 파라미터를 설정해야 합니다.

사용 가능한 언어는 총 100개로 언어별 파라미터는 해당 페이지에서 확인하실 수 있습니다.

caution

현재 whisper 모델은 일부 기업 고객들에게만 한정해서 제공해드리고 있습니다.
whisper 모델이 필요하신 경우, 아래 채널톡으로 문의주시기 바랍니다.

사용법

sommers


curl -X "POST" \
"https://openapi.vito.ai/v1/transcribe" \
-H "accept: application/json" \
-H "Authorization: Bearer ${YOUR_JWT_TOKEN}" \
-H "Content-Type: multipart/form-data" \
-F "file=@sample.wav" \
-F 'config={
"model_name": "sommers"
}'

whisper


curl -X "POST" \
"https://openapi.vito.ai/v1/transcribe" \
-H "accept: application/json" \
-H "Authorization: Bearer ${YOUR_JWT_TOKEN}" \
-H "Content-Type: multipart/form-data" \
-F "file=@sample.wav" \
-F 'config={
"model_name": "whisper",
"language": "ko"
}'