Skip to main content

음성인식 모델

사용할 음성인식 모델을 설정하는 기능입니다. 제공하는 모델의 종류는 기본 모델인 sommers 와 리턴제로가 직접 파인튜닝한 OpenAPI의 whisper 가 있습니다.

특히 whisper 모델을 사용하는 경우 반드시 language 파라미터를 설정해야 합니다.

사용 가능한 언어는 총 100개로 언어별 파라미터는 해당 페이지에서 확인하실 수 있습니다.

자동으로 오디오의 언어를 감지하고 싶다면 음성인식 언어 페이지를 참고해주세요.

caution

기본 동시처리 제한은 2건이며, 사용량이나 요청에 따라 협의 후 조정해드립니다.
Whisper 모델 관련 사항은 아래 채널톡으로 문의해 주세요.

사용법

sommers


curl -X "POST" \
"https://openapi.vito.ai/v1/transcribe" \
-H "accept: application/json" \
-H "Authorization: Bearer ${YOUR_JWT_TOKEN}" \
-H "Content-Type: multipart/form-data" \
-F "file=@sample.wav" \
-F 'config={
"model_name": "sommers"
}'

whisper


curl -X "POST" \
"https://openapi.vito.ai/v1/transcribe" \
-H "accept: application/json" \
-H "Authorization: Bearer ${YOUR_JWT_TOKEN}" \
-H "Content-Type: multipart/form-data" \
-F "file=@sample.wav" \
-F 'config={
"model_name": "whisper",
"language": "ko"
}'