음성인식 모델

사용할 음성인식 모델을 설정하는 기능입니다. 제공하는 모델의 종류는 기본 모델인 sommers와 리턴제로가 직접 파인튜닝한 OpenAI의 whisper가 있습니다.

Sommers 모델

sommers 모델은 리턴제로에서 개발한 음성인식 모델입니다. 빠른 응답 속도와 높은 정확도를 제공하며, 다양한 도메인에서 우수한 성능을 보입니다.

sommers 모델이 지원하는 언어는 한국어(ko)와 일본어(ja)이며, language 파라미터를 통해 설정할 수 있습니다.

language 파라미터를 설정하지 않으면 기본값인 ko(한국어)로 처리됩니다.

리턴제로에서는 OpenAI Whisper의 한국어 성능을 개선하기 위해 자체적으로 파인튜닝한 모델을 제공합니다.

whisper 모델을 사용할 때는 반드시 language 파라미터를 설정해야 합니다.

지원하는 언어는 총 100개이며, 언어별 파라미터는 OpenAI Whisper 공식 문서에서 확인할 수 있습니다.

오디오의 언어를 자동으로 감지하려면 음성인식 언어 설정 가이드를 참고하세요.

주의

기본 동시처리 제한은 2건이며, 사용량이나 요청에 따라 협의 후 조정해드립니다.
Whisper 모델 관련 사항은 아래 채널톡으로 문의해 주세요.

요청 바디에 model_name 파라미터를 설정합니다.