본문으로 건너뛰기

음성인식 모델

사용할 음성인식 모델을 설정하는 기능입니다. 제공하는 모델의 종류는 기본 모델인 sommers와 리턴제로가 직접 파인튜닝한 OpenAI의 whisper가 있습니다.

Sommers 모델

sommers 모델은 리턴제로에서 개발한 음성인식 모델입니다. 빠른 응답 속도와 높은 정확도를 제공하며, 다양한 도메인에서 우수한 성능을 보입니다.

sommers 모델이 지원하는 언어는 한국어(ko)와 일본어(ja)이며, language 파라미터를 통해 설정할 수 있습니다.

language 파라미터를 설정하지 않으면 기본값인 ko(한국어)로 처리됩니다.

Whisper 모델

리턴제로에서는 OpenAI Whisper의 한국어 성능을 개선하기 위해 자체적으로 파인튜닝한 모델을 제공합니다.

whisper 모델을 사용할 때는 반드시 language 파라미터를 설정해야 합니다.

지원하는 언어는 총 100개이며, 언어별 파라미터는 OpenAI Whisper 공식 문서에서 확인할 수 있습니다.

오디오의 언어를 자동으로 감지하려면 음성인식 언어 설정 가이드를 참고하세요.

주의

기본 동시처리 제한은 2건이며, 사용량이나 요청에 따라 협의 후 조정해드립니다.
Whisper 모델 관련 사항은 아래 채널톡으로 문의해 주세요.

사용법

요청 바디model_name 파라미터를 설정합니다.

POST 요청 예제: 일반 STT 샘플 코드

전체 예제: 일반 STT 샘플 코드