화자 분리

화자 분리는 일반 STT API에서 2명 이상의 화자를 구분하여 누가, 언제, 어떤 이야기를 했는지 식별하는 기능입니다. 이 문서는 화자 분리 기능의 설정 방법을 안내합니다.

화자 분리 기능을 사용하기 위해서는 API 요청 시 use_diarization 파라미터를 true 로 설정해야 합니다.
(파라미터 기본값은 false 입니다.)

use_diarization 파라미터를 true로 설정하지 않는 경우 diarization 파라미터를 설정할 수 없습니다.

발화에 참여한 화자수를 알고 있는 경우에 spk_count 파라미터를 설정할 수 있습니다. (ex. 전화 통화의 경우 2로 설정)

spk_count 를 설정하지 않는 경우 화자수를 예측하여 화자분리를 수행합니다.

주의

다중 채널 지원을 사용할 경우 화자 분리 기능은 동작하지 않습니다. 채널 개수에 따라 spk 필드에 각 채널의 ID 값을 순차적으로 지정하여 내려줍니다.

사용법

요청 바디에 use_diarization 파라미터를 true로 설정하고 diarization 파라미터를 설정합니다.

POST 요청 예제: 샘플 코드

전체 예제: 샘플 코드