스트리밍 STT - gRPC
본 문서는 스트리밍 STT 중에서 gRPC로 구현하는 방식에 대한 가이드를 제공합니다.
연동 예제
본 문서의 예제는 로컬 오디오 파일로부터 스트리밍 음성인식을 수행하는 방법을 설명합니다. 마이크와 같은 스트리밍 입력 장치로 API를 이용하고 싶은 경우, 파일로 읽어오는 코드 부분을 장치로부터 입력을 받는 코드로 변경하여 사용하실 수 있습니다. gRPC 연동을 위한 proto 파일을 확인할 수 있습니다.
인증 토큰 발급
스트리밍 STT API를 사용하기 위해서는 인증 토큰 발급 가이드를 통해 토큰을 발급받아야 합니다.
DecoderConfig
gRPC 연동 시 사용되는 DecoderConfig 에 대한 상세 정보는 공통 DecoderConfig/Parameter 정보에서 확인할 수 있습니다.
StreamingRecognitionResult
{
// 스트리밍 시작 기준 문장의 발화 시점 (단위: msec)
start_at: integer
// final이 true인 경우 문자의 발화 시간, final이 false인 경우 0 (단위: msec)
duration: integer
// 문장의 종료 여부
is_final: bool
// 대체 텍스트, 첫 번째 값이 정확도가 가장 높은 결과
alternatives: [
SpeechRecognitionAlternative {
// 문장의 텍스트
text: string
// 문장의 정확도 (beta)
confidence: float
// 단어의 정보, is_final이 true인 경우에만 제공
words?: [
WordInfo {
text: string
// 문장의 시작 기준 단어의 발화 시점 (단위: msec)
start_at: integer
// 발화 시간 (단위: msec)
duration: integer
// 정확도 (미지원)
confidence: float
}
]
}
]
}