간투어 필터
간투어 필터는 발화에서 큰 의미가 없는 표현을 제거하여 보다 간결한 텍스트를 제공하는 기능입니다. 본 문서는 간투어 필터를 이용하기 위한 설정 가이드를 제공합니다.
간투어에 해당하는 예시는 다음과 같습니다. 간투어를 제거 했을 때, 문장의 가독성이 더욱 좋아지는 것을 확인하실 수 있습니다.
음
,뭐
,아
와 같이 발화 중간에 큰 의미 없이 머뭇거리는 표현 예)아 아직 일층이요 뭐 그래 지금 갈게 뭐 가져왔어
->아직 일층이요 그래 지금 갈게 뭐 가져왔어
- 중복 발화 표현
예)
응응응 우 우 우리 번호 우리 번호가 일 일 사 사 번인가
->응 우리 번호가 일 일 사 사 번인가
간투어 필터 기능을 사용하기 위해서는, API 요청 시에 use_disfluency_filter
파라미터를 true
로 설정해야 합니다.
(파라미터 기본값은 true
입니다.)
사용법
아래의 코드 샘플에서 간투어 필터를 사용하는 방법을 확인하실 수 있습니다.
curl -X "POST" \
"https://openapi.vito.ai/v1/transcribe" \
-H "accept: application/json" \
-H "Authorization: Bearer ${YOUR_JWT_TOKEN}" \
-H "Content-Type: multipart/form-data" \
-F "file=@sample.wav" \
-F 'config={
"use_disfluency_filter": true
}'