개인정보 필터
개인정보 필터는 텍스트에서 개인정보를 감지하여 별표(*
)로 자동 변환하는 기능입니다.
개인정보 필터 기능을 사용하기 위해서는, "enterprise" 라이선스 계약이 필요합니다. 아래 바로가기를 통해 문의해주세요.
구축형(On-premise) 혹은 Enterprise 기능 문의 바로가기
지원하는 개인정보 유형
- 이름
- 주소
- 개인식별번호
- 전화번호
- 주민등록번호
- 여권번호
- 계좌번호
- 카드번호
- 운전면허번호
- 차량번호
또한 preset 파라미터를 통해, 사용 환경에 맞게 개인정보 필터링 형태를 지정할 수 있습니다.
all
(기본)- 입력 텍스트가 존재하는 형태 그대로 보존하고, 개인정보에 해당하는 글자만
*
로 변환합니다.
- 입력 텍스트가 존재하는 형태 그대로 보존하고, 개인정보에 해당하는 글자만
finance
(금융 도메인)- 생년월일이 아닌 8자리 숫자를 복원합니다.
- 인증번호를 필터링하지 않기 위한 기능입니다.
- 주민등록번호 마스킹된 결과에서 생년월일과 성별에 해당하는 숫자를 복원하고 하이픈을 추가합니다.
- 전화번호 마스킹된 결과에 하이픈을 추가합니다.
- 15~16자리 카드번호를 검증하여, 성공하면 하이픈을 추가하여 마스킹하고 실패하면 완전 복원합니다.
- 개인식별번호 중 15~16자리 숫자는 카드번호로 간주하여 검증하며, 실패 시 개인정보가 아닌 것으로 판단하여 복원합니다.
- 생년월일이 아닌 8자리 숫자를 복원합니다.
사용 예시
-
all
원문 필터 적용 후 "010-666-0098로 전화해 건조기 렌탈을 하니 사은품으로 방향제를 줬다." "************로 전화해 건조기 렌탈을 하니 사은품으로 방향제를 줬다." "김남길 배우님하고 찍은 무뢰한이라는 작품을 보고" "*** 배우님하고 찍은 무뢰한이라는 작품을 보고" "지난달에 갔던 레스토랑 주소가 무명시 무명로11번길 1층 무명레스토랑 맞지?" "지난달에 갔던 레스토랑 주소가 *** ******* ** ****** 맞지?" "이 분 주민번호 010203에 4567890입니다." "이 분 주민번호 ******* *******입니다." "카드번호는 9908105325960905입니다." "카드번호는 ****************입니다." "잘못된 카드번호 1234567890123456입니다." "잘못된 카드번호 ****************입니다." -
finance
원문 필터 적용 후 "010-666-0098로 전화해 건조기 렌탈을 하니 사은품으로 방향제를 줬다." "***-***-****로 전화해 건조기 렌탈을 하니 사은품으로 방향제를 줬다." "김남길 배우님하고 찍은 무뢰한이라는 작품을 보고" "*** 배우님하고 찍은 무뢰한이라는 작품을 보고" "지난달에 갔던 레스토랑 주소가 무명시 무명로11번길 1층 무명레스토랑 맞지?" "지난달에 갔던 레스토랑 주소가 *** ******* ** ****** 맞지?" "이 분 주민번호 010203에 4567890입니다." "이 분 주민번호 010203-4******입니다." "카드번호는 9908105325960905입니다." "카드번호는 ****-****-****-****입니다." "잘못된 카드번호 1234567890123456입니다." "잘못된 카드번호 1234567890123456입니다."
설정 방법
API 요청 시 use_pii
파라미터를 true
로 설정하세요.
그리고 pii_preset
파라미터를 통해 preset을 설정할 수 있습니다.
all
(default)finance
사용법
요청 바디에 use_pii
파라미터를 true
로 설정하고 pii_preset
파라미터를 설정합니다.
POST 요청 예제: 일반 STT 샘플 코드
전체 예제: 일반 STT 샘플 코드