산업 ICT

보이스피싱범 목소리까지 찾아낸다

2025-07-29 13:00:01 게재

KT 탐지서비스2.0 출시

95% 이상 정확도 목표

범죄자 목소리를 구별해 보이스피싱 여부를 판별하는 서비스가 나왔다.

KT는 30일부터 국내 최초로 ‘화자인식’과 ‘딥보이스(인공지능(AI) 변조 음성) 탐지’ 기능을 통합한 실시간 ‘AI 보이스피싱 탐지서비스 2.0’을 상용화한다고 29일 밝혔다. 이번 고도화된 서비스는 기존 문맥 기반 탐지 기술에 더해 범죄자의 실제 음성을 인식하고 AI로 변조된 음성까지 식별할 수 있도록 AI 보안 역량을 강화한 것이 핵심이다.

KT는 2024년 10월 과학기술정보통신부로부터 ICT규제샌드박스 실증특례 사업자로 선정돼 AI 기반 보이스피싱 탐지 기술을 개발해 왔다.

특히 화자인식 기능은 개인정보보호위원회의 엄격한 규제점검과 승인을 거쳐 국내 최초로 상용화에 성공한 기술이다.

화자인식은 국립과학수사연구원이 제공한 보이스피싱 범죄자의 실제 신고 음성 일명 ‘그놈목소리’ 데이터를 기반으로 성문정보를 정밀 분석해 범죄 여부를 탐지한다. 이는 기존의 금융 키워드나 문장 구조 기반 탐지에서 한 단계 진일보한 방식으로 탐지 정확도를 크게 높였다. 국립과학수사연구원은 KT에 신뢰도 높은 데이터를 제공하기 위해 10개월간 그놈목소리 데이터를 전수조사하고 정제하는 등 많은 노력과 자원을 투입해 보이스피싱 예방 효과에도 기여했다.

이처럼 화자인식 기능의 도입은 개인정보 보호 기준이 엄격한 국내 통신 환경에서 쉽지 않은 과제였지만 제도적 검토와 기술적 신뢰성 확보를 통해 가능해졌다.

KT는 AI 음성합성(TTS) 기술로 생성된 변조 음성을 판별하는 ‘딥보이스 탐지’ 기능도 함께 제공한다. 이 기술은 지난 2024년 5월 건강보험공단 고객센터에 국내 공공기관 최초로 적용된 ‘AI 목소리 인증’ 서비스에서 이미 검증된 바 있다.

한편 2025년 상반기 동안 KT의 AI 보이스피싱 탐지서비스는 약 ,460만건의 통화 트래픽을 분석해 91.6%의 탐지 정확도를 기록했다.

이는 약 710억원의 피해를 예방한 것으로 추산된다. KT는 이번 2.0 버전 출시를 통해 연간 2000억원 이상의 피해 예방과 95% 이상의 탐지 정확도 달성을 목표로 하고 있다.

고성수 기자 ssgo@naeil.com

고성수 기자 기사 더보기