숭실대, 인공지능 음성복제 차단 기술 개발
보이스피싱·가짜음성 범죄 대응 기술 공개
세계 최고 권위 음성학회 ICASSP 2026 채택
극내 대학 연구진이 인공지능(AI)의 음성 복제를 사전에 차단하는 기술을 개발했다. 보이스피싱과 금융사기, 가짜뉴스 등 인공지능 기반 음성 위·변조 범죄 대응 기술로 활용 가능성이 제시된다.
숭실대는 AI안전성연구센터 최대선 교수 연구팀이 개인 음성이 무단 복제되는 것을 막는 인공지능 음성 보호 기술 ‘RoCo(Robust Code)’를 개발했다고 10일 밝혔다.
이번 연구는 음성·신호처리 분야 세계 최고 권위 학회인 ‘ICASSP 2026(IEEE 국제음향·음성·신호처리학회)’에 채택됐으며, 스페인 바르셀로나에서 열리는 학회에서 공개될 예정이다.
RoCo는 사용자 음성에 사전 보호 처리를 적용해 AI가 음성 특징을 정확히 학습하지 못하도록 설계된 기술이다. 사람이 듣기에는 자연스럽지만 AI가 복제하려 할 경우 다른 음성으로 변환되도록 하는 방식이다.
기존 음성 복제 방지 기술은 사람이 인지하기 어려운 잡음을 추가해 인공지능 학습을 방해하는 방식이 주로 사용됐다. 하지만 처리 시간이 길고 최신 잡음 제거 기술에 의해 방어 효과가 약화되는 한계가 있었다.
연구팀은 인공지능이 음성을 분석하는 내부 단계에 보호 신호를 삽입하는 방식을 적용해 이러한 문제를 개선했다고 설명했다.
그 결과 잡음 제거를 통한 방어 무력화 시도에서도 성능이 유지됐다. 처리 시간은 평균 15초 수준으로 기존 대비 5~10배 빨라졌다고 밝혔다.
최 교수는 “가짜 음성을 사후 탐지하는 수준을 넘어 생성 자체를 차단하는 기술 기반을 마련했다는 점에서 의미가 있다”고 말했다.
숭실대 AI안전성연구센터는 딥페이크와 생성형 인공지능, 멀티모달 인공지능 등 인공지능 안전성 분야 연구를 수행하는 국내 민간 연구센터다.