서강대 연구팀, ICML 2026 논문 채택
입력·출력 주파수 분리한 음성 복원 AI 제안
열악한 음성 환경에서도 원하는 품질로 복원
국내 대학 연구팀이 다양한 샘플링 주파수 환경에서 음성을 복원할 수 있는 인공지능(AI) 기반 음성 복원 기술을 개발해 세계 최고 권위의 학회에서 연구 성과를 발표한다.
서강대학교는 전자공학과 박형민 교수 연구팀 논문이 ‘국제 머신러닝 학회(ICML 2026)’에 채택됐다고 10일 밝혔다.
연구팀은 잡음과 반향, 대역 제한, 디지털 왜곡 등으로 품질이 저하된 음성을 복원하는 새로운 딥러닝 네트워크 구조를 제안했다.
기존 음성 복원 기술은 대부분 입력과 출력의 샘플링 주파수가 고정된 환경을 전제로 설계돼 활용 범위에 한계가 있었다. 서로 다른 주파수 환경에서는 추가 변환 과정이 필요하거나 복원 성능이 떨어지는 문제가 있었다.
연구팀은 입력 음성의 대역 정보를 분석하는 인코더와 출력 음성을 복원하는 디코더 기능을 분리한 비대칭 구조를 도입했다. 이를 통해 다양한 입력 샘플링 주파수의 음성을 처리하면서도 사용자가 원하는 출력 주파수로 복원할 수 있도록 설계했다.
연구팀은 이 구조가 열악한 녹음 환경에서도 보다 유연한 음성 복원을 가능하게 한다고 설명했다. 향후 음성 통신과 영상회의, 보청기, 음성 기반 AI 서비스 등 다양한 분야에 적용 가능성이 있다는 평가다.
ICML은 인공지능(AI)·기계학습 분야 세계 최고 수준 학회 가운데 하나로 꼽힌다. 기계학습 이론과 딥러닝, 강화학습 등 핵심 연구 성과가 발표되는 국제 학술대회다.
ICML 2026은 7월 6일부터 11일까지 서울 코엑스에서 열린다.
이번 연구는 신의협 박사가 주도했으며 고재현 박사과정, 정우철 석사과정이 공동 참여했다.