서울시립대, 인공지능으로 복잡한 정규표현식 자동 생성

2026-05-31 17:06:17 게재

고상기 교수팀, 적은 연산으로 높은 정확도 구현

서울시립대학교 인공지능학과 고상기 교수 연구팀이 복잡한 정규표현식을 자동으로 생성하는 인공지능(AI) 기술을 개발해 세계적 권위의 국제학술대회에서 연구 성과를 인정받았다.

서울시립대는 인공지능학과 석사과정 김성민씨가 참여한 논문 ‘RESYN: A Generalized Recursive Regular Expression Synthesis Framework’가 인공지능 분야 최고 권위 학술대회 가운데 하나인 ‘국제인공지능공동학술대회(IJCAI) 2026’ 발표 논문으로 채택됐다고 밝혔다.

이번 연구는 예시 데이터만으로 정규표현식을 자동 생성하는 ‘예제로부터의 프로그램 생성(PBE·Programming by Example)’ 문제를 다뤘다. 정규표현식은 검색, 데이터 처리, 소프트웨어 개발 등에서 특정 문자 패턴을 정의하는 데 사용되는 핵심 기술이다.

기존 연구들은 상대적으로 단순한 실험용 데이터에 의존해 실제 환경에서 사용되는 복잡한 정규표현식을 충분히 반영하지 못한다는 한계가 있었다. 연구팀은 실제 정규표현식 데이터의 구조적 복잡성을 분석하고 이를 해결할 수 있는 새로운 인공지능 합성 체계인 ‘RESYN’을 제안했다.

연구팀은 문제를 단계적으로 분해해 해결하는 재귀적 분할정복 방식과 입력 예제 순서가 바뀌어도 동일한 결과를 도출하는 경량 신경망 모델 ‘SET2REGEX’를 개발했다. 이를 통해 기존 대규모 모델보다 적은 규모의 매개변수만으로도 높은 성능을 구현했다.

실험 결과 RESYN은 실제 복잡한 데이터셋에서 기존 정규표현식 합성 기법은 물론 범용 대규모 언어모델보다 우수한 성능을 보인 것으로 나타났다.

이번 연구에는 고상기 교수와 김성민씨, 연세대 한요섭 교수 연구진이 공동 저자로 참여했다.

연구팀은 이번 기술이 정규표현식 자동 생성에 그치지 않고 복잡한 구조를 갖는 다양한 프로그램 합성과 인공지능 문제 해결 분야에도 활용될 수 있을 것으로 기대하고 있다.

장세풍 기자 spjang@naeil.com
장세풍 기자 기사 더보기