고려대, 인공지능 성능 좌우하는 ‘사전학습’ 중요성 규명

2026-03-15 10:21:01 게재

김동현 교수 연구팀, 도메인 전이 성능 핵심 변수 확인

고려대학교는 인공지능학과 김동현 교수 연구팀이 인공지능(AI) 모델의 도메인 전이 성능에서 사전학습(pre-training)이 핵심적인 역할을 한다는 사실을 체계적으로 분석했다고 15일 밝혔다.

도메인 전이는 특정 환경에서 학습한 AI 모델이 다른 환경에서도 성능을 유지하도록 하는 기술이다. 실제 환경에서는 학습 데이터와 다른 조건이 나타나는 경우가 많아 AI 성능이 저하되는 ‘도메인 변화’ 문제가 발생한다.

이를 해결하기 위해 환경 차이를 보정하는 다양한 도메인 적응 알고리즘이 개발돼 왔다. 하지만 기존 연구는 오래된 사전학습 모델을 기반으로 실험이 진행돼 최신 사전학습 기술의 영향을 충분히 반영하지 못했다는 한계가 있었다.

연구팀은 최신 신경망 구조와 대규모 사전학습 데이터셋을 활용해 광범위한 실험을 진행했다. 그 결과 사전학습 방식의 차이가 도메인 전이 성능에 큰 영향을 미친다는 사실을 확인했다.

특히 어떤 사전학습 모델을 사용하느냐에 따라 적응 기법의 성능 평가 결과가 달라졌으며, 기존 연구에서 우수하다고 평가된 알고리즘의 성능 순위가 최신 사전학습 환경에서는 달라질 수 있다는 점을 밝혔다.

연구팀은 또 사전학습 데이터의 단순한 규모보다 데이터에 포함된 범주의 다양성과 실제 적용 과제와의 유사성이 성능 향상에 더 중요한 요소라는 점도 확인했다. 이는 데이터 양을 늘리는 것보다 실제 활용 분야와 유사한 범주의 데이터를 포함하는 것이 도메인 전이 성능 개선에 더 효과적일 수 있음을 의미한다.

이와 함께 연구팀은 웹 기반 대규모 사전학습 데이터에서 발생할 수 있는 데이터 누수 가능성도 분석했다. 분석 결과 데이터 누수가 도메인 전이 성능 향상에 미치는 영향은 제한적인 것으로 나타났다.

연구팀은 이번 연구가 AI 도메인 전이 분야에서 사전학습 단계의 중요성을 정량적으로 분석하고 향후 연구 방향을 제시했다는 점에서 의미가 있다고 설명했다. 연구 결과는 자율주행과 의료 영상 분석, 산업 자동화 등 다양한 분야에서 안정적인 AI 시스템 개발에 기여할 것으로 기대된다.

김동현 교수는 “AI 모델의 일반화 성능을 이해하려면 사전학습 단계에 대한 체계적인 분석이 필수적”이라며 “도메인 전이 연구의 평가 기준을 사전학습 중심으로 확장하는 계기가 될 것”이라고 말했다.

이번 연구는 과학기술정보통신부와 한국연구재단의 지원을 받아 수행됐다. 연구 결과는 컴퓨터 비전 분야 국제학술지 ‘International Journal of Computer Vision(IJCV)’에 1월 9일 온라인 게재됐다.

장세풍 기자 spjang@naeil.com
장세풍 기자 기사 더보기