세종대 구영현 교수 연구팀, ICLR 2026 논문 채택
2026-02-18 21:35:11 게재
Mamba 기반 멀티모달 LLM 효율 향상 기법 제안
세종대 인공지능데이터사이언스학과 구영현 교수 연구팀 논문이 인공지능 국제학술대회 ICLR 2026에 채택됐다.
13일 세종대에 따르면 ICLR은 딥러닝 분야 주요 학술대회로 오는 4월 브라질에서 열린다.
연구팀은 Mamba 기반 멀티모달 거대언어모델의 추론 효율을 높이는 토큰 프루닝 기법을 제안했다. 기존 트랜스포머 모델의 어텐션 기반 중요도 추정과 달리 Mamba 핵심 파라미터인 델타 값을 활용해 불필요한 시각 토큰을 제거하는 방식이다.
두 단계 프루닝 전략을 적용해 초기 레이어에서는 핵심 정보를 유지하고 후기 레이어에서는 연산 요소를 제거했다. 그 결과 연산량을 최대 50% 줄이고 프리필 지연 시간을 35% 이상 단축하면서 성능을 유지했다.
세종대는 이번 연구가 대형 인공지능 모델 경량화와 실용화에 기여할 것으로 기대하고 있다.
장세풍 기자
spjang@naeil.com
장세풍 기자 기사 더보기