고려대, 기밀 유출 막는 생성형 인공지능 기술 개발
ACL 2026 채택 … 한국어 특화 대규모언어모델에도 적용 추진
고려대학교(총장 김동원) 연구팀이 대규모언어모델(LLM) 학습·추론 과정에서 민감 정보 노출 위험을 줄일 수 있는 프라이버시 보존형 생성형 인공지능(AI) 기술을 개발했다.
고려대 컴퓨터학과 임희석 교수가 이끄는 NLP&AI 연구실은 ‘프라이버시 보존형 파인튜닝 기술(PPFT·Privacy Preserving Fine Tuning)’을 개발했다고 25일 밝혔다.
최근 생성형 인공지능 활용이 확대되면서 공공기관과 기업들은 내부 기밀과 고객 정보 유출 우려로 도입에 신중한 모습을 보여왔다. 이번 기술은 사용자의 민감한 프롬프트와 학습 지시문을 서버에 평문 형태로 노출하지 않는 데 초점을 맞췄다.
연구팀은 원문 텍스트를 그대로 전달하는 대신 인공지능만 이해할 수 있는 복잡한 숫자 배열 형태로 변환하는 방식을 적용했다. 이렇게 변환된 정보를 기반으로 대규모언어모델이 학습과 추론을 수행하도록 설계했다.
고려대측은 이 기술을 활용하면 공공기관과 기업이 정보 유출 위험 없이 자체 특화 대규모언어모델을 개발·운영할 수 있다고 설명했다. 서버 해킹이나 시스템 유출 사고가 발생하더라도 민감 정보 노출 가능성을 크게 낮출 수 있다는 것이다.
NLP&AI 연구실은 앞서 한국어 특화 대규모언어모델인 ‘KULLM3’를 개발했으며, 후속 모델인 ‘KULLM4’에도 이번 기술을 적용할 계획이다.
임희석 교수는 “생성형 인공지능 시대 핵심 경쟁력은 단순히 큰 모델을 만드는 데만 있는 것이 아니라 얼마나 신뢰할 수 있는 방식으로 학습·활용할 수 있느냐에 달려 있다”며 “이번 연구는 한국형 대규모언어모델 연구가 성능 경쟁을 넘어 프라이버시와 신뢰 문제까지 본격적으로 다루기 시작했다는 점에서 의미가 크다”고 말했다.
이번 연구 성과는 오는 7월 미국 샌디에이고에서 열리는 자연어처리 분야 최고 권위 학술대회인 ‘ACL 2026’ 메인 컨퍼런스에 채택됐다.
고려대 NLP&AI 연구실은 이번 ACL 2026에서 총 12편의 논문이 채택됐다.
이번 연구는 과학기술정보통신부 재원으로 과학기술사업화진흥원, 정보통신기획평가원(IITP), AI스타펠로우십지원사업 지원을 받아 수행됐다.