국립중앙도서관, 고품질 학습데이터 구축

2026-02-05 13:00:37 게재

국립중앙도서관은 인공지능(AI) 기술 기반으로 국가 지식정보 서비스를 혁신하고 미래형 도서관으로 도약하기 위한 ‘2026년 주요업무 추진계획’을 4일 발표했다.

핵심 과제는 인공지능 산업의 토대가 되는 고품질 학습 데이터 구축과 개방이다. 국립중앙도서관은 저작권이 소멸되거나 해결된 자료를 중심으로 인공지능 학습용 텍스트 데이터를 구축해 과학기술정보통신부의 ‘독자 인공지능 파운데이션 모델 프로젝트’에 제공할 계획이다. 독자 인공지능 파운데이션 모델이란 국내 기술과 자원을 활용해 학습, 운영되는 범용 인공지능 모델을 말한다. 또한 도서관 누리집 내 ‘공유서재’를 개설해 구축된 데이터를 국민에게 개방, 공유한다.

이와 함께 국가지식자원을 전략적으로 확충한다. 도서 비도서 등 인쇄자료 33만여책(점), 전자책 케이-콘텐츠 등 디지털자료 40만여건의 포괄적 수집을 목표로 한다. 국제행사 회의자료 등 비정형 출판물을 발굴하고 해외한국관련 자료를 모으기 위해 영국 독일 등으로 고문헌 조사 대상국을 확대한다. 미국 국립문서기록관리청(NARA)이 소장한 한국 관련 기록자료 8만8000여면을 확보한다.

국민 누구나 인공지능 기술의 혜택을 보편적으로 누릴 수 있도록 인공지능 리터러시 교육을 대폭 확대한다. 관련 과정을 늘리고, 단계별 맞춤 교육과 창작 교육 등 과정을 세분화한다. 특히 인공지능 디지털윤리체험관 설치 등 신기술과 독서를 융합한 체험형 프로그램을 다양하게 운영한다.

연구자와 창작자를 위한 맞춤형 지원도 강화한다. 학술 연구자들이 인공지능 모델과 데이터를 활용할 수 있도록 관련 교육과정을 운영하고 케이-콘텐츠 창작자를 위한 연구지원 프로그램을 운영한다. 이와 함께 국립중앙도서관은 8월 부산에서 열리는 ‘2026 세계도서관정보대회(WLIC)’와 연계해 국립도서관장회의를 주관한다.

김희섭 국립중앙도서관 관장은 “올해는 인공지능 기술을 도서관 서비스 전반에 적용하고 미래 도서관의 방향을 제시하는 중요한 한해가 될 것”이라며 “국가대표도서관으로 국가지식정보의 보고 역할을 충실히 수행하는 동시에 인공지능 대전환 시대를 선도하는 혁신 기관으로 거듭나 모든 국민이 지식과 문화를 마음껏 향유 할 수 있도록 최선을 다하겠다”고 말했다.

송현경 기자 funnysong@naeil.com

송현경 기자 기사 더보기