인터뷰 | 국회도서관 AI 서비스 시범구축팀

“외국법 번역기·AI 챗봇 직접 개발합니다”

2025-04-17 13:00:05 게재

도서관과 생성형 AI

사서와 정보기술직 협업 통해 맞춤형 서비스 구현 … “공통 언어 형성과 교육 중요”

국회도서관이 생성형 인공지능(AI) 서비스를 자체 개발해 관심을 모으고 있다. 최근 다양한 기관에서 생성형 AI 서비스를 하고 있지만 대체로 AI 기업의 기존 서비스를 도입하거나 자체 기획을 바탕으로 AI 기업에 외주를 맡기는 방식으로 운영한다. 이런 가운데 국회도서관은 자체 데이터를 오픈소스 거대언어모델(Large Language Model, LLM)에 학습시켜 국회도서관만의 생성형 AI 서비스를 개발했다. 15일 국회도서관 미디어스튜디오에서 AI 서비스 시범구축팀을 만났다.

“국회도서관은 1997년부터 전자도서관을 구축해 운영해온 선도기관입니다. 이를 기반으로 생성형 AI 도입을 고민하며 도서관의 데이터와 서비스 전문성을 바탕으로 이용자 맞춤형 서비스를 개발하고자 개발을 추진했습니다. 도서관이 AI 기술을 어디까지 개발할 수 있는지, 활용 가능한 자원이 무엇인지 파악하는 데에도 자체 개발이 필요하다고 판단했습니다.”

이날 만난 조정권 정보관리국장의 설명이다. 국회도서관 AI 서비스 시범구축팀은 총괄팀장인 박광희 정보기술개발과장을 포함해 사서직과 정보기술직 등 총 15명으로 구성됐다. 외국법률정보과 데이터융합분석과 등 다양한 부서의 직원들이 함께했다.

이들은 △국내외 주요 생성형 AI 서비스 사례 조사 △생성형 AI 서비스 기획 △생성형 AI 서비스 개발 등을 진행했다. 이 과정에서 별도의 예산과 장비 없이 자체 인력만으로 개발에 성공했다.

박 과장은 “기존 도서관 이용 안내 서비스는 정해진 시나리오에 따라 답변하는 수준이었는데 이번 개발을 통해 생성형 AI가 능동적으로 정보를 생성해 응답하는 단계까지 진화했다”며 “처음엔 개발이 가능할지 반신반의했지만 좋은 결과가 나오면서 새로운 시도를 해볼 수 있다는 자신감을 얻었다”고 말했다.

15일 국회도서관 미디어스튜디오에서 AI 서비스 시범구축팀을 만났다. 사진 왼쪽부터 조정권 정보관리국장, 박광희 정보기술개발과장, 서용원 주무관, 안준철 정보기술개발과 정보기술사무관 서동현 전자정보정책과 서기관, 박수인 데이터융합분석과 사서사무관. 사진 이의종

◆자체 구축 데이터 33만건 활용 = 국회도서관은 의원들의 입법을 지원하는 데 특화된 차관급 도서관으로 방대한 법률 및 정책 자료를 보유하고 있다. 의원 및 보좌관 교수 연구원 등의 외국 법률 정보에 대한 수요가 높아 외국 법률을 빠르게 번역해 제공해왔다. 이에 국회도서관은 생성형 AI 서비스를 처음 개발하는 데 있어 이용자의 수요가 높은 외국법 번역기를 개발하는 데 도전했다.

안준철 정보기술개발과 정보기술사무관은 “외국법을 번역하기 위해서는 예산을 들여 전문가 번역과 감수를 진행해야 했고 기간이 오래 걸리는 것은 물론 번역 가능한 분량도 예산 및 기간에 따라 제한적이었다”면서 “자체 보유한 외국법 번역 데이터를 활용해 생성형 AI 기반 자동 번역 서비스를 개발할 수 있을 것으로 판단했다”고 말했다.

이를 위해 국회도서관은 자체 구축한 외국법률번역 데이터베이스 내 외국법 조문 데이터를 활용했다. 생성형 AI가 학습할 데이터로 외국법 조문 데이터 33만533건을 선별했다. 이후 270억개의 파라미터(거대언어모델의 복잡성과 성능을 결정짓는 핵심 요소로 수가 많을수록 정교한 처리 가능)를 갖춘 고성능 모델인 구글의 오픈소스 거대언어모델 젬마 2(Gemma 2)를 기반으로 외국법 조문 데이터를 학습시켰다. 이 과정에서 로라(Low Rank Adaptation, LoRA, 거대언어모델을 효율적으로 미세조정) 기법을 적용해 학습 효율을 높였다. 정보기술직 직원 2명이 1달여 만에 개발에 성공했다.

국회도서관 AI 서비스 시범구축팀이 개발한 AI 챗봇. 사진 이의종

이날 시연에서 외국법 번역기는 법률 문서의 조문 구조와 형식을 최대한 유지하며 외국법을 자연스러운 한국어로 번역했다. 사용자는 외국 법령 파일을 업로드하기만 하면 몇분 안에 번역 결과를 받을 수 있다. 외국법 번역기는 6월부터 국회도서관 의회법률정보포털에 정식 탑재된다.

◆“시범구축팀, 조직 혁신으로” = 시범구축팀은 검색증강생성 기술(Retrieval-Augmented Generation, RAG)을 활용한 의미기반검색 서비스로 국회도서관 이용 안내 챗봇을 개발했다. 검색증강생성 기술은 AI가 학습된 정보 외 사용자 질의에 대해 정보를 검색해 답변을 하는 기술이다. 사용자의 질의 의도를 분석하고 관련 문서를 검색해 응답을 제공한다. △질의 분석 △의미 검색 △정보 조합 △자연어 생성에 이르는 일련의 과정을 개발한 사례다.

이날 시연에서 “국회도서관과 국회부산도서관(국회도서관 분관)의 차이는 뭐야?”라는 질의에 챗봇은 자연스럽게 국회도서관과 국회부산도서관을 비교하며 답변했다.

안 사무관은 “AI가 학습한 국회도서관 이용안내 문서에는 해당 내용이 없었지만 스스로 국회도서관과 국회부산도서관 자료를 찾아 비교한 뒤 답변을 생성했다”며 “향후 챗봇 개발을 외부에 맡기더라도 일정 수준 이상의 성능을 요구할 수 있도록 기술적 실현 가능성을 내부에서 먼저 점검하고자 했다”고 말했다.

이에 앞서 시범구축팀은 국내외 다양한 생성형 AI 서비스를 조사하고 국회도서관에 필요한 서비스를 기획했다. 서동현 전자정보정책과 서기관은 “국내 사례로 한국과학기술정보연구원(KISTI)의 AI 서비스 등을 조사했다”면서 “KISTI의 경우, 자체 개발 언어모델을 바탕으로 논문을 요약, 번역해 제공하고 있다”고 말했다.

또한 사서직들은 이용자 입장에서 다양한 서비스를 기획해 정보기술직과 협력했다. 박수인 데이터융합분석과 사서사무관은 “신간 도서를 선정하고 서평을 쓰는 업무에 생성형 AI를 활용하면 정확도를 높이고 시간을 단축할 수 있기에 관련 내용을 제안했다”며 “처음엔 새로운 기술이 낯설었지만 공부할 기회가 생겼고 기존 사서 업무에서 접하기 어려웠던 경험을 했다”고 말했다.

국회도서관은 향후 생성형 AI 도서관 서비스 확대를 위해 소통과 교육의 중요성을 강조했다. 정보기술직과 사서직 간 협업이 원활하게 이뤄지도록 하기 위해서다.

조 국장은 “AI 관련 공통 언어가 형성돼야 하며 이를 위해서는 AI 교육이 필요하다”며 “솔선수범해 AI 공부를 하고 있으며 직원 190여명이 이미 AI・빅데이터 교육을 이수했고 올해는 30여명이 AI 교육을 신청했다”고 말했다. 이어 “시범구축팀이 가능성과 혁신의 문을 열었고 이는 중장기적으로 조직 혁신으로 이어질 것”이라고 강조했다.

송현경 기자 funnysong@naeil.com

송현경 기자 기사 더보기