서지데이터 분석으로 본 한국사회 80년 발자취

2025-10-14 13:00:01 게재

국립중앙도서관 80주년 기념

데이터에 시대 변화 드러나

국립중앙도서관은 14일 도서관 개관 80주년을 기념해 1945년부터 현재까지의 국립중앙도서관 데이터를 분석하고 그 결과를 발표했다.

1945년 10월 문을 연 국립중앙도서관은 지난 80년간 국내 출판물을 비롯한 각종 지식자원을 지속적으로 수집해왔다. 그 결과 약 1500만권의 도서·비도서와 2000만건의 온라인자료를 소장하게 됐다. 또한 시대변화 흐름에 발맞춰 9억여 건의 서지·원문데이터베이스(DB), 링크드 오픈 데이터(Linked Open Data)를 구축했다. 링크드 오픈 데이터란 개방형 데이터(Open Data)와 연결 데이터(Linked Data)의 합성어로, 웹에서의 연결을 통해 웹을 하나의 데이터베이스처럼 사용할 수 있도록 구조화된 형식으로 발행된 데이터를 의미한다.

국립중앙도서관은 도서관법에 의거, 도서관 자료를 납본받아 서지데이터를 구축한다. 80년간 축적한 데이터를 분석한 결과, 대한민국은 1945년~1980년대 고도성장기를 거쳐 1999~2000년대 정보화 사회로 진입했으며, 2010년대 이후 디지털 대전환 시대를 맞이한 것으로 나타났다.

1945년~1950년대에는 정치·법률·경제 등 국가 운영의 기초 분야 자료가 이 기간의 발행 장서 약 9500권 가운데 20%를 차지했다. 이는 해방 직후 국가 재건을 위한 지식 수요가 반영된 결과로 해석된다.

1960~70년대는 한국음악 발전과 함께 악보 수집이 크게 늘어났다(1945~1950년대 313권→1960~1970년대 3만1266권). 경제개발계획에 따른 산업화 추진으로 토목·환경 전기·전자 기계공학 분야 도서가 급증했다. 또한 한일국교정상화의 영향으로 일본문학이 13.8배 증가한 점이 눈에 띄었다.

1980년대 발행 장서량은 1970년대보다 7.3배 증가(1970년대 6만1402권→1980년대 45만637권)하며 가장 높은 상승세를 기록했다. 검열 완화와 제도 변화로 영화 관련 자료 수집이 늘어났고, 해외문학 번역이 본격화하면서 영미문학이 13.7배(1970년대 663권→1980년대 9105권) 증가했다. 또한 경제 고도성장기를 맞아 화학 전기·전자 기계공학 분야 도서도 비약적으로 많아졌다(1970년대 698권→1980년대 2만5897권).

1990~2000년대는 컴퓨터과학과 프로그래밍 책이 127.5배(1970~1980년대 599권→1990~2000년대 7만6414권) 급증하며 정보화 사회의 도래를 알렸다.

콘텐츠도 다양해져 만화책이 2001년 9394권으로 정점을 찍었다. 또한 아동서와 전집·총서 학습참고서 장서량이 폭발적으로 성장했다. 그중에서도 학습참고서는 1990년대 2734권에서 2000년대 2만4183권으로 88.4배나 급증했다. 아울러 영어 일본어 중국어 어학서가 많아졌고 일본문학책이 20배(1970~1980년대 5050권→1990~2000년대 10만1041권) 증가했다.

2010년대 이후에는 전자책과 오디오북 등 디지털 매체 확산으로, 도서·비도서 장서량이 처음으로 감소세를 보였다. 인공지능(AI) 빅데이터 딥러닝 블록체인 메타버스 등 디지털 대전환 시대에 필요한 각종 기술을 다룬 컴퓨터과학과 프로그래밍 도서는 꾸준히 증가하는 양상을 보였다.

지난 80년간 한국문학의 성장을 자세히 살펴보면, 한국문학은 케이(K)-문화 확산과 함께 지속적인 성장세를 보이고 있다. 1945년~1950년대에는 1482권에 불과했으나 1985년~1990년대 16만7496권으로 급상승, 2020년~2024년에 이르러서는 18만5237권으로 최고치를 기록했다.

김희섭 국립중앙도서관 관장은 “개관 80주년을 계기로 국립중앙도서관 서지데이터 분석으로 한국 사회가 걸어온 80년의 발자취를 확인할 수 있었다”며 “국립중앙도서관은 앞으로도 사회가 필요로 하는 지식정보를 적극 수집하고 제공하겠다”고 밝혔다.

송현경 기자 funnysong@naeil.com

송현경 기자 기사 더보기