공공저작물 인공지능 학습 활용 길 열린다
‘공공누리 제0유형·인공지능유형’ 신설
정부가 공공저작물을 인공지능(AI) 학습에 보다 자유롭게 활용할 수 있도록 공공누리 이용 기준을 개편한다. 조건 없이 사용할 수 있는 ‘제0유형’과 인공지능 학습 목적에 한해 활용을 허용하는 ‘인공지능유형’이 도입된다. 문화체육관광부는 과학기술정보통신부와 함께 28일 열린 제4차 과학기술관계장관회의에서 ‘공공저작물 인공지능 학습 활용 확대 방안’을 발표하고 공공저작물 자유이용 허락표시 기준인 공공누리를 개정했다고 밝혔다.
공공저작물은 국가와 지방자치단체 공공기관이 보유한 저작물로 신뢰도가 높고 규모가 방대해 인공지능 학습 데이터의 핵심 자원으로 꼽힌다. 그러나 기존 공공누리 체계에서는 출처 표시 의무 등 이용 조건이 명확하지 않아 인공지능 학습에 활용해도 되는지 혼선이 있다는 지적이 제기돼 왔다.
이번 개편에서는 공공누리 ‘제0유형’이 신설된다. 제0유형으로 표시된 공공저작물은 출처 표시 의무 없이 상업적 이용과 변경 이용이 모두 가능해 대규모 데이터 처리가 필요한 인공지능 학습 환경에 적합하다.
이와 함께 인공지능 학습에 한해 자유롭게 활용할 수 있도록 하는 ‘인공지능유형’이 도입된다. 기존 공공누리 제1~4유형은 유지된다.
인공지능유형이 병행 표시된 공공저작물은 기존에는 상업적 이용이나 변경이 제한됐더라도 인공지능 학습 목적이라면 자유롭게 활용할 수 있다. 다만 공공저작물과 동일하거나 실질적으로 유사한 산출물이 생성되지 않도록 기술적 조치를 해야 하며 산출물이 원 저작물을 직접 인용하는 경우 출처 표시가 필요하다. 공공저작물을 활용해 제작한 인공지능 학습용 데이터의 재판매는 금지된다.
문체부와 과기정통부는 각 부처와 공공기관의 공공누리 표시 현황을 점검하고 민간 수요가 높은 공공저작물부터 새로운 유형 적용을 확산해 나갈 계획이다. 공공저작물 개방 노력을 공공기관 평가에 반영하는 방안도 검토한다.
아울러 정부는 공공누리 표시를 의무화하는 방향으로 저작권법 개정을 추진하고 공공저작물을 인공지능 학습용 데이터로 가공·개방하는 사업도 확대할 예정이다. 정부는 방송 자막 말뭉치, 전통민화 등 다양한 분야에서 총 766만건의 인공지능 학습용 데이터를 구축해 제공하고 있다.
최휘영 문체부 장관은 “공공저작물은 인공지능 산업을 이끌 핵심 자원”이라며 “인공지능을 비롯한 신기술 분야에서 공공저작물이 활발히 활용될 수 있도록 제도를 지속적으로 정비하겠다”고 밝혔다.
배경훈 과기정통부 부총리는 “국민 세금으로 구축된 데이터는 최대한 개방한다는 원칙 아래 데이터 활용 생태계를 조성해 나가겠다”고 말했다.
송현경 기자 funnysong@naeil.com