문송천 칼럼

클라우드 어원에 대한 올바른 이해와 혈세낭비 방지

2023-12-28 11:45:09 게재
문송천 카이스트 경영대학원 교수

디지털전환에 대한 자의적 해석이 난무하는 것은 주로 클라우드의 본래 취지에 대한 이해가 박약한 데서 비롯된다. 클라우드 기반 공공데이터 관리에 혈세낭비가 심한 것 역시 같은 맥락이다. 기획재정부가 간과하는 누수 요인으로서 정부 대응이 필요한 중대 사안이다.

정부 부처와 지자체마다 디지털혁신을 담당하는 조직이 있다. 하지만 공공데이터쪽의 주무부처 역할을 하는 행정안전부를 살펴보면 혁신국장을 비롯해 휘하 인력 거의 대부분이 행정학과 등 인문사회계 출신이다. 디지털혁신 사업이 엉뚱한 방향으로 추진될 수 있다는 얘기다. 어느 전산전문가가 행안부 회의에 갔다가 외계인 취급을 받았다는 일화가 있을 정도이니 어느 정도 심각한지 알 것이다.

더구나 자기부정이 힘든 공직사회 풍토로 인해 숲을 보지 못한 채 나무 한그루만 보는 좁은 시야로 추진되는 게 다반사다. 그게 쌓여 전사 관점이 아니라 실과 국 중심으로 데이터관리가 각개격파식으로 이루어져 데이터관리 특히 데이터설계에 대한 일관성이 완전히 실종된 상태다.

데이터가 분산 단절된 상태로 제멋대로 설계되어 데이터 종합조감도가 없이 외딴 섬처럼 고립되는 격납고 현상이 자연발생적으로 벌어진다. 이를 프랜차이즈 커피 전문점에 비유하면 가맹점마다 음료 조제 규정없이 맛을 제멋대로 내는 것과 같다.

자체적으로 부족한 부분을 부단히 배워나가는 자세가 결여돼 있는 게 공직사회는 가장 큰 문제라 할 것이다. 사업도 위탁업체 발주에만 국한돼 외부 전문가를 활용할 수 있는 구조도 갖춰져 있지 않다. 규정에 얽매인 경직된 풍토 때문에 설계 부실공사가 있어도 그냥 넘어가는 게 고질적 관행이다.

클라우드 개념은 데이터 품질 중시 의미

이런 문제 해소 방안의 하나로 개방형 직위 제도를 도입했지만 이렇게 들어온 이가 현안 문제를 해결하기는커녕 오히려 그들과 동화되어 구태관행을 합리화하는 방패막이 역할을 하는 역주행 사례도 꽤 있다. 지자체 중 가장 규모가 큰 곳에서 이런 충격적인 일이 지금 벌어지고 있다.

데이터 품질의 중요성을 부각시키기 위해 1980년대 초 클라우드란 용어가 처음 소개됐다. 미국 대학 전산학과 교수 3명과 박사과정 학생 3명이 탄생시킨 클라우드란 용어의 유래는 이렇다.

클라우드란 인터넷 기반 컴퓨팅으로 데이터가 중시되는 시대에서 무엇보다 중요한 것은 다름아닌 바로 '데이터 품질'이라는 것을 강조한 말이다. 따라서 품질면에서 결격인 데이터들은 모두 다 클라우드 세상에 들어올 자격이 없다는 뜻을 가지고 있다.

클라우드(CLOUD)는 데이터 품질을 지칭하는 네개의 다른 단어가 합성된 것이다. 'CL'은 데이터 품격(Class)을 가리킨다. 예를 들어 고객도 데이터이고 고객성명도 데이터지만 그 둘은 격이 다르다는 뜻이다. 즉 고객성명은 그보다 상위격인 고객에 소속되는 하위격으로 설계해야 적법하다는 의미다. 그렇게 하지 않으면 품질훼손으로 간주된다. 따라서 설계 범법행위에 해당한다. 오류는 또 다른 유형의 오류를 유발해 산불처럼 번져나가게 된다.

'O'는 손님(객체, Object)으로서의 데이터를 지칭한 것이다. 데이터 반대편 쪽에 있는 데이터 사용 주체인 컴퓨터명령, 즉 코드에서는 데이터를 손님 취급하듯 정중히 모셔야 한다는 뜻이다. 여기서 주체와 객체를 혼동해서는 안되며 혹시라도 주체를 객체로 또는 객체를 주체로 둔갑시키는 행위는 범법행위 수준에 해당한다는 뜻이다.

'UD'는 다수 사이트 환경에서 데이터의 무소부재(Ubiquity, 데이터는 어디나 존재) 특성과 다수복제본 저장(Distribute, 여러 사이트에 데이터 중복 저장 가능하되 복제 데이터값 일치 필수) 특성을 가리킨다. 건축물에서 건축설계가 시공보다 중요하듯 코딩(시공)에 앞서 데이터 설계가 관건이란 뜻이다. 그러나 현업에서는 이런 원칙을 따르지 않고 편향 타협적으로 데이터를 임의설계하는 일이 자주 발생한다. 그러다보면 데이터와 코드를 구분 못하고 혼재시키는 일, 사본 간 값 일치성도 기계가 모두 알아서 자동처리해주는 것으로 착각해 중복을 과다하게 오남용하는 일이 벌어진다.

국방데이터 품질 부실 안보문제와 직결

데이터 품질을 무시할 때 국가 디지털플랫폼 구축에 들어가는 노력과 비용은 헛일이다. 클라우드로 해본들 아무 소용없다. 데이터품질 조악은 공공부문에 만연한 현상이다. 그로 인한 혈세낭비도 해마다 증폭된다. 현재로도 누수 규모는 기하급수적이다. 정부부처 별로 수천억원을 상회하며(지자체별로는 수백억원) 국가 전체적으로는 수십조원에 달한다. 세수 고민하는 기재부에서 이걸 안다면 가만 있을 것인가.

불편한 진실은 여기서 끝이 아니다. 국방도 위태로워질 수 있다. 국방 데이터 품질 역시 매우 부실하다는 국방부 감사결과도 있기 때문이다. 현대전은 노트북 들고 뛰어다녀야 하는 데이터전이다. 따라서 정교한 데이터 기반 전술 없이는 전쟁에서도 승산이 있을 리 만무하다.

문송천 카이스트 교수