신문로

데이터센터와 인공지능

2022-11-09 10:51:30 게재
윤경용 페루 산마틴대 석좌교수

'기계도 생각할 수 있을까?'(Can Machine Think?) 컴퓨터와 인공지능의 아버지라 불리는 앨런 튜링의 논문은 이렇게 시작한다. 그는 논문에서 '튜링테스트'로 실험대상에게 말을 걸어 사람인지 인공지능인지를 판별했다. 일정 시간 채팅을 한 뒤 심사위원 1/3이 사람이라 확신이 들면 지능이 있다고 판정하는 것인데 실험대상이 기계라도 지능을 지녔다고 인정해 주자는 것이다.

그러나 미국 철학자 존 설은 질문과 답변을 몰라도 기계적으로 답할 수 있다는 '중국어 방 사고실험'을 통해 튜링테스트는 기계의 인공지능 여부를 판정할 수 없다는 반론을 폈다.

과학자들은 상반된 두 의견인 튜링테스트와 중국어 방 실험이 모두 맞다는 견해를 보였다. 이는 결국 인공지능의 여부가 인간의 손에 달려있다는 점을 시사한다.

인간의 역사에서 중요한 축을 이루는 것은 바로 도구와 기술의 발전인데 그 한축인 인공지능은 1950년부터 시작됐다. 그러나 그 이후로 거의 60년 동안은 인공지능의 암흑기나 다름이 없었다. 그 이유는 바로 인공지능의 중요한 먹이인 빅데이터가 없었기 때문이다. 인공지능의 핵심은 학습과 추론이다. 학습을 위해서는 많은 양의 데이터가 필요하다.

참사 피하기 어려운 구조의 국내 데이터센터

빅데이터는 다양한 방법으로 얻어지지만 상당수가 무수히 많은 센서들의 네트워크인 사물인터넷(IoT)을 통해 자동으로 얻어진다. 얻어진 빅데이터를 실시간으로 모으기 위해서 인터넷과 같은 네트워크가 구성되어야 하고, 이를 가공 저장하기 위해서 데이터센터와 같은 대규모 저장소가 필요하다. 그리고 모아진 막대한 데이터를 실시간으로 처리하고 학습하기 위해서 매우 빠른 컴퓨터를 필요로 한다. 빅데이터·IoT·데이터센터·컴퓨터는 인공지능 발전을 위한 필수요소다.

최근 인공지능·메타버스·자율주행 등 신기술이 대거 부상하면서 디지털 데이터의 양이 급증하고 이를 안정적으로 처리할 컴퓨터와 저장소가 대량으로 필요해짐에 따라 데이터센터의 중요성이 부각되고 있다.

데이터가 '21세기의 원유'로 평가될 만큼 중요성이 부각되면서 글로벌 데이터센터는 2016년 1252개에서 2021년 1851개로 50% 늘어났다. 현재 국내 데이터센터 수도 약 180개로 글로벌 점유율 10%를 차지한다. 데이터 생산량에서도 한국은 미국 영국 중국 스위스에 이어 다섯번째로 많다. 그러나 데이터센터는 숫자보다 전력사용효율(PUE, Power Usage Effectiveness)과 저장규모에 초점이 맞춰져야 하는데 일반적으로 연면적 2만2500㎡에 최소 10만대 이상의 서버를 갖춘 '하이퍼스케일'(HyperScale)급이 그것이다.

데이터센터는 산업기반 핵심시설로 꼽힌다. 아마존 구글, MS 등 글로벌 빅테크들은 데이터센터를 지을 때 지반이나 연평균기온 등을 살피고 화재 등에 강한 자재로 지으며 위치와 설계를 철저한 보안에 부친다. 반면 국내 데이터센터들은 님비현상과 홍보 때문에 위치 노출은 물론 하나의 데이터센터에서 하나의 클라우드에 의존하는 경향이 심해 재해가 발생하면 참사를 피하기 어려운 구조를 가졌다.

얼마전 발생한 데이터센터 화재를 보면 그 이유가 짐작된다. 물리적으로 경기 성남 소재 SK C&C 판교 클라우드 데이터센터 한곳의 화재이지만 그로 인해 카카오톡 등 카카오 서비스 대다수가 24시간 장애를 빚어 심리적으로는 국가적 재난에 준하는 사고가 되고 말았다.

분산시스템보다 회복탄력성 더 중요

이를 계기로 데이터센터의 보안의 중요성과 유사시 복구를 위한 이중화 정책의 필요성이 대두되었는데, 정치권은 이번 재해에 대한 해법을 법제화에서 찾으려 한다. 하지만 이는 오히려 규제를 조장해 자칫 '첨단산업 발목잡기'를 할 우려가 크다.

사고 예방을 위해서는 철저한 보안설계와 재난 발생시 빠른 수습을 위한 시스템 분산이 필수지만 글로벌 기업들은 분산보다 한 차원 높은 빠른 복구력, 즉 '회복탄력성'에 중점을 둔다. 얼마 전 카카오 화재사고에서도 이러한 정책이 우선되었다면 심리적 좌절감이 저감되었을 것이다.

소 잃고 외양간 고치는 격이겠지만 또다시 소를 잃지 않기 위해서는 유사시 회복탄력성을 갖춘 유기적 구조의 '하이퍼스케일 데이터센터'를 지향하는 것이 맞다.