팬데믹에 실시간 데이터 경제학 만개

2021-10-29 13:02:51 게재

경제학 '제3의 물결' … "신속하고 시의적절해 대정부 영향력 급증"

영국 이코노미스트지 최신호에 따르면 1971년 칠레의 살바도르 아옌데 대통령은 세계 최초의 사회주의 인터넷 '프로젝트 사이버신'(Project Cybersyn)을 만들었다. 공무원들은 공장 생산과 논밭 작황의 정보를 중앙 데이터베이스에 입력했다. 이를 통해 작전실에선 금속 분야의 생산이 늘어났는지, 농장에서 생산물이 줄어들었는지, 광산 노동자 임금에 어떤 변화가 일어났는지 등을 신속히 파악했다.

덕분에 산업규제나 생산할당량 변화가 국가생산력에 어떤 영향을 미쳤는지 분석할 수 있었다. 사이버신은 사회주의 계획경제를 표방한 칠레 경제에 대한 전례없는 통찰을 제공했다. 하지만 사이버신의 꿈은 좌절됐다. 1973년 미국을 등에 업은 세력이 쿠데타를 일으켜 대통령을 시해하고 사이버신의 작전실을 때려부쉈다.

하지만 미국 캔자스주 소도시 설라이나에서도 비슷한 시도가 시작됐다. 이 지역의 신문인 '설라이나311'은 '공동체 계기판'이라는 고정란을 만들어 지역의 도소매가, 구인구직 수치 등을 제공했다. 이는 설라이나 지역 경제상황을 짚는 심전도로 기능했다.

경제상황 짚는 심전도

지난해 코로나19 팬데믹이 시작되면서, 1일 항공기 탑승객이나 시간당 신용카드 지출액 등 출현 빈도가 잦은 데이터에 대한 연구가 급증하기 시작했다. 팬데믹의 경제적 충격을 파악하기 위해서다. 최근 미국에선 어느 지역의 노동력 부족이 가장 심각한지, 다음번엔 어떤 원자재 가격이 치솟을 것인지를 가늠하기 위해 출현 빈도가 잦은 새로운 데이터를 찾는 경쟁이 벌어지고 있다.


경제학자들이 새로운 데이터 뭉치를 찾아나서면서 관련 연구 붐이 일어났다. 그 결과 정부 정책에 이전과는 차원이 다른 큰 영향력을 미치고 있다.

이코노미스트지는 "신속하고 광범위한 데이터를 기반으로 하는 경제학은 3가지 거대한 변화를 수반한다"고 지적했다.

첫째 풍부하면서도 실세계 문제와 직접 관련이 있는 데이터를 활용한다는 점이다. 정부의 격리봉쇄가 국민의 여가지출에 어떤 영향을 미치는지 알기 위해서, 경제학자들은 실시간 식당 예약현황 데이터를 들여다본다. 공급망 정체현상을 이해하기 위해 매일매일 수송선박 움직임을 추적한다. 경제학자들에게 시의적절하면서도 세세한 정보를 담은 데이터 뭉치란, 현미경이 생물학자들에게 주는 의미와 동일하다.

둘째 그같은 데이터를 이용하는 경제학자들은 정부 정책에 영향을 미치는 데 더 열정적이다. 때문에 데이터를 다루는 대부분의 경제학자들은 약식으로 신속한 연구를 수행한다. 새로운 정책에 빠르게 대응하기 위해서다.

셋째 이같은 유형의 경제학은 이론에 거의 의존하지 않는다. 데이터 경제학자들은 '정보가 스스로 말하게 해야 한다'고 믿는다. 하버드대 교수로 데이터 기반 경제연구의 선구자인 라즈 체티는 "경제학자들 사이에 논쟁은 의사들 간의 논쟁과 다를 게 없다"며 "커피가 몸에 나쁘냐 여부는 순전히 개별 사례에서 증거의 문제"라고 말한다.

이코노미스트지는 "이같은 경제학계의 흐름을 '세번째 물결의 경제학'이라고 칭할 수 있다"고 지적했다. 이에 따르면 첫번째 물결은 애덤 스미스가 1776년 발간한 국부론에서 시작됐다. 경제학이란 주로 1명의 경제학자가 거대한 이론적 의문점에 집중해 쓴 책 또는 논문을 의미했다. 스미스는 18세기 유럽의 독점적 관습을 파괴하려고 했다.

20세기 들어 존 메이너드 케인스는 사람들이 경제순환을 관리하는 정부의 역할에 대해 달리 사고하기를 바랐고, 밀턴 프리드먼은 케인스의 개념을 따르는 정치인들이 스스로에게 부여한 많은 '부당한' 책임감을 제거하려고 했다.

이 3명의 경제학자는 정부 정책에 큰 영향력을 미쳤다. 1850년 한해에만 스미스의 연구는 영국 의회에서 30번 인용됐다. 하지만 추상적인 거론이었다. 데이터로 뒷받침 되는 건 거의 없었다. 경제학자 대니얼 헤머메시의 2012년 연구에 따르면, 1970년대까지만 해도 경제학 논문 절반 이상은 순전히 이론에 집중돼 있었다.

이는 두번째 물결의 경제학으로 바뀌었다. 2011년 순수이론에 치중한 경제학 논문은 전체 중 19%에 불과했다. 공식 통계가 늘어나면서 경제학자들은 보다 많은 데이터를 갖고 연구할 수 있었다. 컴퓨터 성능이 강력해지면서 패턴을 읽고 인과를 따지는 게 가능해졌다. 자연과학 분야에 적용되던 인과관계 분석 방법이 임금이나 교육 효과 등을 평가하는 데 접목되면서 경제학 실증 연구의 지평이 확장됐다. 분석의 복잡성이 늘어나면서 1편의 논문 당 참여 저자의 평균 수가 늘었다. 경제학자들은 정부 정책에 더 큰 영향력을 미쳤다.

그럼에도 데이터의 한계는 컸다. 대개의 국가통계는 수개월, 또는 수년의 시차를 두고 나왔다. 미 재무부 경제정책 담당 차관보인 마이클 폴켄더는 코로나19 팬데믹 초 "전통적인 의미의 정부 통계는 사실 그렇게 유용하지 않았다. 통계가 나올 때면 그 데이터는 이미 김이 빠진 상태"라고 말했다.

지역경제에 대한 공식 데이터의 질은 편차가 컸다. 그 데이터를 갖고 주택시장과 소비자지출을 다루는 건 쉽지 않았다. 국가통계는 경제 전반이 산업 중심으로 움직일 때, 서비스와 금융이 초기 단계였을 때 만들어졌다. 1937~1938년 도입된 '표준산업분류'는 현재도 업데이트를 거쳐 사용된다. 제조업은 24개 하위분야로 세분화됐지만, 금융산업은 단 3개 하위분야를 가질 뿐이다.

공식통계 나올 땐 이미 김 빠진 데이터

급격한 변화의 시대, 정부는 종종 안갯속 상황에서 오판하는 경우가 있다. 2008년 5월 미국 대통령 경제 자문 위원장이었던 에드워드 라지어는 "지금 당장 데이터를 본다면, 우리는 일반적으로 경기침체로 특정할 단계에 있는 게 아니다"라고 단언했다. 하지만 다섯달 뒤 리먼브러더스가 붕괴했다. 그 직후 국제통화기금(IMF)도 "미국이 반드시 깊은 경기침체로 향하던 것은 아니었다"고 했다. 그러나 미국은 2007년 12월부터 침체로 접어들었다.

공식통계와 실물경제 사이의 간극은 여전히 크다. 현재 캔자스주 월마트엔 반려견 사료에서 생수까지 많은 상품이 태부족 상황이다. 국가통계는 그같은 문제를 제대로 포착하지 못한다. '경제정책연구센터'(CEPR) 딘 베이커 소장은 "공식 데이터에 따르면, 자동차와 농작물을 제외한 미국의 재고량은 팬데믹 이전보다 거의 낮아지지 않았다"고 지적했다.

팬데믹 이전부터 세번째 물결의 경제학이 등장할 조짐이 보였다. 일부 경제학자들은 익명의 세금납부 기록과 모바일폰 위치정보 등 새로우면서 매우 상세한 데이터 흐름을 연구하고 있었다. 거대한 데이터 뭉치를 분석하기 위해선 정보를 정리하고 판별하는, 기업연구소 규모의 많은 경제학자들이 필요하다.

경제학에 현대 컴퓨터 기법을 선도적으로 도입한 스탠포드대 수전 애티 교수는 자신의 연구소에 20명 남짓한 계약직 연구자를 갖고 있다. 하버드대 체티 교수 팀도 비슷한 규모의 연구자들을 확보하고 있다. 팬데믹 동안 데이터 기반 경제학 연구로 가장 많이 인용된 20명의 경제학자 중 3명이 기업 규모의 연구소를 갖고 있다.

더 많은 데이터들이 기업으로부터 나오기 시작했다. 신용카드 기업 '비자'와 온라인 결제서비스 기업 '스퀘어'는 지출 패턴을 기록한다. 애플과 구글은 사람들의 동선을 추적한다. 보안시스템 기업들은 사람들이 언제 건물을 드나드는지 알고 있다.

스탠퍼드대 경영대학원 존 레빈 교수는 "컴퓨터는 모든 경제적 거래의 중심에 있다. 자연스레 모든 상황이 기록된다"고 말했다. JP모간체이스는 2015년 네트워크 데이터를 활용하는 기구를 설립해 소비자금융, 소상공인과 관련한 정보를 분석하고 있다.

2016년 6월 영국의 유럽연합(EU) 탈퇴 여부를 결정하는 브렉시트 투표가 있었다. 실시간 데이터가 시험대에 오른 첫번째 주요 이벤트였다. 영국정부와 투자자들은 이같이 이례적인 사건이 미치는 경제적 충격에 대해 알아야 했다. 하지만 공식 GDP가 나올 때까지 기다릴 수는 없었다.

경제학자들은 식당 예약률과 슈퍼마켓 할인제공 빈도 등 조짐을 알리는 데이터들을 긁어모은 뒤 '영국의 경제성장이 둔화되고 있지만, 많은 전문가가 예상했던 경제적 재앙과는 거리가 멀다'는 결론을 냈다. 이후 이 결론은 정확했던 것으로 드러났다. 이코노미스트지는 "코로나19 팬데믹이 없었다면, 실시간 데이터 기반 연구는 더 오랫동안 틈새 분야로 남았을 것"이라고 지적했다.

중국 기업들은 오래 전부터 출현 빈도가 높은 세부 데이터를 생산했다. 영화관 방문자수나 사람들이 매일 몇잔의 맥주를 마시는지 등 모든 데이터를 뽑았다. 때로 중국 정부의 공식통계가 의심스러울 때, 맥주와 영화관 데이터는 이를 보다 정확히 검증하는 수단이 된다. 2020년 1월 후베이성에서 격리봉쇄가 시작되자 서구의 중국 전문가들은 데이터 뭉치에 관심을 쏟았다. 그에 따라 생산된 수치들은 '세계 2위 경제대국이 성장둔화로 향하고 있다'는 사실을 여실히 보여줬다.

미국에서도 마찬가지였다. 팬데믹 초기 구글은 사람들의 이동에 대한 익명의 데이터를 공개하기 시작했다. 연구자들은 이를 기반으로 격리봉쇄가 사람들에게 미치는 영향을 알 수 있었다. 식당예약 플랫폼인 '오픈테이블'은 매일의 식당예약 정보를 공개했다. 미국 인구조사국은 각 가정의 고용 상황, 임대료 지불 여력 여부 등을 담은 주간 단위 가구조사를 도입했다.

혼란스런 경제적 상황을 이해하기 위한 데이터 연구 수요가 급증했다. 미국정부가 지급한 주간 600달러 실업수당에 대한 분석이 지난해 3월 실시됐고, 그 효과 분석은 수주 만에 공개됐다. 영국정부는 같은 해 8월 식당 이용객들에게 보조금을 지급했다. 두달 뒤인 10월 보조금 지급 때문에 코로나19 확진자수가 급증했음을 파악할 수 있었다. 글로벌 경제가 2020년 3월 무너지기 시작했다는 것, 가난한 사람들이 부유한 사람들보다 더 큰 피해를 입었다는 것, 재택근무 전환이 기대보다 양호한 효과를 냈다는 것 등의 추정은 신속하게 공개되는 데이터 기반 경제연구로 사실임이 증명됐다.

연구의 질적인 의문도

모든 이들이 세번째 물결의 경제학을 좋아하는 건 아니다. 이코노미스트지는 "경제학자들은 '당신은 데이터과학자군요'라는 말을 칭찬이 아닌 것으로 여기는 경우가 많다"며 "좀더 완곡하게 해석하면 '이론에 치중해온 역사적 불균형을 데이터중시 연구로 교정하는 것' 정도 된다"고 전했다.

UC버클리대 욘 스테인손 교수는 "지난 수십년 간 거시경제학의 가장 큰 문제는 너무 이론적이었다는 점"이라고 말했다. 데이터로 균형을 맞추면 이론을 보다 개선된다. 최근 노벨경제학상 수상자 절반은 노동경제학에 새로운 실증법을 적용한 학자들에게 주어졌다. 나머지 절반은 그같은 방법론을 둘러싼 통계적 이론이었다.

하지만 일부 비평가들은 실시간 데이터의 질에 의문을 제기한다. 예를 들어 GDP 같은 지표에서 추정치와 확정치 간의 편차가 크다는 점, 성장이 침체로 바뀌는 전환점 등에 대한 분석이 어렵다는 점에서다.

또 '제보다 젯밥'이라는 지적도 있다. 경제학자들은 현재 전미경제연구소(NBER)에 워킹페이퍼(연구논문)를 앞다퉈 게재하고 있다. 특정 연구 부문에서 자신의 선점권을 주장하기 위해 또는 정책당국에 영향력을 미치기 위해서다.

이코노미스트지는 "패스트푸드가 정성껏 준비한 정찬과 같을 수 없듯, 데이터 기반 신속한 연구가 줄잇는 세미나와 동료심사를 거친 논문처럼 치밀할 수는 없다"고 지적했다.

김은광 기자 powerttp@naeil.com
김은광 기자 기사 더보기