빅데이터는 4차 산업혁명시대의 금맥으로 불린다. 하지만 개인이 빅데이터를 획득하기 위해서는 상당한 어려움이 뒤따른다. 한국의 개인정보보호법이 개인의 정보를 수집하는 것을 상당부분 제한하고 있고, AWS 등의 서비스를 활용하여 방대한 데이터를 저장할 공간을 빌려야 한다. 하지만 정부중앙부처, 지방자치단체, 정부가 투자한 공공기관 등은 우리가 납부한 세금으로 이미 방대한 데이터관리 플랫폼을 구축하고 있다. 다행히 정부는 이러한 공공데이터를 민간에 개방하여 활용하도록 지원하고 있고, 공공 빅데이터센터를 구축하려는 노력을 지속하고 있다. 이글에서는 공공부분의 빅데이터를 활용하여 새로운 가치를 창출하는 과정에 대하여 살펴보기로 한다.

<사진 출처 = 픽사베이>

새로운 광물 빅데이터

미국 실리콘밸리 북서쪽에는 49번 고속도로가 지나간다. 이곳에서는 지금도 골드러시 시대의 자취를 느낄 수 있고, 조그만 돈을 지불하면 사금 채취에 참가할 수도 있다. 깨알 같은 사금이 19세기말 샌프란시스코 지역을 발전시킨 원동력이 되었다면, 오늘날 조그마한 데이터 조각들을 모아서 가공한 것은 훌륭한 디지털 자산이 된다. 하루동안 전세계인들은 구글에서 5천만번의 검색을 하고, 유튜브에 40만 시간의 동영상을 업로드한다. 미국이 가지고 있는 데이터만도 자산가치로 환산하면 8,000조원이 넘는다. 기업이 보유한 데이터의 점유율과 데이터의 품질이라는 새로운 요소는 4차 산업혁명의 시대에 기업의 가치를 평가하는 척도가 된다.

이미 아날로그로 구성된 세계 전체가 디지털화하여 빅데이터로 저장되고 있다. 위와 같이 구축된 디지털데이터는 디지털트윈으로 구현되어 자연현상이나 사회현상을 재현하고 변화를 시뮬레이션하는데 활용된다. 스티븐 스필버거의 최신 영화 '레디 플레이어 원’에는 수많은 군중들이 참여하는 가상현실의 세계가 나온다. 영화속에서 개인들이 3D안경을 착용하고 햅틱슈트를 입으면 가상현실 오아시스에서 원하는 캐릭터로 변신하여, 어디든지 갈 수 있고, 상상하는 다양한 것을 시도할 수 있다. 구글은 데이터가 지배할 미래세계를 위하여 이미 전세계의 거리에 대한 3차원 데이터를 사람의 시점으로 축적하고 있다. 구글은 개띠의 해인 올해 일본에서 개에게 360도 카메라를 메고 산책하도록 하여, 개의 시선으로 바라본 세계까지도 가상현실로 구현하고 있다. 자동차가 가지 못하는 눈밭도 강아지가 달리면서 데이터를 축적하고 있는 것이다.

디지털화된 가상공간에 부가적으로 시간정보까지 설정할 경우 4차원적인‘정책지도’가 구현되며, 정책입안자들은 과거와 미래를 손쉽게 이동하며 의사결정에 활용할 수 있다. 싱가폴의 경우 작년부터 '버추얼 싱가폴 계획'울 추진하고 있다. 이것은 도로, 건물, 공원 등 국가 전체요소를 가상공간에 3차원으로 구현하는 프로젝트이다. 이 프로젝트에서는 정부가 가로수를 심기 전에 시뮬레이션을 통하여 미래의 시점에서 소음저감 효과를 예측하기도 한다.

오늘날 우리들이 축적하는 상당한 양의 빅데이터가 적절히 활용되지 않고 소멸된다. 우리들의 주변에서 생성되는 데이터는 다양하고 형식이 단일하지 않기 때문에, 효율적인 활용은 쉽지 않다. 그래서, 인공지능이 데이터를 해석하기 쉽도록 온톨로지가 제공되기도 한다. 온톨로지는 수집된 데이터와 관련된 사람의 개념을 체계적으로 정리하여 컴퓨터가 다룰 수 있도록 한 것이다. 빅데이터는 일반인들이 이해하기 쉽지 않다. 그래서 분석결과를 비전문가가 직관적으로 이해할 수 있도록 지도상에 시각적으로 표시한 데이터시각화 기술이 활용되기도 한다. 다양한 빅데이터 활용기법을 사용하여 방대한 빅데이터를 정밀하게 가공하여 표준화하거나, 문제에 대한 해결책까지 만들어 낼 때 빅데이터의 가치는 더욱 증가하게 된다.

 

빅데이터 활용처 다양해져

공공부문에서 수집된 빅데이터는 국가와 민간이 의사결정을 내리는 과정을 다양하게 지원한다. 공공 데이터는 먼저 새로운 행정적 지원을 해줄 필요성을 발굴해내기도 한다. 전라북도와 광주광역시는 지난해 골든타임 확보 목적으로 공공데이터를 활용하여 119센터 취약지역을 분석하고 구급차 배치와 인력장비 운영을 최적화하는 방안을 모색하여 성과를 거두었다.

공공분야에서 빅데이터는 또한 범죄를 예측하여 대응함으로 안전한 사회를 만드는데 기여한다. 세계 최고수준의 치안을 유지하는 한국에서도 연간 300건 이상의 살인사건이 발생한다. 정밀한 빅데이터는 우범지역에 순찰차를 배치하도록 하고, 고화질CCTV나 비상벨을 추가로 설치하도록 유도한다. 아직 완벽하지 못하지만 건강보험심사평가원에 제공된 정보나 전력, 수도 사용량을 분석하여 복지 취약계층을 발굴하기도 한다.

빅데이터 정보는 예산의 효율적 사용에도 활용된다. 한국은 연간 17조원에 가까운 예산을 사회간접자본 확충에 사용한다. 예산의 낭비를 막기 위하여 국가재정법은 500억원 이상의 예산이 사용되는 대형토목공사는 투입금액에 대한 효용을 미리 계산하도록 하고 있다. 이러한 타당성조사 과정에서 교통분야의 빅데이터는 사회, 경제적 환경변화를 고려한 교통수요를 예측하는데 활용될 수 있다. 서울시는 이미 교통카드로 축적된 빅데이터를 일정기간마다 분석하여 주기적으로 버스노선을 신설하거나 폐지하며, 버스의 배차간격을 조절하고 있다. 현재 한국에서는 정부의 예산으로 다양한 연구개발 활동이 진행되고 있다. 금속, 물리, 화학, 생명, 재료공학 등 다양한 분야에서 축적되는 방대한 실험 데이터의 효과적 활용을 위하여 국가참조표준이 만들어지고 있다. 이러한 표준은 중복실험으로 인한 예산이나 자원이 낭비되는 것을 막아줄 것으로 기대된다. 한국의 GDP는 작년 1,600조원이 넘는데, 지하경제 규모는 여전히 300조원 규모이고, 탈루되는 세금은 20조원 정도로 추정되고 있다. 경제활동과 관련된 빅데이터는 상당한 규모의 탈세를 추적하는 데에도 활용된다.

과거에는 정부나 민간이 통계청 등이 작성한 데이터를 단일 항목으로 분석하는 경향이 많았으나, 최근에는 인접 분야의 공공데이터를 융합 및 복합하여 정확도가 높은 새로운 예측모델을 만드는 것도 시도된다. 예를 들면 기존에 있던 수질원격감시시스템, 굴뚝원격감시시스템, 대기배출원관리시스템에 오염과 관련성이 있는 실시간 전력사용량분석이나 인근 지역의 SNS활동 등을 결합한다면 오염물질의 배출을 더욱 효과적으로 추적할 수 있다고 한다.

현재는 교통분야에서만 주로 지능형교통시스템이 구축되지만 미래에는 보행자용 교통시스템도 구축될 것이다. 그렇게 되면, 치매환자나 미아와 같은 보행자도 자동차처럼 실시간으로 추적할 수도 있게 될 것이다. 정부는 현재 서울시 상공에 P73A, P73B 등의 비행금지구역을 설정해 놓았다. 만약 드론이 장래에 피자배달과 택배 등에 광범위하게 활용된다면, 정부는 수많은 드론의 활동을 관제하며 비행금지구역에서의 불법적인 비행이나 충돌사고를 막기도 하겠지만, 범죄예방이나 범인 추적에 이를 활용할 수도 있을 것이다.

 

공공빅데이터의 민간활용

정부는 2013년 공공데이터법을 제정하고, 2014년 공공데이터 관리지침을 배포하여 민간의 공공데이터 활용도를 높이고자 노력하고 있다. 정부의 활용지침은 공공데이터를 개방하기 전에, 개인정보를 비식별화하고 제3자의 저작권을 침해하지 않았는지를 확인하고 있다. 업데이트가 빈번한 대용량 데이터는 일단 오픈API방식을 사용하도록 하고 있다. 이 경우 별도의 심의와 승인을 받지 않도록 하였고, DB로 변환하여 저장이 가능하도록 하였다. 정부의 파일제공에서는 가공이 어려운 PDF가 아니라 모든 소프트웨어에서 자유롭게 수정이나 편집이 용이한 CSV, JSON, XML 등의 포맷을 활용하거나 웹상의 다른 데이터와 연결이나 공유가 가능하도록 LOD 포맷을 사용하도록 권장하고 있다.

위와 같은 지침을 통하여 오픈API방식으로 공개된 공공데이터는 현재 2,400건을 넘고 있다. 오픈API데이터 중 가장 인기있는 것은 부동산실거래가 정보이며, 동네기상예보 정보, 대기오염 정보가 그 뒤를 따른다. 정부가 개방한 데이터는 공공데이터포털(www.data.go.kr)에 등록되어 있다. 이 사이트에는 현재 건축정보, 교통사고정보, 국민건강정보, 상권정보 등의 다양한 정보들이 통합하여 등록되어 있다.

수많은 민간업체들은 이미 공개된 공공데이터를 활용하여 보다 향상되고 정교해진 서비스를 제공하고 있다. 숙박정보업체 야놀자는 한국관광공사와 지자체의 축제개최 정보를 부가적으로 활용하여 여행객을 예측하고 있고, 음식추천서비스 레드테이블은 소상공인진흥공단의 상권정보를 활용하여 지역별 맛집을 분석한다. 교육부의 학교급식정보를 활용하는 업체는 자녀들이 오늘 어떤 음식을 먹었는지 부모님께 통지해주어 자녀들의 균형 잡힌 식생활을 돕고 있다. 삼성전자가 개발한 스마트냉장고는 위해식품정보를 활용하여 냉장고에 들어오는 식품이 회수대상인지 자동으로 판독할 수도 있다

빅데이터 시대를 맞아 공공데이터를 개방하여 자국의 산업의 진흥을 꾀하는 선진국의 사례는 점차 증가하고 있다. 미국은 2009년부터 이미 열린정부 지침을 발표하였고, 2013년 데이터주도 혁신전략을 발표하였다. 미국의 경우 2016년 기업의 26%가 공공빅데이터를 효과적으로 활용하고 있다고 하는데, 한국의 경우 활용도가 이에 미치지 못하고 있다. 한국의 경우 이미 많은 공공데이터가 개방되었으나 미국이나 영국 등에 비하면 개방된 공공데이터의 양은 적은 편이다. 아직도 공공데이터는 특정기관의 자산으로 인식되며, 이를 활용한 부가가치의 창출은 미흡한 편이다. 기업의 매출액 증진과 새로운 일자리 창출을 위하여, 한국 국민들도 정부가 이미 개방한 공공데이터를 이용하여 새로운 부가가치를 창출하는 것과 사회적 현안 해결에 공공데이터를 활용하는 것에 관심을 가질 필요가 있다.

 

여정현

- 서울대학교 법과대학 졸업

- 대우그룹 회장비서실

- 안양대학교 평생교육원 강사

- (주)명정보기술 산호세법인 근무

저작권자 © 이코리아 무단전재 및 재배포 금지