우리 생활 속 빅데이터 돋보기: 데이터 속 무궁무진한 가능성

Story/효성

 

글. 노승욱(매경이코노미 기자)

 

 

-
모든 것이 데이터로 바뀌는 시대

 

우리가 온라인에서 남기는 모든 행위는 데이터로 저장됩니다. 자판을 쳐서 쓴 텍스트는 물론 마우스 클릭, 커서와 휠 이동, 특정 사이트에 접속해 몇 분 몇 초간 머물렀는지, 어느 페이지, 어느 지점에서 마우스 휠을 몇 초간 멈췄는지도 모두 데이터로 기록됩니다. 오늘날 하루에 생산되는 디지털 데이터 규모는 2ZB(제타바이트)가 넘습니다. 1ZB는 미국 전체 학술 도서관에 소장된 도서 정보량의 50만 배에 이르는 용량. 이처럼 상상하기 힘들 만큼 방대한 양의 데이터를 우리는 ‘빅데이터(Big Data)’라고 부르죠. 빅데이터를 수집, 분석하면 다양한 비즈니스 기회를 포착하고 새로운 서비스를 선보일 수 있습니다.

 

 

-
빅데이터는 곧 비즈니스의 기회

 

아마존, 쿠팡 같은 온라인 쇼핑몰은 고객 주문 데이터를 분석, 구매 주기나 패턴이 일정한 상품의 수요를 예측해 물량을 확보해둡니다. A 사용자가 2~3개월에 한 번씩 쌀을 구매했다면 그즈음에 가까운 물류창고에 쌀을 갖다놓고, A 사용자에게 추천 상품으로 알림을 보내는 식이죠. 덕분에 A 사용자는 주문한 지 반나절 만에 상품을 받을 수 있습니다.

 

현재 상용화 초기인 ‘안면 인식’ 보안 기술도 빅데이터 활용 사례입니다. 눈, 코, 입, 귀, 볼, 이마, 윤곽 등 100여 가지 얼굴 데이터를 등록해 신원을 확인하는 기술이죠. 지문처럼 사람마다 미세하게 다른 얼굴 모양이나 크기, 이목구비 간 거리 등을 전자 데이터로 변환해서 다른 얼굴 데이터와 대조하는 방식입니다.

 

최근에는 외식 시장에서도 빅데이터 분석이 필수 경영법으로 떠올랐습니다. 이는 개인에게도 유효한데요, 지난 2016년 서울 돈암동에서 배달 대행 업체를 운영하던 B 대표는 C 치킨 배달 요청이 급증한 데이터에 주목했습니다. 당시 신 메뉴가 인기를 모으며 주문이 쇄도한 것. B 대표는 재빨리 C 치킨 가맹점을 출점했고 기대보다 매출이 잘 나오자 배달 업체를 그만두고 현재 해당 치킨 가맹점을 17개나 운영 중입니다.

 

이 밖에도 빅데이터 활용 사례는 다양합니다. 실시간 교통량을 수집, 분석해 최단 경로와 도착 예정 시간을 알려주는 ‘내비게이션’, 도로 환경을 파악해 자동 운전하는 ‘자율 주행차’, 프로 기사들의 기보와 경우의 수를 분석해 신의 한 수를 찾아내는 ‘알파고’ 또한 빅데이터 기술이 있어 가능했습니다.

 

 

-
데이터 레이블링과 데이터 주권 문제

 

 

최근 업계에선 그간 데이터로 집계되지 않았던 정보 영역의 데이터베이스(DB)화에 힘쓰고 있습니다. 가령 유튜브 동영상 속 영상, 음성, 자막 등이 현재는 검색이 안 되지만 화면 캡처와 음성 인식, 텍스트 변환 기술을 적용해 검색해내는 식이죠. 정부가 지난해 7월 발표한 ‘디지털 뉴딜’ 정책 중 ‘데이터 레이블링(Data Labeling)’도 기계가 하기엔 어려운 DB화 작업을 사람이 대신하는 사업입니다. 갈수록 동영상과 이미지 형태의 데이터 양이 증가하는 추세인 만큼, 이들을 모두 DB화할 수 있다면 빅데이터의 활용도와 정합성은 더욱 높아질 것입니다.

 

한편으로는 석유 자원이 무기화됐듯, 향후 데이터 주권을 둘러싼 지정학적, 사회적 갈등이 커질 수 있습니다. 미국이 중국 글로벌 기업 일부의 IT/플랫폼 서비스를 제한했던 것이 대표 사례죠. 이들 기업이 수집한 데이터가 중국으로 전송되면 미국 인프라 감시에 활용될 수 있다는 우려에서입니다. 개인정보보호법을 어느 수준에서 조율할 것인지도 풀어야 할 과제입니다. 소비 데이터를 넘어 의료 데이터까지 최대한 수집해 서비스를 고도화하려는 기업과, 사생활 침해를 걱정하는 시민 사회 간 줄다리기는 앞으로도 팽팽하게 계속될 전망입니다.

 

 

-
생활 속 빅데이터 활용 사례

 

➊ 휴가철 해수욕장 피서객 측정

전국 주요 해수욕장 내 신호를 측정해 30분 이상 머무른 휴대폰 숫자를 센 다음 통신사별 시장 점유율+전원 꺼짐 비율 데이터 등을 분석해 해수욕장 이용객 수를 산출

 

➋ 빅데이터 기반 주차 요금제

미국에서는 개월, 시간, 날짜, 주중, 주말 등에 따른 주차량을 분석해 요금에 차등을 두어 혼잡 시간대 주차율을 10% 줄이고 대중교통 이용률을 늘림

 

➌ 교통사고 예측

기상청의 날씨 정보와 인구, 교통 문화 지수, 시민 제보 데이터 등 약 6TB의 데이터를 수집•분석한 후 이를 토대로 교통사고 위험 시간대, 위험 지역 상위 10곳, 사고 위험 지수 등을 예측

 

➍ 축구 전략 분석

독일축구연맹(DFB)은 2014 브라질 월드컵을 앞두고 특별 제작한 소프트웨어 ‘매치 인사이트’라는 프로그램을 이용해 독일 선수들을 분석하고 과학적인 전술을 펴 우승 트로피를 거머쥠