기업 사례로 보는 기업 데이터 중요성

모든 출발은 ‘데이터’로부터! 왜 다양한 기업들이 데이터 기반 전략을 위한 노력을 하고 있는지, 다양한 기업 사례를 통해 데이터 중요성을 알아보자.

애플, 구글, MS의 기업 데이터에 대한 이례적 발표

지난 4월 10일, 미국 실리콘밸리의 공룡으로 오랜 라이벌 관계에 있는 애플과 구글이 협력하기로 발표했다.* 저작권에 관해 가장 보수적인 회사였던 마이크로소프트 사는 자사의 기업 데이터 일부를 공개하기로 했다.* 사람이 죽을 때가 되면 안 하던 짓을 한다던데, 무슨 일이 벌어진 걸까?

세 회사의 이례적 결정은 모두 코로나 대유행에서 비롯되었다. 애플과 구글은 안드로이드와 iOS가 탑재된 디바이스를 이용하여 감염병 확산 대응에 필요한 데이터를 수집하기 위한 공동의 노력을 선언했고, 마이크로소프트 역시 코로나 바이러스와 관련하여 자사가 수집한 정보를 공개하기로 한 것이다. 인류의 미래 없이는 이들 기업의 미래도 없다는 판단 때문으로 보인다.

글로벌 기업 데이터 발표 사례, 애플 Apple, 구글 Google, 마이크로소프트 Microsoft

2020년 5월 7일 기준 전세계 COVID-19 환자 수는 4백만에 가깝다. 지도에서 색이 짙을수록 감염자가 많은 지역이다. / Raphaël Dunant, CC BY 4.0

페이스북 창업자 마크 주커버그는 “전에도 전세계적인 감염병 유행이 있었지만, 이제 우리에겐 새로운 슈퍼파워가 있다”면서, “공익을 위한 공유 데이터를 모을 수 있는 능력”을 언급했다.*

한국에 사는 우리는 데이터만으로는 코로나를 대응하는 데에 한계가 있다는 것을 안다. 유행’병’을 잡기 위해서는 의료체계도 매우 중요하다. 한국 공공의료는 저렴한 가격과 보험에 가입한 모든 국민의 의료지원을 보장한다는 점에서 높은 평가를 받는다.*

이런 와중에 전인류를 위협하는 문제를 해결하기 위한 실마리로서, IT 공룡들이 정치적 타협과 장기적인 변화가 요구되는 ‘의료인력 확충’이나 ‘전국민 건강보험’ 같은 접근이 아닌 ‘데이터’를 꺼내 든 것은 우연이 아니다.

문제 해결의 실마리는 데이터 접근으로부터

든든한 의료체계가 뒷받침하고 있더라도, 환자 폭증으로 인해 의료가 붕괴되는 상황이 얼마나 위험한지는 이탈리아나 미국의 사례를 통해 생생히 드러나고 있다. 한국 정부는 의료 붕괴 상황을 막기 위해 감염병 확산 방지에 주력했다. 개인 정보를 활용한 추적과 격리에 많은 자원을 쏟은 것이다.

코로나 사태로 깨달은 데이터 중요성, 데이터 활용 통한 감염병 확산 대응

한국 의료 당국은 감염 의심자 휴대폰과 신용카드 사용내역을 이용, 당사자 동선을 10분 단위로 추적해 필요한 격리 및 폐쇄 조치를 취하고 있다. / Namoroka. CC BY 4

미국 언론은 한국의 방역 정책을 평가하면서 개인정보 침해 우려를 쏟아냈다.* 그런데 바로 그런 미국 태생 기업으로 애플, 구글, MS가 익명 처리된 데이터를 활용하여 감염병 확산에 대응하겠다고 한 목소리를 내게 된 데에는, 한국 사례가 분명히 기여했을 것이다. 미국의 공공 부문이 대응 방안을 놓고 갈등을 일으키는 동안*, ‘문제에 대응하기 위한 판단 근거’로서 데이터가 어떻게 활용될 수 있는지를 가장 잘 알고 있는 실리콘밸리 공룡들이 빠르게 반응한 것이다.

기업과 정부를 포함해서, 어떤 목표를 지닌 조직의 의사결정 과정을 요약하면 세 단계로 볼 수 있다. 그것은 판단, 의사결정, 행동이다. 행동 결과는 다시 판단의 근거가 되어 피드백 고리를 이룬다. 주커버그의 발언에서처럼 이러한 의사결정 구조에 ‘빅데이터’가 추가된 것이 최근의 흐름이다.

데이터를 대규모로 수집할 수 있었던 것은 과거에는 정부뿐이었다. 국가는 대규모 데이터 수집에 필요한 가용 인력과 권한, 접근성을 가진 유일한 조직이었다. 그러다가 기업이 디지털 기술을 활용해 기업 데이터를 수집하기 시작했다. 그러나 기업 데이터가 수백억 건이 쌓여 있어도, 이를 한눈에 처리하고 관리할 수 있는 기술이 등장하기 전에는 무용지물이었다. 지금도 많은 기업들은 시장에 공개된 거시 지표 몇 가지만을 활용해서 의사결정을 하고 있다.

미국 인구조사(US Census)는 대표적인 빅데이터 수집 사례로, 국가 행정력을 총동원하여 전국 인구 정보를 조사했다. 사진은 1940년대 인구조사 풍경. / 미국 인구조사국

그러다가 창업 단계에서부터 데이터를 디지털 형태로 수집하고 정리하고, 가공하는 기업들이 나타나기 시작했다. 기술의 발전은 적게는 수백 명에서 많게는 수 억 명의 활동 기록을 분석하고 이를 바탕으로 행동을 예측하는 데에까지 이르렀다. 특히 기업들은 이를 바탕으로 매출을 예측하고 상품을 개발하고 있다. 이러한 추세가 도드라지면서, 데이터 중심의 기업활동과 이것을 위한 조직 구조 개편을 ‘디지털 트랜스포메이션’이라고 부르고 있다.

데이터 중요성을 아는 대기업들의 전사 ERP 도입

기업이 보유한 자체 데이터 중 가장 기본이 되는 것은 무엇일까? 다양한 의견이 있을 수 있겠지만 가장 확실한 지점은 ‘보유 자산’일 것이다. 기업 활동의 범위는 그 조직의 역량에 달려 있다. 그리고 역량은 결국 보유한 자원에 따라 결정될 가능성이 크다.

조직의 규모가 클수록 기업 자원 관리(Enterprise Resource Planning)가 어려워진다. 자원의 관리란 결국 어떤 자원이 있는지 파악하고 이를 분배하는 방식을 결정하는 것을 의미한다. 여러 계열사를 거느리는 기업집단이라면 이를 하나의 팀이 모두 처리하는 것이 불가능할 정도로 자원에 관한 정보가 넘쳐나게 된다. 그래서 이에 대응하는 전통적인 방식은 담당 조직이 관리할 수 있는 규모로 정보의 크기를 줄이거나, 범주를 정하거나, 정보의 해상도를 낮추는 것이었다.

무작위 다형 딥러닝 알고리즘 모식도, 기업 데이터 보유 기업들의 전사 ERP 도입

무작위 다형 딥러닝 알고리즘 모식도. AI가 학습을 통해 입력층과 출력층 간 은폐된 중간층을 형성하는 것이 딥러닝의 특징이다. / Kamy kowsari, CC BY -SA 4.0

그러나 인간이 이해할 수 있는 범위를 넘어서는 데이터의 처리가 가능해지면서 대규모 기업집단은 디지털 기반의 전사 ERP를 당연히 갖추게 되었다. 삼성전자는 2010년에 글로벌 ERP를 구축했고, 현대 및 기아차는 최근 클라우드, 즉 온라인 DB상의 ERP 도입을 결정했다.* SK하이닉스, 우리금융그룹도 자체적으로 관련 정보를 다룰 수 있는 시스템을 갖출 예정이고, LG CNS는 아예 인공지능을 활용한 ERP 플랫폼을 만들어 사내 직원들이 이용하고 있다.

대기업들이 전사 ERP를 도입하는 것은 정보가 많기 때문이다. 그러나 정보의 많고 적음은 겉으로 드러난 부분이고, 결국 자원의 효율적 관리를 데이터 수준에서 하기 위한 것이 디지털 기반 ERP 구축의 목적이다.

그렇게 본다면, 정보 기반의 기업 자원 관리는 대기업들만 할 수 있거나, 혹은 그에 준하는 규모를 갖춘 조직만의 선택이라고 볼 수 없다. 자원의 효율적 관리는 모든 기업들의 관심사로, 효율적인 자원 활용은 기업의 생존 기간과 매출 개선을 보장한다.

디지털 ERP 시스템은 데이터 기반의 기업활동의 한 사례로, 이것이 디지털 트랜스포메이션의 전부는 아니다. ERP의 디지털화는 그러한 추세 가운데 나타난 현상으로, 핵심은 데이터를 활용한 기업 활동이다.

데이터 활용 전략 수립의 사례

대규모 온라인 공개 교육(무크 MOOC, Massive Open Online Course) 프로그램의 문제점 가운데 하나는 낮은 이수율이다. 평균적으로 수강생의 10%만이 교육을 끝마친다.* 300억 원이 쓰인 평생교육진흥원 산하의 한국형 온라인 공개강좌(K-MOOC) 역시 같은 문제를 겪고 있다.*

기업 데이터 기반 전략 수립의 사례, 무크 MOOC, Massive Open Online Course

K-MOOC에서는 거의 모든 주제의 온라인 공개강좌를 제공한다. 수강생의 학습 이수율을 올리는 것은 온라인 공개강좌 서비스들의 공통 과제다. / K-MOOC 캡처

엘리스는 카이스트의 의무교육과정인 프로그래밍 기초 강좌의 운영과 관리를 위한 연구 프로젝트로 출발했다. 따라서 모든 학습자가 반드시 과정을 완수하는 데에 주안점을 두고, 이러한 목표달성을 위한 데이터 활용을 적극적으로 하고 있다. 예를 들면, 엘리스 플랫폼 내에서 코딩 실습을 수행하는 학습자들의 활동을 데이터화하여 성취도를 예측한다. 매출이나 자원 같은 유형의 대상이 아니라, ‘학습’과 ‘성취도’라는 인지적 변화를 관리 대상으로 삼는 것이다.

학습자들의 활동 데이터를 활용하여 성취도를 예측하는 카이스트 기초 프로그래밍 과목 대시보드

온라인 진행 중인 카이스트 기초 프로그래밍 과목. 수업 조교들은 붉은 원 안의 낮은 EPS를 나타내는 학생들의 학습을 적극적으로 지원한다. / 엘리스 캡처 화면

이렇게 예측한 성취도 점수(EPS, Elice Performance Score)는 수업 조교, 교육 담당자, 교수 등 교육 프로그램을 운영하고 관리하는 사람들에게 제공된다. 성취도 예측 점수는 말 그대로 ‘예측’ 점수로, 성적표가 아니다.

대학에서 10단원으로 이루어진 자율수강 수업을 진행한다면, 해당 수업의 조교는 1단원 학습이 끝난 후 EPS가 낮게 나온 학습자들의 추가적인 교육적 지원활동을 벌일 수 있다. 실습 내용을 살펴보거나, 상담을 진행하는 것은 그 구체적인 방법들이다.

수업 상황에서 수집할 데이터가 있을까? 어떤 상황에서 추출하려는 정보를 설명할 수 있다면, 필요한 기술은 분명히 존재한다. / Motoko C. K., CC BY-SA 3.0

교수자와 학습자가 물리적으로 단절된 온라인 환경에서는 교수자가 언제 어떻게 개입할지 판단하기가 아주 어렵다. 그럼에도 불구하고 온라인 학습과 원격 교육에 관한 최근의 연구들은, 온라인 학습환경에서 학생의 참여와 성취 수준에 가장 큰 영향을 미치는 것은—오프라인 교육에서와 마찬가지로—교사를 포함한 학습 조력자의 시의적절한 개입이라는 점을 분명히 밝히고 있다. EPS의 기능은 교수자들에게 이러한 ‘개입’이 필요한 학생이 누구인지를 적절한 타이밍에 알려주는 것이다.

조교들이 매 단원 학습이 끝난 뒤에 전체 수강생들의 EPS를 살펴보면서 학습지원활동을 지속한다면, 학습자들의 전반적인 예측 성취도는 점차 높아진다. 그리고 10단원이 모두 종료되었을 때, 실제 성취도 그래프의 모양은 변화한 EPS 그래프와 거의 같은 모습을 띄게 된다.

디지털 트랜스포메이션의 첫 걸음: 목적을 알고, 그에 맞는 데이터를 찾자

금융 관련 기업의 ‘챗봇’ 도입은* 엘리스의 ESP와 유사한 고객관리 방법이다. 챗봇이란, 쉽게 말하면 인공지능을 통한 고객상담 방식이다. 카카오톡을 비롯해서 다양한 고객응대 서비스를 통해, 고객들이 흔히 문의하는 내용에 대해서 미리 답변과 안내 사항을 정리해서, 상황에 맞게 제공하는 것이다.

챗봇 자체를 활용하는 기업은 많아졌지만, 과연 각 기업의 상황에 맞는 내부 데이터 활용이 이루어지는가? 혹은 어떤 데이터가 활용될 수 있는가? / pxhere

이때 제공되는 답변과 안내 사항은, 기존의 고객 문의 사항을 분류하고 정리한 사내 데이터가 활용된다. 접근 가능한 기술은 다양할 수 있다. 그러나 각 기업별로 고객의 성향과 활동은 다를 수 있고 이에 맞는 솔루션을 제공할 수 있는 주체는 그 기업에서 일하는 임직원뿐이다. 결국 디지털 트랜스포메이션의 방법이 무엇이든지, 그 출발점은 외부가 아닌 내부일 수밖에 없는 것이다.

이처럼 데이터의 활용은 명시적인 자원관리, 생산과 같은 영역에 한정되지 않는다. 어떤 활동의 목적을 인지하고, 목적 달성에 필요한 데이터의 존재 여부 혹은 어떤 요소의 데이터화 가능성을 인지할 수 있다면 그에 필요한 기술을 활용하는 것은 부차적 문제가 된다. 빅데이터 관련 기술은 넘쳐난다. 어떤 기술을 써야 할지 모르겠다는 말은 자신에게 무슨 데이터가 필요한지, 더 나아가 행위의 목적이 데이터 차원에서 어떻게 재해석될 수 있는지를 모르겠다는 의미에 가깝다.

이어지는 글에서는 전혀 생각지도 않던 분야에서, 그러나 조금만 생각해보면 데이터 활용이 당연하다고 볼 수 있는 업무 영역과 그 사례들을 살펴본다. 지금 자신의 업무영역에서 디지털 트랜스포메이션이 가능한 영역이 무엇인지 제고하는 데에 도움이 될 내용들이다.

관련 내용 더 알아보기
👉 데이터 활용의 재발견으로 보는 디지털 트랜스포메이션 중요성