데이터의 재발견, 생각보다 쓸 데가 많다

엘리스2021-05-18

반병현 씨는 최근 책을 냈다. 그가 쓴 책의 제목은 《코딩하는 공익》으로, ‘쇠사슬을 차고서도 세상을 바꿀 수 있을까?’라는 다소 도발적인 부제가 달려있다. 반병현 씨는 카이스트 학부와 대학원에서 인공지능을 전공하고 안동 노동청에서 사회복무요원으로 일하다가 최근 전역했다. 여기까지 얘기하면 대체 누구냐고 생각할지도 모르겠다. 사실 반 씨는 자신의 경력보다는 6개월 걸릴 잡무를 30분 만에 끝냈다는 뉴스로 더 유명한, ‘바로 그 공익’이다.

반병현 씨가 공익근무요원 재직 당시 코딩을 활용하여 업무를 처리한 에피소드를 담은 브런치 글이 큰 화제를 모았다. / 사진은 출간 도서

6개월치를 30분 만에 끝냈다는 자극적인 제목 탓에, 사실 그가 사회복무 중에 어떤 일을 어떻게 처리했는지는 모르는 사람들이 더 많다. 그가 한 일을 한 줄로 정리하면, 등기번호 3900여 개를 우체국 홈페이지에서 조회하고 화면에 나오는 등기 내용을 인쇄하는 작업이었다. 반 씨는 이후 정부기관과 행정 현장의 지원 활동을 수행했고, 2019년 정부혁신 부문 행정안전부 장관 표창을 받았다.

반병현 씨 이야기를 들으면 “와, 대단하네”라는 감상이 절로 나온다. 그런데 혹자는 “뭘 그런 일까지”라며 거리감을 느낄지도 모르겠다.

“뭘 그런 일까지”라는 생각은 도처에 널려 있다. 그리고 바로 그 생각 때문에 아직도 많은 반복 업무들이 사람들의 소중한 시간과 조직의 생산성을 갉아먹는다. 반병현 씨가 졸업한 바로 그 학교, 카이스트도 예외는 아니었다.

학습은 컴퓨터로, 평가는 사람 손으로?

카이스트의 프로그래밍 기초 교육은 오랜 전통을 갖고 있다. 그 덕분인지 2000년대 초반 창업하여 다수의 IT기업을 이끌고 있는 기업가들은 물론이고, 최근의 스타트업 창업자들 가운데서도 카이스트 출신이 적지 않다. 2015년부터는 매 학기 400여 명, 1년 동안 800여 명의 신입생이 엘리스 플랫폼을 이용해서 CS101 프로그래밍 기초 강의를 의무 수강하고 있다.

엘리스 플랫폼의 특징 가운데 하나는 자동 채점 기능이다. 수업에서 풀게 되는 실습 문제의 경우 ‘제출’ 버튼 클릭만으로 학생에게 즉각적으로 점수가 제공된다. 물론 학생들은 더 높은 점수를 받기 위해 코드를 수정해서 제출할 수 있다. 또한 제한 시간과 응시 기한이 정해져 있는 시험 환경도 제공한다.

KAIST 전산학부 한태숙 교수의

카이스트의 프로그래밍 기초 교육 전통은 이제 50년을 바라보고 있지만, 엘리스 개발 이전에는 조교 30여 명이 학생 800명의 코드를 직접 채점했다. 학생들이 코드 파일을 게시판에 올리면 조교들이 일일이 다운받아 실행해보고 채점하는 방식이었다. 800여 명의 코드를 일일이 채점하다 보면 성적 기한을 맞추기 위해 새벽 3시가 넘도록 채점을 할 때도 있었다. 사람 일을 기계가 대신하게 하려고 컴퓨터를 배우는데, 정작 컴퓨터를 배우고 가르치는 사람들은 전통적인 방법을 고수해 온 것이다.

이로 인한 비효율은 카이스트 프로그래밍 수업 조교였던 이들이 엘리스 플랫폼을 개발하는 강력한 동기가 되었다. 엘리스의 도입으로 기존에 사람의 ‘손 채점’이 담당하고 있던 ‘기계적인’ 채점 업무가 기계의 영역으로 이전되면서, 조교들은 반복 업무를 해야 할 시간에 더 많은 학생들에게 더 좋은 피드백을 제공할 수 있게 되었다.

엘리스 솔루션의 표절 검사 기능에 대한 카드 뉴스

얼마 전 언론사 인스타그램에 엘리스를 다룬 카드 뉴스가 실렸다.

“코드를 누워서 작성했는지, 앉아서 작성했는지, 컴퓨터를 켜놓기만 했는지, 직접 고민하면서 코딩을 했는지 알 수 있다”라는 메시지에, 다수의 댓글 작성자들이 “뭘 이런 것까지?”라며 격한 반응을 보였다.

카드 뉴스에서 강조되어 학생들의 공분을 산 부분이 엘리스의 부정행위 방지 시스템인 ‘카피 디텍터’의 주요 기능은 아니지만, 이 정도의 측정이 가능한 이유는 엘리스 코드 에디터에서 학생이 작성한 코드가 1글자 단위로 기록되기 때문이다. 조교들은 학생들이 제출한 코드의 표절이 의심될 때 비슷한 코드를 작성한 사람들의 분포를 보여주는 카피 디텍터와, 1글자 단위로 기록된 학생들의 작성 이력을 비디오 돌려보듯이 살펴보면서 이 학생이 자신의 실력으로 과제를 수행했는지 아니면 기계적으로 누군가의 코드를 베꼈는지 판단한다.

카피 디텍터는 학습자 수가 많아서 검토해야 할 코드의 수가 아주 많을 때, 어떤 사람들의 코드를 우선적으로 들여다보아야 할지 힌트를 제공한다. 코드 이력을 기록한 데이터는 최종적인 판단에 필요한 학습 행위의 패턴을 복원해서 시각적으로 보여준다. 교육자들이 학습 지원 또는 평가를 진행할 때 누구를 먼저 살펴보아야 할지 우선순위를 제공한다는 점에서, 대학 실습과목에서 자주 쓰이고 있다.

엘리스 플랫폼에 내장된 카피 디텍터 실행 화면. 각각의 점은 학습자가 작성한 프로그램이고, 유사한 것들끼리 선으로 연결되어 있다.

대부분 학습자들이 작성한 코드 이력을 들여다보면, 쓰다가 지우고, 실행해서 에러가 나타나면 다시 고치고, 이를 여러 번 반복한 끝에 결과를 최종적으로 제출하는 패턴이 나타난다. 평범하지만, 가장 성장 가능성이 높은 사람들의 학습 패턴이다. 이것에서 벗어나면 타고난 실력파이거나 표절을 의심해볼 만하다.

민주당의 빅데이터 활용 사례 : ‘데이터가 있다’는 인식

얼마 전 있었던 선거 역시 “뭘 그런 것까지…”라는 말이 가장 많이 등장하는 보수적인 영역이다. 선거에 가장 크게 영향을 미치는 세 가지로 보통 구도, 인물, 돈을 꼽는다. 그런데 이제 여기에 한 가지를 보태야 할지도 모르겠다. 바로 ‘데이터’다.

21대 총선에서 큰 승리를 거둔 더불어민주당은 선거 유세에 데이터, 더 구체적으로는 통신사가 익명처리 후 제공한 전 국민의 휴대전화 이용정보를 활용했다고 알려졌다. 특히  후보들은 자신이 출마한 지역구 내에서 사람들이 많이 몰리는 지역과 시간 데이터를 가지고, 최대한 많은 유권자를 만날 수 있도록 유세 동선을 정했다.

지역구 선거는  후보가 만나는 사람들의 표가 모여 박빙의 승부를 가르기 때문에, 발로 뛰는 유세가 중요하다. 홍콩 반환 직전 치러진 마지막 입법회 선거 유세 장면 / Alix Le

여기서 중요한 것은 자신의 목적을 달성하는 데에 필요한 ‘데이터가 있다’는 사실을 인식하는 점이다. 이 점을 인식하고 있으면 상황 판단이 달라지고, 행동이 달라진다. 그리고 최종적으로는 그 행동으로 인한 결과가 달라진다.

민주당의 선거전략은 바로 이 한 가지 인식, ‘데이터가 있다’는 점을 염두에 두고 기획되었고, 후보들의 승리에 기여할 수 있는 유용한 정보가 제공되었다. 지역구 유권자 동선 정보의 활용은 앞으로의 선거에서 표준이 될 가능성이 높다.

전에는 몰랐을까?

물론 이렇게 반문해볼 수도 있다. 전에는 이런 방법을 몰랐을까? 민주당이 후보 유세에 빅데이터를 활용했다는 뉴스는 선거 직전에 나왔다. 솔직히 이건 뉴스가 아니라, ‘우리 당이 이렇게 똑똑해’하고 언론을 통해 홍보하는 사실상의 광고다.

이전 선거에서 비슷한 시도를 한 후보나 정당이 분명히 있었을 것이다. 다만 차이가 있다면 올해 초 이른바 ‘데이터 3법’의 통과로, 이번 선거에서는 정당과 기업 간의 합법적인 데이터 거래가 가능해졌다는 점이다.

이른바 ‘데이터 3법’ 통과로 합법적인 거래가 가능해진 데이터의 종류와 활용 범위 / 정책 위키

한편, 다른 정당들은 이번 선거에서 데이터를 활용하지 않았을까? 두 가지 경우가 있었다고 본다. 전략적 우위를 지키려고 (혹은 선거에서 졌기 때문에) 사용했어도 말하지 않거나, 적지 않은 인력과 자금이 필요하기 때문에 사용하지 못했을 것이다. 데이터 거래가 합법화되었지만, 선거에 영향을 미치려면 수십만, 수백만 명어치의 값비싼 데이터와, 이를 처리하고 가공하기 위한 전문 인력, 많은 시간이  필요하다.

그동안 선거에서 활용된 유세 전략은 불완전한 정보와(예 - 최근 지역구내 어딘가에 아파트 단지가 새로 생겼다), 경험에 근거한 판단(예 - 장이 서는 날에는 아침 19시에 어르신들이 많이 찾는다)이 많았을 것이다. 민주당 소속 후보들 가운데에는 데이터를 이용해서 유세 동선을 짜지 않은 사람들도 있을 것이다.

구도와 자원에서 압도적인 우위에 있었던 민주당은, 데이터의 활용으로 ‘디테일’을 추가했다. 한 표, 한 표가 모여서 당락을 가르는 지역구 선거에서는 고양이 손이라도 빌린다고 한다. 가장 보수적인 선거판이지만, 빌릴 데이터가 있다면 마다할 이유가 없다. 이쯤 되면 “뭘 그런 것까지…”가 아니라 “아니, 그런 것까지?”라는 말이 나올 법하다.

아마존은 하루아침에 굽이치지 않았다

한 끗 차이 같지만 이 두 표현 사이의 거리는 꽤나 멀다. 인식의 전환이 필요한 일이기 때문이다. 디지털 트랜스포메이션(digital transformation)이라는 말을 뜯어서 풀면, 문제 해결을 위한 사고방식을 수치(digits)로 표현 가능하게 전환(transform)한다는 의미다.

특히 이러한 사고의 전환이 조직 차원에서 이루어지려면 개인이나 특정한 팀의 노력으로는 부족하다. 디지털 도구를 사용하지만 문제 해결을 위한 접근방식이 여전히 과거 경험에 의한 추론, 즉 휴리스틱(heuristic)이라면 어떨까? 콩을 심고 팥이 나기를 기다리는 격이다.

그런 점에서 첫 글에서 언급했던 아마존의 ‘편집팀’ 사례는 흥미로운 타산지석이다. 오늘날 아마존은 갖은 수식어로도 정의하기가 어려운, 거대하고 복잡하고 비싼 기업이다. 그러나 아마존 역시 초창기에는 혁신과는 거리가 먼 지점들이 있었다. 처음 몇 년간 아마존은 크리스마스가 되면 모든 직원들이 업무를 중단하고 물류에 투입되었다. 비슷한 예로, 카카오 뱅크가 처음 문을 열었을 때 전사 직원 250여 명이 밀려드는 가입자들의 신분증 검사에 매달렸다.

아마존 창업자 베조스. 대표적인 IT 기업인 아마존에서 그는 창업 초기부터 지금까지, 보고서 작성은 완성된 문장으로 된 1페이지 정도의 ‘글’로 내라고 지시한다. / flickr

우리가 디지털 기업, IT기업이라고 부르는 회사들 가운데에는 그냥 물류나 유통, 제조사였던 기업들도 많다. 차이가 있다면 그들은 변화에 부응하여, 휴리스틱에 근거한 접근방식을 가만히 내버려 두지 않고 끊임없이 개선했다는 사실이다. 유통과 판매라는 거대한 산업부문의 흐름을 뒤바꿔버린 아마존의 물줄기는 하루아침에 굽이치지 않았다.

성공적인 디지털 기업들의 전환, 개선의 근본 동력은 어디서 나올까? 다음 글에서는 콩이 아닌 팥을 심는 법, 조직적 차원의 디지털 전환에 무엇이 필요한지를 알아본다.

  • #insight
  • #tech
실습형 플랫폼으로 임직원 디지털 전환 교육에 성공하세요

DX교육은 엘리스

입력해주신 이메일은 회사소개서 발송에만 활용됩니다