낭만적(?) 일상/책과 영화

데이터 분석을 한다면 꼭 봐야하는 책, '데이터 브랜딩'

Soo♥JJeong 2021. 12. 12. 21:51

 

 

요즘은 많은 사람들이 데이터분석가를 꿈꾸고, 회사에서도 데이터분석/활용에 대한 니즈가 많다. 사실 데이터와 분석은 문제를 해결하는 '도구'의 하나일 뿐인데, 그 자체가 목적이 되는 경우가 많은 것 같다. 이런 사람들에게 추천해주고 싶은 책. '데이터브랜딩'이다. 

 

 

#1.

데이터사이언티스트 멘토링1일차. 이전 프로젝트 최우수상 팀이 나에게 코드를 보여주며 다음과 같이 말을 걸었다. 

최우수팀 : 이 정도면 현업에서 어느 정도인가요?

나 : 어떤 문제를 해결하기 위해 분석을 했고, 이 분석을 통해 여러분들이 찾은 인사이트는 무엇인가요? 

최우수팀 : ... 저희는 그냥 분석을 했어요. 현업에서 이 정도 코드를 쓰면 잘쓰는 것인지 궁금해서 여쭤보려고 합니다. 

나 : 어떤 것을 하려고 하는지 정의가 안되어있는데, 코드만 보고 잘했는지를 판단할 수 있을까요? 

 

#2.

친한 옆팀 K대리의 메신저. (오랜만에 업무 대화, 맨날 커피나 점심 먹으러 가자고 하는게 대부분인 사이) 

K대리 : 과장님, 우리회사에 XX데이터가 있나요? 

나 : XXXX 기준으로는 있어요. 근데 그걸 XX데이터라고 할 수 있을지 모르겠네요. 어떤 것을 해보려고요?

K대리 : 음.. 어떤 조사, 분석을 할지는 모르겠는데, 일단 회사 내에 있는 데이터를 파악해보라고 하네요. XX데이터가 있다고 들은거같아서 여쭤봤어요 ^^;; 

나(혼잣말) : 문제가 없는데 솔루션을 가져오라니, 참 난감하다.. 개떡같이 일을 시키면, 개떡같이 할 수밖에. 

 

책에 어떤 부분을 데이터 분석가를 꿈꾸는 사람들이나, 데이터 분석을 지시하는 사람들에게 보여주고 싶은 부분을 블로그에 담아본다. 누군가 나에게 일을 개떡같이 시키면, 이 링크를 보내줘야지. 

 


Data-Driven 데이터에 근거한다는 것에 관하여

데이터에 근거한다는 말은 데이터를 중심으로 선택하고 판단하여 의사결정한다는 것이지, 모든 것을 데이터에 의존한다는 뜻이 아닐 겁니다. 비즈니스 의사결정이 올바르게 되고 있는지 데이터로 검증하려는 것일겁니다. 

 

특정상황에서 가장 좋은 선택은 결국 인간적인 판단에 근거해야한다는 것이죠. 데이터에 근거해야하는 것은 맞지만 결국 판단은 사람이 해야합니다. 데이터에 근거하더라도 그 데이터를 가지고 자유롭게 사고할 수 있어야 합니다. 

 

우리는 '데이터 위에서'가 아니라 '데이터 사고위에서' 판단해야합니다.

우리는 데이터 그 자체가 아니라 진짜 사람들이 숨 쉬는 삶의 콘텍스트를 넘나들며 분석하고 전략화해야합니다. 

데이터 시대에 우리는 데이터를 주도해야합니다. 데이터를 가지고 놀아야 합니다.

숫자에 목소리를 부여해야하고, 데이터 그 자체가 아닌 우리의 해석을 통해서 그 의미를 규정해야합니다. 

 

"데이터는 스스로 말하지 않는다"

데이터는 객관적이지 않습니다. 데이터가 객관적이라는 것은 허구와 환상에 불과합니다. 데이터 분석은 말 그대로 주관이 내포되어 있습니다. 이 과정에서 데이터는 개인의 주관이 반영되어 필요없는 것은 걸러지기 마련입니다. 

 

Point of View : 데이터를 보는 관점이 먼저

우리는 무턱대고 분석부터 합니다. '데이터'부터 보는 것이죠. 하지만 데이터보다 '관점'이 먼저입니다. 생각과 판단이 먼저 이루어져야 합니다. 똑같은 데이터라 하더라도 관점에 따라 결과가 다르게 보입니다. 이 관점으로 가설을 수립하고 검증해보는 것이 데이터입니다. 단적으로, 데이터 분석은 가설검증과정입니다. 

 

(...) 여기서 중요한 것이 이에 대해 우리가 가진 '생각의 폭과 깊이' 입니다. 가설에 대한 생각의 폭과 깊이에 따라 분석의 결과물이 달라집니다. 데이터 분석을 통해 얻어진 결과의 질은 분석 이전에 수립한 가설의 수준에 따라 결정됩니다. 

 

 

사례1. 프랑스 쥐 출몰 사건 

프랑스에서는 도처에 출몰하는 쥐 때문에 골머리를 앓다가 '쥐를 잡아서 꼬리를 가져오면 그 숫자대로 포상금을 주겠다'고 선포, 정부 청사앞에 산더미처럼 쌓인 쥐 꼬리를 모아 성과를 보여주었음. 하지만 오히려 쥐가 더 많아짐.

→ 쥐를 잡아오면 돈을 준다는 소식에 주민들이 쥐를 사육하기 시작한 것. 

 

 ■ 진짜 문제 해결과정 

    - 드러난 문제 : 도처에서 쥐가 출몰

    - 진짜 문제 : 하수구의 오물

    - 데이터 분석 : 오염 여부 및 쥐 출몰과의 연관성

    - 근본적 솔루션 : 하수구 시설 개선

 

미봉책으로 쥐를 잡아서 박멸하는 것은 현상을 그냥 그대로 본 것이고, 하수구 시설을 개선한 것은 가설을 수립하고 데이터에 근거해 근본적 해결책을 제시한 진짜 문제 해결 과정인 것이죠. 이렇듯, 데이터 분석이 먼저가 아니고 관점이 먼저입니다. 관점을 가지고 자기만의 가설을 수립해야합니다. 데이터는 그것을 검증하는 도구일 뿐입니다. 

 

 

사례2. 1985년 런던 콜레라 창궐 사건

사람들은 콜레라가 전염되는 원인을 나쁜 공기나 악취때문이라고 생각했음.

하지만 '존 스노우'는 공기로 전염된다는 생각에 의문을 품음. 콜레라 발병 위치의 패턴을 보니, 급수펌프가 있는 지점과 일치 

→ 사람들의 편견과 달리 오염된 물로 전파된다는 생각을 가지고 발병 위치를 분석함. 

 

 

아인슈타인은 문제 해결을 두고 다음과 같이 얘기합니다.

"문제를 해결하는 1시간이 있고 그 해결책에 내 인생이 걸려있다면 나는 가장 적합한 질문을 찾는데 55분을 쓸 것이다. 일단 적절한 질문을 알아낸다면 문제해결에는 5분도 걸리지 않는다." 

 

문제가 바뀌지 않으면, 누구나 생각하는 뻔한 답을 찾게 됩니다. 하지만 문제를 해결하는 사람은 주어진 데이터에 전전긍긍하지 않습니다. 데이터부터 분석하지 않습니다. 진짜 문제를 찾습니다. 

분석 이전에 문제를 재정의 하는 것, 우리가 데이터를 분석할 때 가장 중요한 포인트입니다. 

우리가 해결해야할 진짜 문제로 가설을 재설정하는 것이죠. 데이터 분석은 거들 뿐입니다. 

 


다음 번 멘토링에서는 문제정의 없이 코드만 가져오는 멘티가 없기를. 

그리고 일을 시키는 팀장님, 상무님들도 데이터를 가져오라는 말 대신, 무엇을 할 것인지 '문제 정의'부터 제대로 해 주시기를 간절히 바래본다.