본문 바로가기
어바웃성키

데이터 분석가가 고객과 소통하는 법

by sungkee 2022. 12. 19.
반응형

회사에서 작년 9월부터 프로세스 시뮬레이션 서비스를 개발했다. 올해 2월에 처음으로 한림대병원의 데이터를 활용해서 서비스를 적용해봤고, 그 이후로는 지난 달 PoC를 했던 교보생명이 두 번째 고객이었다. 실제 고객의 데이터를 직접 분석하고, 고객과 소통하는 과정은 상당히 값진 경험이었다. 구체적인 고객의 니즈를 파악함으로써 솔루션의 한계점을 보완할 수 있기 때문이다. 이제 내년부터는 본격적으로 다양한 고객에 서비스를 제공할 예정이다. 그리고 고객사로 파견을 나가 직접 고객을 응대하는 상황이 많이 생길 것이다. 그래서 이번 경험으로부터 배운 것을 정리하여 기록해본다. 

 

1) 고객은 모르는 게 많다. 이해하기 쉽게 설명해야 한다.

고객은 통계와 데이터에 대해 나보다 지식이 부족하다. 그것은 당연한 일이다. 고객은 모두 문과생 출신들이고 업무에 데이터를 활용한 경험이 매우 적기 때문이다. 특히 프로세스 시뮬레이션은 일부 데이터 분석가들에게도 생소한 분야이다. 그럼에도 나는 고객의 수준에 맞춰 설명할 수 있어야 한다. 시뮬레이션이 무엇인지 쉬운 예시와 함께 도식화하여 설명한다. 질문을 회피하지 않는다. 바로 답변하기 어려운 질문에는 따로 확인하고나서 공유한다. 그리고 그들의 시뮬레이션에 대한 오해를 바로잡아 주어야 한다. 예를 들어, "그냥 데이터만 넣으면 나오는 거 아닌가요?"라는 식의 쉽게 생각하는 마인드를 싹 고쳐놔야 한다. 현실적인 한계를 언급하고 그 안에서 시뮬레이션으로 할 수 있는 영역이 무엇인지 정확히 알려주어야 한다. 

 

2) 데이터에 대한 고객과 분석가의 생각이 일치해야 한다. 

데이터베이스에는 온갖 데이터가 쌓여있다. 그 중 우리의 분석 대상과 목적에 맞는 데이터만 추출할 수 있어야 하는데, 그 과정에서 고객과 생각이 일치해야 한다. 그렇지 않으면 고객이 분석 결과를 납득할 수 없는 상황이 온다. 이런 경우 데이터 전처리 과정을 수정하고 분석 결과를 처음부터 다시 도출해야 하는 불상사가 발생한다. 효율적으로 일을 하려면, 데이터 추출 및 전처리 단계에서부터 고객과 구체적인 협의를 통해 사용할 데이터를 결정해야 한다.

 

3) 평균을 맹신하면 안된다. 중앙값을 반드시 활용하자.

대부분의 데이터는 정규분포 같이 평균을 중심으로 대칭적인 아주 예쁜 모양이 아니다. 그래서 평균은 대체로 데이터 전체를 대변하기 어렵다. 그런데 평균값만 언급하면 고객은 분석 결과에 대해 의문을 가지게 될 가능성이 높다. 예를 들어, 어떤 업무에 대하여 현업이 파악하는 소요시간이 대략 10분이라고 하자. 그러나 데이터 분석 결과로는 평균 소요시간이 1시간으로 나올 수 있다. 그 이유는 대부분의 작업이 10분 내외에 완료됐음에도 불구하고, 일부의 데이터가 아주 긴 소요시간을 가졌기 때문이다. 이런 경우, 보통 중앙값을 사용하면 평균을 사용했을 때보다 10분과 가까운 수치를 얻을 수 있다.

 

 

 

반응형

댓글