본문 바로가기

IT/Big Data

[펌글] “빅데이터 분석, 자신감만으로 되나”

원본은 여기

그러니까, SNS데이터를 긁어온다는 것에만 중점을 두면 안된다. 활용할 수 없는 데이터가 많기 때문에.
따라서, 무엇을 분석할 지 염두하고 데이터에 접근해야한다.  지식인서비스처럼 활용하는 것이 그 예.

“빅데이터 분석, 자신감만으로 되나”
이지영 izziene@bloter.net | 2012. 01. 12

“국내 빅데이터 시장은 출발이 잘못됐다. 빅데이터를 설명할 때, 크기(Volume), 댜앙성(Variety), 속도(Velocity)가 들어가는 것은 맞다. 하지만 빅데이터 분석은 이것만 가지고는 되지 않는다. 분석을 통해서 어떠한 가치를 만들 것인지를 정하고 움직여야 하는데 국내는 그렇지 못하고 있다.”

이진권 SAS 솔루션 서비스 본부장이 빅데이터 분석 시장에 쓴소리를 내뱉었다. 벤더들이 빅데이터 분석을 도와주겠다고 덤비니까 기업들이 오히려 혼란스러워하고 있다는 것이다. 그 결과 어떻게 빅데이터 분석을 해야 할 지 감도 못 잡으면서 빅데이터를 분석하겠다고 나선 업체들이 많다고 지적했다.

SAS는 약 36년간 통계 분석에 집중해 다른 기업들보다 데이터 분석에 대한 기술과 이해도가 높은 기업 중 하나로 꼽힌다. 이진권 본부장은 이 회사에서도 분석과 관련한 베테랑이다. 그는 빅데이터에 대한 분석은 단순히 기술만 있다고 해서 해결되는게 아니라고 지적했다. 데이터 개념이 바뀌었듯이 분석에 대한 개념도 바뀌었고, 이에 맞춰 기업이 분석에 나서야 한다고 강조했다.

시간이 지나면서 데이터 정의도 많이 달라졌다. 10년 전에 나온 데이터에 대한 개념과 오늘날 우리가 알고 있는 데이터 개념은 더 이상 같지 않다. 예전에는 소셜네트워크 서비스(SNS)를 통해 발생하는 데이터가 없었다. 세월이 흐르면서 기업들이 다루는 데이터 양이 달라졌고, 종류가 달라졌고, 데이터 발생 속도도 매우 빨라졌다. 이렇게 빅데이터가 등장했다.

분석 역시 마찬가지다. 단순하게 정보를 모아서 정리하고, 처리하고, 통계를 내는 수준에서 나아가 미래를 예측하는 수준으로 성격이 바뀌고 있다. 올바른 데이터가 있으면 앞으로 어떤 일이 일어날 지, 생산라인에서 어떤 문제가 발생할 지 미리 알 수 있는 시대가 왔다. 그러나 안타깝게도 국내는 아직 빅데이터라는 재료를 가지고 예전 조리 방법으로만 요리하려고 하는 모양새다.

이진권 본부장은 “쉽게 생각해서 예전에 기업들이 데이터를 수집할 때는 회원가입을 통해서 정보를 얻고, 이 과정에서 설문을 통해 이 사람이 무엇을 좋아하는지, 기념일이 언제인지 같은 정보를 파악해 이를 분석해서 마케팅 전략을 세웠다면, 빅데이터 시대에서는 정보를 수집하는 것이 아니라 데이터 그 자체를 관찰해서 수집한다”라고 설명했다.

한 유통업체가 어떤 장소에 물건을 전시해야 판매가 잘 이뤄지는지를 알아보기 위해 고객 반응 데이터를 수집하려고 한다. 예전에는 물건을 구입하고 나온 고객에게 왜 그 물건을 샀는지, 그 물건을 어디서 샀는지 같은 질문을 통해 정보를 파악했다. 아니면 모의 실험을 통해 고객 패턴을 예상하고 이를 바탕으로 마케팅 전략을 세웠다.

지금은 다르다. 매장 곳곳에 설치돼 있는 CCTV, 더 나아가 고객의 모바일 신호를 추적해서 이 고객이 매장에 들어서자마자 왼쪽으로 갔는지 오른쪽으로 갔는지를 알 수 있다. 포인트카드를 사용하는 고객이라면 성별과 연령도 측정 가능하다. 고객은 자신도 모르는 사이 기업에게 정보를 제공하고, 기업이 이렇게 수집한 엄청난 정보를 바탕으로 마케팅 전략을 세울 수 있다.

이렇게 모아진 정보의 양과 속성 자체가 다르기 때문에 자연스레 분석 방법도 달려졌다.

이진권 본부장은 “데이터에 접근하는 자세부터가 빅데이터에서는 달라진다”라며 “기존 데이터에서는 얻을 수 없는 속성을 빅데이터에서는 얻을 수 있기 때문에 적절한 요소를 뽑아 분석하는 일이 제일 중요해진다”라고 강조했다. 이어 그는 “분석을 위해서 원하는 데이터를 적절하게 수집하는 일 역시 중요해졌다”라고 강조했다.

단순히 가지고 있는 데이터를 바탕으로 분석하려는게 아니라 분석을 하기 위해선 어떤 데이터가 필요할 지 능동적인 자세가 필요하다는 것이다. 예전처럼 한정된 공간과 시간에서 데이터를 수집하는게 아니라 SNS를 통해 한계 이상의 데이터도 수집할 수 있기 때문에 무엇을 분석할 지 염두하고 데이터에 접근해야 한다. 기업들이 이 점을 놓친채 SNS를 통한 빅데이터 분석을 하면 제대로 된 효과를 얻을 수 없다고 한다.

이진권 본부장은 “SNS데이터를 긁어온다고 해서 이것들이 데이터가 아니다”라며 “대부분 SNS상에 있는 데이터는 기업들이 활용할 수 없는 데이터들이 무수히 많다”라고 말했다. 잘 활용하면 약이지만 그렇지 못하면 독이 되는게 SNS데이터라는 것이다.

상당수 기업들이 SNS를 통한 마케팅을 하고 있다. 이에 따라 SNS상에 나온 키워드를 분석해 자사 기업이 출시한 제품에 대한 반응이 어떤지 호불호를 알아보는 요청도 빈번해지고 있다. 자사 상품 관련 트윗이 어떻게 전파되는지 궁금해 한다. 이와 같은 분석을 ‘버즈 모니터링’이라고 한다. 해당 제품과 같이 언급된 단어의 긍정, 부정, 중립 의미를 따져서 호불호를 파악한다.

이진권 본부장은 “이 분석도 좋지만 여기서 한 단계 더 나아가야 진정한 빅데이터 분석을 했다고 볼 수 있다”라고 다음과 같이 설명했다. 해외 금융사들은 SNS를 단순한 마케팅 창구로 사용하지 않는다고 한다. 고객 불만이나, 상품에 대한 궁금증을 해소할 수 있는, 예를 들면 해당 상품에 대한 지식인 서비스처럼 SNS를 운용하고 있다고 한다. 일방적으로 메시지를 날리기보다는 고객이 보내주는 트윗에 대해 해당 질문에 대해 잘 아는 담당자가 답을 보내주는 식이다.

이렇게 되면 기업은 최근 고객들이 우리 은행의 어떤 상품에 대해서 궁금증을 보내고 있고, 현재 경제 상황에 대해서 어떻게 인식하고 있는지를 자연스럽게 분리해서 파악할 수 있게 된다. 그리고 제품을 설명했을 때보다 좀 더 솔직한 고객반응을 얻을 수 있다고 한다. 이렇게 수집된 데이터는 은행 고객관계관리 정보와 맞물려 ‘A 고객은 금리 문제에 굉장히 민감하니, 금리 관련 상품을 따로 안내하면 좋겠다’라는 분석 결과를 제공할 수 있게 된다.

빅데이터에 대한 관심이 최근들어 급증한 건 사실이다. 많은 기업들이 빅데이터를 제대로 이해하겠다고 공부하고 있으며, 뭔가 새로운 가치를 빅데이터를 통해 창출할 수 있을지 고민하고 있다. 공부하고 고민하는 것, 다 좋다. 제대로만 가면 된다. 국내는 아직 빅데이터 규모를 만져본 기업이 없다는 말이 관계자들 사이에서 계속 나오고 있다. 그러면서 미래에는 빅데이터를 얼마나 잘 다룰수 있는가의 정도가 국가 경쟁력으로 작용할 것이라는 말이 나오고 있다. 빅데이터에 대한 뜨거운 관심이 올바른 분석으로 나왔으면 한다.

2008 BLOTER.NET. CC BY-NC-ND. | http://www.bloter.net/archives/91583