본문 바로가기

Marketing Review/2014년

지름신은 과연 어떻게 강림한 것인가?

지름신은 과연 어떻게 강림한 것인가?
 최근, 인터넷의 발달로 가장 많이 강림한 신이 있다면 당연히 지름신이다. 대학생 A양은 새 학기 들어 입을 원피스를 고르고 있었다. 며칠 동안 이 포탈사이트 저 포탈사이트를 뒤적거리던 중, 한 포털사이트에 자신이 꼭 마음에 드는 디자인의 옷이 광고에 SALE과 함께 등장했다. A양은 당연히 그 광고를 클릭했다. 그리고 쇼핑창이 뜨자마자 A양은 망설임 없이 결재를 했다. 대학생 B군은 이번 학기 복학한다. 복학하기 위해 가방을 뒤지던 중, 자신의 마음에 드는 브랜드를 찾았다. 그 브랜드 가방을 여러 사이트에서 검색하던 중, 눈이 번쩍 띠였다. 자신이 찾던 브랜드의 할인 쿠폰이 소셜커머스 광고로 뜬 것이었다. B군은 바로 그 쿠폰을 구매하였고, 쿠폰을 사용하여 자신이 사고 싶던 가방을 바로 질렀다. 다음날 A양과 B군 모두 자신의 친구들에게 지름신이 강림했다고 말한다. 과연 그 지름신은 우연히 그곳에 강림한 것일까?

 

데이터 마이닝이 빚어낸 신, 지름신
 위에 나타난 지름신은 초자연적인 존재가 아니다. 그 지름신은 현대 데이터 마이닝이 만들어낸 존재이다. 우리가 포털사이트에서 검색하는 것, 우리가 들어가는 사이트, 클릭한 기사로부터 이미지까지 이 모든 것은 우리의 관심사를 반영한다. 그리고 인터넷 브라우저에는 쿠키라는 것이 존재한다. 이 쿠키는 이러한 모든 정보를 저장한다. 이 쿠키가 지름신의 정체이다. 예를 들면 내가 옷이라는 단어를 포탈 사이트에 검색하면, 20대를 위한 옷을 파는 남성 옷 전문 사이트들이 가장 위에 링크되어 있다. 그 밑에는 신촌 근처 매장들이 소개되어 있다. 쿠키를 통해 포털사이트는 내가 20대의 남성이며, 신촌에 거주하고 있다는 것을 파악하고 있는 것이다. 이 쿠키가 지름신을 강림하게 한 내 컴퓨터 내의 지름신 신전이다.

데이터 마이닝의 과정
 데이터마이닝은 크게 추출, 전처리, 변환, 데이터마이닝, 해석/평가의 다섯 가지 과정으로 나뉜다. 데이터마이닝이 기반으로 하는 데이터는 매우 크다. 이 전부의 데이터를 분석하는 것은 시간과 비용 면에서 비효율적일뿐더러 가끔은 불가능하기도 하다. 예를 들어, 네이버와 같은 포털사이트에서 최근 20대의 옷의 트렌드를 예측하기 위해서 이제까지 쿠키들이 보내온 검색한 모든 검색어를 전부 조사하는 것은 심각한 비효율성을 낫는다. 이제까지 전체 사용자가 검색한 모든 데이터의 경우 너무 이전의 데이터는 이미 낡은 데이터라 최근 경향을 반영하기 힘들고, 그 양 또한 어마어마하다.(네이버에서는 초당 수 천 건의 검색어를 처리한다.) 때문에 이 중에서 관심 있는 집단, 혹은 전체 데이터를 대표할 수 있는 집단을 추출해내는 데 시간 혹은 집단 별로 구분한다. 이 경우 최근 1-2개월 간 20대의 여성 혹은 남성이 검색한 단어로 압축할 수 있다. 이렇게 목표 데이터를 추출한 다음에는 이를 시간의 프레임에 따라 혹은 집합의 특성에 따라 구분하고 분할하는 데 이를 전 처리라고 한다. 20대 중 초, 중, 후반 대로, 다시 이를 남성과 여성, 그리고 검색한 시간대 별로 나누는 것이 이러한 전처리 과정이다. 그 이후 뚜렷한 경향성을 나타낼 수 있도록 자료를 변환하고, 모델을 만들어 이를 해석하는 데 이 과정을 세부적으로 데이터마이닝이라 칭한다. 이 데이터마이닝 과정은 뱡향성이나 경향성을 추정하는 데에 있어서 전문적인 지식이 필요하므로 이 과정부터 데이터마이닝 전문가들이 본격적으로 투입된다. 마지막 해석과 평가는 회사 임원진 혹은 최종의사결정권자에 의해 이뤄진다. 그 과정을 그림으로 나타내면 아래와 같다. 마지막으로 이 모든 과정이 끝나면, 그 결과를 반영하여 다시 데이터마이닝을 시작한다. 즉, 데이터마이닝은 일회성의 기계적인 시행이 아니라, 완전한 정보를 얻어낼 때까지 계속적인 반복이 이뤄진다.

 

 

데이터 마이닝과 마케팅
 기존의 마케팅은 불특정 다수를 대상으로 하는 경우가 많았다. 그렇기에 TV광고의 경우 프로그램의 종류, 방송 시간대, 방송국의 성향 등을 고려하여 타켓팅한 고객에 접근하기 위해 광고를 편성하였다. 그러나 컴퓨터는 지극히 개인적, 혹은 2-3명이 사용하는 매체이다. 인터넷을 통한 광고는 개인에게 맞춤형 광고를 제공할 수 있다. 개인의 구매력과 취향을 완전히 파악하고 있는 쿠키는 우리에게 맞춰진 세부적이고 구매욕구를 간질거리게 하는 광고를 보낼 수 있다. 즉, 이전의 마케팅이 특정 고객 집단의 취향과 경향성을 예측하여 마케팅을 했다면, 데이터마이닝을 통한 마케팅은 취향과 경향성을 정확히 파악하여 마케팅을 한다는 차이가 있다. 뱅크 오브 아메리카(BOA)의 주택담보대출에 관한 마케팅 사례를 보면, BOA는 처음 주택담보대출이 필요한 집단을 다음과 같이 추측하였다.
    - 대학에 진학할 자녀를 둔 고객들
    - 수입이 많으나 변동성이 커, 수입의 변동을 상쇄하기 위한 고객들
 이러한 추측은 매우 설득적이지만, 이를 기반으로 한 주택담보대출 홍보의 응답률은 0.7%에 불과하였다. BOA는 이 문제를 해결하기 위하여 데이터마이닝 기술을 도입하였다. BOA는 NCR/teradata회사에 강력한 데이터베이스를 구축해 놓았는데, 이 데이터는 1914년까지 거슬러 올라가는 데이터를 비롯한 수백만의 고객 데이터가 저장되어 있었으며 인구통계학적인 필드를 포함하여 약 250개의 필드를 보유하고 있었다. 이를 기반으로 데이터마이닝을 통해 14개의 군집을 형성하였는데, 이 중 한 군집의 데이터가 흥미로웠다. 그 군집은 다음과 같은 속성을 가지고 있었다.
    - 이 군입에 속한 고객의 39%가 개인 계좌와 사업자 계좌를 동시에 가지고 있다.
    - 의사결정나무에 의해 주택담보대출에 응답할 가능성이 높은 고객으로 분류된 고객 중의 1/4 이상이 이 군집에 속한다.
 이 결과를 바탕으로 BOA는 사업을 시작하는 고객이 주택담보대출을 필요로 한다는 가정을 세웠고, ‘사업을 시작한다면, 대출을 이용하시겠습니까?’라는 설문을 하여 이 가설에 긍정적인 결과를 얻었다. 그리고 이를 바탕으로 새로이 홍보를 하였을 때, 응답률이 기존의 0.7%에서 7%로 경이로운 성장을 하였다. 이렇듯 데이터마이닝은 단순한 ‘설득적인’ 추정이 아닌, 직접적인 검증이 가능하게 해 줌으로써 마케팅을 하는 데 새로운 통찰력을 제공하는 도구로 사용되고 있다.

 

데이터 마이닝의 선구자, 구글
 구글의 확장력이 무시무시하다. 하나의 검색 사이트로 시작한 구글이 마이크로소프트의 인터넷 익스플로러에 대항하는 크롬을 내놓고, 스마트폰을 통해 세상을 뒤흔든 아이폰의 IOS에 맞서는 안드로이트 OS를 내놓았다. 점차 IT시장에 판도는 변하지만 구글의 영향력은 점점 증가해나가고 있다. 구글이 이토록 표준 시스템에 점차 도전하는 이유는 무엇일까? 이유는 간단하다. 개개인의 정보를 장악하기 위해서이다. 인터넷 사용자들이 크롬을 이용하면서 검색하고 클릭하는 정보들은 고스란히 구글에게 입력된다. 그러나 이러한 인터넷은 공용기기나 가정용 PC에는 다수의 사람이 사용한다는 단점이 있다. 그래서 뛰어든 시장이 핸드폰 OS이다. 스마트폰은 지극히 개인적인 장비다. 이러한 스마트폰의 OS를 장악하므로써 구글은 개인의 신상정보, 인터넷 정보, 심지어 위치정보까지도 알 수 있다. 이러한 개인의 세세한 정보를 분석하여 내놓는 광고의 효과는 가히 엄청나다고 할 수 있다. 구글은 이러한 데이터 마이닝을 통한 마케팅의 첨단에 서있고, 이를 통해 IT업계의 선구자 자리를 지키고 있는 것이다.


전지전능한 신, 데이터마이닝을 과연 기업이 소유해도 되는 것인가?
 구글과 같이 개인의 정보를 마구잡이로 수집하는 기업들에 대해, 개인정보침해에 대한 우려의 목소리를 낼 수 있다. 그러나 조금만 더 들어가보면, 기업들이 이 부분에 상당한 신경을 쓰고 있다는 것을 알 수 있다. 예를 들어 세이프웨이(Safeway)는 미국의 대형마트 체인은 데이터마이닝을 통해 자신을 정보 브로커로 만든 첫 미국의 대형마트 체인이다. 세이프웨이는 POS기를 통해 전체 물건의 판매는 파악할 수 있지만, 이를 고객과 연결할 수는 없었다. 이에 세이프웨이는 멤버십 카드를 이용에 다양한 혜택을 줌으로써 멤버쉽카드 사용에 동의한 고객들에게 자발적인 개인정보 노출 동의를 얻었다. 물론, 세이프웨이는 수집된 고객정보를 안전하게 다루겠다는 약속을 고객에게 하였고, 이를 준수한다. 개별정보에 집착하기 보다는 이 개별정보들을 전체적으로 분석하여 종합적인 패턴(잘 팔리는 진열 혹은 인기상품 분석)에 신경을 쓴다. 이렇게 알아낸 패턴을 제공할 때에도 개별고객의 정보를 넘기는 것이 아니라, 특정 제품 공급사에게 제품을 살 가능성이 높은 고객에 대한 접근을 판다. 세이프웨이는 원하는 고객에 대한 쿠폰, 홍보물과 같은 접근 혹은 진열의 우선적 배열과 같은 접근을 원하는 공급자에게 사람 당 몇 센트의 대가를 팔고 이를 직접 실행한다. 개별고객의 정보를 넘기는 것이 아닌, 그들에 대한 접근을 제공하는 것이다. 이 과정에서 쿠폰의 사용률 또한 POS기에 찍히므로 정확한 반응률이 기록되고, 다시 데이터마이닝에 활용된다. 그러니, 필자는 함부로 인터넷 익스프로러 팝업창의 ‘예’를 누르지 않기를 권한다. 엑티브-X나 쿠키가 당신의 정보를 수집하는 근거는 그 곳에 있다.

데이터 마이닝, 마케팅의 금 캐기
 마케팅의 기초는 고객의 니즈를 알아내는 것이다. 데이터 마이닝은 개개인의 고객의 니즈를 정확히 알아내고 이를 통해 고객의 구매 충동을 자극하고 있다. 개개인의 취향, 구매력, 위치, 나이 등의 데이터를 속속들이 파악하고 고객의 지갑에서 돈을 캐내고 있는 셈이다. 마케팅에서 개인화는 존재하는 개념이었다. 그러나, 그 대상이 개인 맞춤형 서비스 비용을 감당할 수 있는 구매력이 높은 고객을 대상으로만 이루어졌었다. 데이터 마이닝은 이러한 한계를 극복하여 전 고객을 대상으로 개인 맞춤형 마케팅 모델을 만들어 가고 있다. 데이터 마이닝을 통해 마케팅의 판도가 새로이 짜이고 있다. 마케팅을 알아가는 입장에서 개인적으로 이 경향은 매우 중요하다고 볼 수 있다. 이제부터 마케팅은 추론에 의한 상상력은 필요로 하지 않는다. 마케팅의 난관에 부딪쳤을 때, 그 문제를 ‘한 번 이렇게 풀어나가면 되지 않을까?’라는 식의 마케팅 전략은 더 이상 의미가 없다. 이제는 데이터마이닝이 제안하고 우리가 결정하는 시대가 왔다.