본문 바로가기

반응형

빅데이터

(2)
쓰레기 같은 데이터는 없다 "소득 수준과 교육열 높은 강남구는 책도 많이 살까. 정답은 '그렇다'이다." 예스24의 2013년 구매 이력을 분석한 결과라고 한다. 예스24의 회원이 서울시민을 대표하지 않는다. 회원을 서울시민의 분포로 표준화(?) 작업하여 분석한 것일까? 순수하게 구매 명세가 있는 회원의 분포가 우연히 강남에 많이 살고 있었던 것일까? 만일 어느 시골의 한 읍이 가장 많이 구매했다면 뭐라고 설명할까? 그저 예스24 구매 명세의 '일반화 오류'를 범한 것은 아닐까. "책 많이 사는 강남구 책 많이 읽는 3040"이라는 제목이 선정적이다. 잘 살고 교육열이 높아 책을 많이 사는 것인지, 아니면 교육열이 높고 책을 많이 사기 때문에 잘 사는 것일까. 결론적으로 내포하는 것은 잘살고 아이 잘 가르치고 싶으면 책을 많이 사..
빅데이터 시대 당신의 선택은? : 《빅데이터, 경영을 바꾸다》 최근 들어 최대 이슈로 부상한 '빅데이터'가 시대를 바꿀 새로운 트렌드가 될 수 있을까? 이름만 '빅데이터'로 바뀌었지 그전에는 데이터 마이닝이란 이름으로 여전히 우리 곁에 있었다. 그렇다면 새삼스레 빅데이터가 부상하는 이유는 무엇일까? 가트너 그룹에서는 빅데이터는 21세기의 원유이며 미래 경쟁력의 열쇠라고 주장했다. 하지만 그럴싸한 포장한 겉포장만 바꾼 신상품이 아닌가 하는 의구심이 들기도 한다. 과거부터 지속하여온 통계 분석, 데이터 마이닝, 인공지능 기술의 연장선에 있는 것도 사실이다. 빅데이터가 2~3년 유행하는 동안, 도전적인 일부 기업에서 관련 솔루션을 구매해 써보다가 별다른 효과를 보지 못하고 악평만 남긴 채 사그라져버릴지 모른다는 점을 우려도 있다. 이러한 우려도 근거 없는 게 아니다. 실..

반응형