엑셀 실무자 교육을 하게되었다. 한동안 엑셀에 대한 교육(?)이나 나 자신의 활용이 떨어지기에 무엇을 가지고 교육을 할것인지 또 어떤 것으로 활용도를 넓힌 것인지에 대하여 고민하였다.
엑셀을 교육해 보면 활용도 측면이 많이 떨어짐을 알 수 있다. 오류(데이타 상의 오류가 아니라 잘못된 집계 또는 거기에 따른 작업의 오류)로 인하여 전혀 다른 결과치를 내놓게 되는 경우가 허다하다.
데이타의 비교란 같은 조건을 주어야 함에도 불구하고 눈에 보이는 것으로 판단하려 한다. 이러한 오류의 발생을 줄이는 것이고 검증을 효율적으로 할 수 있게 함이 그 목적이다.
기존 데이터를 주고 분석하는 것은 데이터를 어떻게 볼 것이냐는 문제이니 작성자의 관점이나 상황에 따라 각기 다른 결과치가 나오게 된다. 그것은 다른 과정에서 토론과 논의를 거쳐 각기 다른 관점이 나온 이유에 말하여야 한다.
실무교육의 목적은 원하는 데이터를 추출하는 기술을 알려주기 위함이다. 하여 웹에 있는 데이터를 각기 추출하여 비교 분석하는 과정을 하기로 하였다.
블로그코리아이 TOP130과 랭킹과의 상관관계
블로그코리아를 보면 TOP130과 랭킹이 있다. 이 둘의 상관관계를 알아보기로 하였다. 전제조건은 TOP130은 월별 순위이고 랭킹은 매일 변한다. 이에 랭킹 150위까지와의 상관을 비교하는 것으로 하였다. 각기 데이터는 8월2일 기준이다.
카테고리 서비스 안내 (1) 카테고리란?을 보면 블코의 카테고리 정책을 자세히 알 수 있다. 카테고리는 어떻게 분류되나에서는 "각 포스트의 태그를 기반으로 자동으로 카테고리 분류"함이 자세하게 나와있다.
카테고리 분류의 정책은 블코의 정책이고 또 자동분류이기에 블로거들의 의도와 다르게 분류될 수 있다. 하지만 최대한 유사한 카테고리로 분류하려는 의지가 보인다. 자동분류의 오류를 최소하하기 위하여 마이페이지에서 태그/카테고리 수정하기를 두고 있다. 카테고리 미분류 글에 대한 참여를 요청하고 있다.
웹에서 데이터를 모아 원하는 상태로 잘라내고 두가지 데이터를 한 시트로 묶어야 한다. 여러차례의 작업을 거치면 - 물론 DB에서 바로 자료를 받았다면 필요없는 작업이다. 하지만 교육의 목적이 있기에.. - 아래와 같은 요약으로 나올 수 있다.
블로그코리아의 카테고리는 지금까지의 블로그스피어의 랭킹에 의한 상위 블로그만 보여주는 것을 보안하고자 만든 것으로 알고 있다. 내용을 보면 그 취지는 충분히 반영됨을 알 수 있다.
하지만 몇 가지 의문점은 있다.아래 미등록이라 표시된 블로그의 숫자의 의미이다. 랭킹 100위까지의 32개 블로그가 TOP130에 빠져있음을 알 수 있다. 직관적으로 느끼는 이유는 첫번째로 집중되어 있는 카테고리에 포스팅이 많다. 예를 들면 '라이프.스타', '시사' 그라고 'IT/게임'등에 집중되어 포스팅 한 블로거들이다. 두번째로는 한개의 카테고리가 아닌 다 방면의 카테고리에 포스팅을 하여 분산되었기 때문이다.100위까지의 블로거들 중32%가 빠진 이유라고 생각된다.
카테고리 중 상위랭킹에 들지 못하는 블로거들이 많이 있는 것은 '도서', '만화', '푸드'등 임을 알 수 있다. 아마도 '도서' 카테고리가 이렇게 되는 것은 다른 카테고리로 많이 분산이 되었다는 것을 알 수 있다. 더불어 이렇게 분류가 된다면 '도서'카테고리의 존재의 의미도 옅어진다고 보인다. 하지만 '도서'를 분류하여 보는 것이 도움이 많이 되는 것은 사실이다.
카테고리의 포스트와 블로거를 엮는 것에 대한 의문이지 카테고리 분류 자체의 의미에 까지 두는 것은 비약이 될 가능성이 있다. 더불어 TOP130에 오르고 싶다면 구멍(?) 카테고리에 집중적으로 포스팅을 하면 되지않을까 하는 생각을 해본다.
카테고리의 TOP130에 드는 것이 의미가 있다 없다를 떠나 랭킹 시스템은 항상(?) 문제를 안고 있다. 누구나가 보편 타당하게 느낄 수 있는 랭킹 시스템은 존재하지 않는다. 다만 보편타당하고 싶을 뿐이다.
야후 랭킹시스템이 런칭되어 블로거의 랭킹에 대한 많은 포스팅이 오르고 있다. 한데 그 누구도 맞다 아니다를 논할 수가 없다. 근거를 오픈하지 않기 때문이다. 물론 그 이유는.. 넘어가기로 하자.
블코의 카테고리 랭킹이 좀 더 신뢰도(?)를 가져 발전하였으면 하는 바램이다. 다른 곳에는 없는 것이기 때문이다.
덧붙임_하나
블코를 자료의 대상으로 삼기로 한 것은 데아터 추출이 쉽고 두 가지의 랭킹이 있어 비교허기 쉬운 이유이다.
덧붙임_둘
왠일인지는 모르지만 34위가 빠져있다. 그래서 1~50위까지 49명이다. 왜? 34위만이 빠지는 것일까?
덧붙임_셋
다음번 엑셀교육에서는 뭘 해야 할지 고민있다. 데이터를 만드는 일도 귀챦은 일이다.
'斷想' 카테고리의 다른 글
| 나는 다른 이를 '배려'하고 있는가 (4) | 2008/08/07 |
|---|---|
| 닌텐도Wii 받자고 스킨을 바꿔야 하나 (12) | 2008/08/05 |
| 블코의 TOP130과 랭킹130까지의 상관관계는 (11) | 2008/08/04 |
| 닌텐도에게 배워야 할 마케팅 전략 (0) | 2008/08/01 |
| 반기문도 모르는 "반기문 장학생 선발" 독후감대회 (0) | 2008/07/29 |
| 내가 블로그에 글을 쓰는 이유 (6) | 2008/07/24 |




br>

댓글을 달아 주세요
저도 .. 좀 의아합니다..
자랑은 아니지만, 제 블로그는 다른 메타 사이트에서는 보통 100위안에는 유지를 합니다. 근데. 유난히 블코만 250위 밖입니다.. ;;;; 왜 그런지 저도 궁금할지경입니다 블코에 사람이 많고 좋은 블로그가 많아서 랭킹에서 밀려날수도 있고, 다른 메타사이트에는 사람이 적어서 랭킹이 유지되는지도 모르기 때문에, 뭐라고 말하기도 좀 그렇습니다....
;;;
블코에서 선정하는 기준이 있고 자세히는 모르지만 다른 블로그스피어와 마찬가지로 선점의 효과가 어느정도 작용하지 않을까 합니다. 재아님은 파워블로거에 속하시는걸로 알고 있는대요. ㅎㅎㅎ
다음 엑셀 교육에서는 가계부를...^_^; 한번...
가계부는 업무에 적용하기가 뭐해서요. 분석을 어떻게 효율적으로 하는 것과 데이타를 추출하는 것을 위주로 하거든요. 계속하게 될지도 의문입니다. 무료봉사거든요. ㅎㅎㅎ
저도 매달 top130 선정할 때마다 이런 통계글을 작성할 생각이 있었는데, 늘 귀차니즘때문에 못하고 있습니다^^
운영자가 할 일을 대신 해주시는군요..
그리고 34위는....... 34위이신 분이 블로그를 폐쇄하시는 바람에 생긴 오류인데요... 어떻게 처리하는 게 좋을까요?
그 분이 다시 등록하기가 어렵다고 판단될 경우 35위가 34위로 되는 방식으로 순서대로 해서 나중에 51위가 50위 되는 방법이 있지요.
데이터를 DB에서 추출했으면 원시데이터를 올리려고 했는데 웹에서 추출하여 링크를 다 지웠거든요.
랭킹50위에 드는데 TOP130에 못 올라간 블로거들에게 별도의 메일을 보낸다면 감동(?)을 받지 않을까요? 애드센스의 최적하 메일처럼. 물론 랭킹50위에 국한하지 않으면..
너무 귀쟎은 일인가요? ㅎㅎㅎ 몸도 안좋은데..
34위 폐쇄는 한순위씩 올라가야 하지 않을까요? 비워두는 것은 아무래도 모양새가..
네..그게....
그 분이 회원탈퇴를 한 것은 아니라서 말이지요
랭킹점수는 그대로 있어서 아직 랭킹이 내려가지 않고 있는데, 블로그는 사라졌으니... 랭킹은 있으나 랭킹페이지에 표시가 되지 않는거죠... 언제 블로그를 다시 복구할지 저희들이 알 수 없는 상황에서 랭킹에서 삭제를 할 수도 없고... 좀 애매합니다..
그런 문제가 있군요. 참 여러가지 경우의 수가 생기네요. ㅎㅎㅎ
통계청 데이터를 사용하심이 어떠하실련지..?
통계청 자료는 고민해봐도 되겠군요. 감사합니다.