네이버, 이런 이유로 욕을 먹는거야!

분류: Digital News/Blog Story 작성일: 2007.08.16 00:05 Editor: 마루[maru]

'복사문서판독시스템', 네이버 이런 이유로 욕을 먹는거야!

오늘 블로그스피어인 올블로그에는 8월14일자 NHN Story 를 통해서 발표된 "원본? 복사본! 네이버 복사문서판독시스템이 알아냅니다!" 라는 네이버 복사문서판독시스템 적용 관련 소식이 떡이떡이 서명덕 기자의 "네이버, 불펌 중복자료 이렇게 걸러낸다" 포스팅을 통해서 알려지면서 핫 키워드로 떠올라 지금 이시간에도 메인에 자리를 지키고 있다.

예상대로 네이버 관련 포스팅이 줄을 이어 오르면서 관심도는 높아지고 있다. 리나님의 "네이버 불펌 걸러내긴 뭘 걸러내는건가?" 의 글에서 아르님의 댓글을 인용해가며 네이버의 문제점을 지적한 것에 대해 pei님이 "노력은 좀 인정해줍시다." 라는 포스팅을 통해서 네이버의 복사문서 판독시스템을 통한 개선의 의지를 높이 평가해주자는 의견에 충분히 공감하며 그들의 노력과 열정에 아낌없는 찬사를 보내고 싶은 마음이다. 아울러, pei님이 언급했듯이 복사문서판독시스템의 로직이 완벽하게 그 기능을 다할것이라고 판단하는것은 이르다고 생각을 한다.

하지만, 이런 결과들이 네이버의 노력과 열정에 대해 신뢰감을 가질 수 없도록 만들고, 심하게는 네이버가 티스토리 블로그에 불리한 패널티를 적용한다 또는 네이버 블로그를 옹호한다라는 말들을 나오게 만드는 것이고, 그 노력에도 불구하고 욕을 먹는것 아닐까 싶다.

사용자 삽입 이미지
복사문서판독시스템이란
카페, 블로그, 언론사 뉴스 문서의 복사유무와 그 정도를 계산하여, 중복문서는 통합 검색결과에서 제외함으로써 검색 서비스의 품질을 개선하는데 사용하는 시스템입니다. 이를 통해 ‘스크랩’ 기능을 통해 옮긴 문서뿐만 아니라, 복사(ctrl+C,V)해서 가져간 문서도 중복문서로 판독되어 검색에 노출되지 않게 됩니다.

네이버 복사문서판독시스템의 가장 큰 특징
기존 시스템과는 달리 하나의 문서를 의미 있는 단락단위로 나누어서 복사유무를 판독하기 때문에, 100% 똑같이 일치하는 문서뿐만 아니라 본문 일부가 중복되는 문서까지 알 수 있다는 점입니다.
또한, 블로그-블로그, 카페-카페 등 같은 콜렉션 내의 문서 이외에도 블로그-카페, 블로그-뉴스 등 다른 영역에서 복사한 문서까지도 알 수 있기 때문에 통합검색 전체적으로 더 나은 검색결과를 제공할 수 있습니다.

그럼 본론으로 들어가서 복사문서판독시스템의 로직에 근거하여 직접 판독 검색결과를 살펴보도록 하자.

최근 디자인로그에서 "동대문운동장, 2010년엔 이런 모습?" 이란 포스팅을 통해 서울특별시 홈페이지를 통해 공식발표된 동대문운동장 공원화 사업에 관한 기사를 발행한 적이 있고, 이에 앞서 이미 각종 인터넷뉴스를 통해 관련기사가 발빠르게 보도가 되었다. 디자인로그의 경우는 한 발 늦게 서울시 보도자료를 근거로 관련이미지를 자체 편집한 다음 약간 늦은 발행을 한터라 네이버의 복사문서판독시스템 로직에 어느정도 영향을 받을것이라는 가정하에 네이버에서 '동대문운동장'을 키워드로 검색을 했었다.

사용자 삽입 이미지

검색조건은 전체 블로그검색에 작성일 기준 중복결과 제외옵션을 선택한 결과로 궁금하면 아래 링크를 클릭해 보면 확인할 수 있듯이 9번째 검색결과와 클릭하고 위의 "동대문운동장, 2010년엔 이런 모습?" 링크를 클릭해서 비교해 보라.
http://cafeblog.search.naver.com/search.naver?where=post&query=%B5%BF%B4%EB%B9%AE%BF%EE%B5%BF%C0%E5&sm=tab_hty&x=25&y=13

이것은 위의 검색결과 9번째 검색 글 "동대문운동장, 2010년엔 이런 모습?" 의 링크다.
http://blog.naver.com/glarejin?Redirect=Log&logNo=60041101190

그 결과는 실로 놀라웠다. 그 검색결과 첫 페이지에 나타나는 상황을 보고 황당함을 감출수가 없었고 네이버의 신뢰성에 대한 의구심만 더 커졌다. 더 이상 할 말을 잃었다.

앞서도 운영중인 뉴스페이퍼2.0이 어떤 이유도 모른체 스팸블로거로 분류되어 1년이 넘게 네이버를 통해 검색되었던 글들이 한 순간에 완전히 삭제가 되었고, 공식적인 답변을 보내겠다는 네이버는 1주일이  넘도록 답변이 없는 상태다 더 웃기는 것은 뉴스페이퍼2.0을 일반등록으로 블로그검색에서 삭제된 다음 신청을 했는데 1주일만에 등록이 되었고, 신청한 내용과는 달리 네이버 마음대로 "인사이드 이슈" 타이틀로 등록해 주었는데 디렉토리 검색에만 보여질 뿐 페이지의 검색은 하나도 되지 않는 생색내기에 급급한 느낌일 뿐이다.

뉴스페이퍼를 통해 네이버의 뒷담화에 관련된 웃지못할 블랙리스트 링크 관련 이야기는 다음에 하도록 하겠다.

네이버 검색팀에게 묻고싶다. 이것이 네이버가 그렇게 자신있게 이야기 하는 복사문서판독시스템의 기대효과인지......아니면 네이버 검색로직의 부실을 은폐하려는 것인지..  더이상 설명을 할 수 없으며, 애써 네이버의 복사문서판독시스템에 대해 논할 가치를 못 느낀다.

제발, 크롤링 안해도 좋고, 검색에 노출되지않아도 좋으니 블로그 글들이 삭제되었는지 공식적인 해명만이라도 듣기를 바랄뿐이다.

※글에 대한 여러분 의견을 남겨 주십시오. 감사합니다!
  1. BlogIcon drzekil 2007.08.16 00:22  댓글주소  수정/삭제  댓글 남기기

    네이버가 다 그렇죠.. 라고 이야기 안하는게 좋겠지만..
    왠지 자꾸 그런 이야기가 나오려고 합니다..

  2. BlogIcon 쿨보이 2007.08.16 02:23  댓글주소  수정/삭제  댓글 남기기

    저는 블로그는 아니지만 게시물이 삭제되어서 항의메일 보냈더니.. 며칠후 복구시켜 주더라구요.. 트랙백 남기겠습니다..

  3. BlogIcon 벗님 2007.08.16 03:03  댓글주소  수정/삭제  댓글 남기기

    네이버의 커다란 빗자루로 쓰윽~ 해버린 것 같네요. 이크.. ^^;

  4. BlogIcon 도아 2007.08.16 06:07  댓글주소  수정/삭제  댓글 남기기

    네이버스럽다고 할 수 밖에 없군요. 원본은 사라지고 불펌 글이 검색에 등장하는 네이버스러운 시스템.

  5. BlogIcon sooop 2007.08.16 06:16  댓글주소  수정/삭제  댓글 남기기

    웹크롤러가 필요가 없죠. 사용자들이 다 해주는데...

  6. 광복절특사 2007.08.16 08:10  댓글주소  수정/삭제  댓글 남기기

    이런..pei라는 사람 또 와서 악플 달겠군요. 네이버 그만까라고..

  7. BlogIcon 낚시광준초리 2007.08.16 08:58  댓글주소  수정/삭제  댓글 남기기

    흠흠... 정말 네이버스럽네요... 복사문서판독시스템이라.. 뭐 문장에대한 매칭이나 이런걸 체크 할거 같은데요. 이거 간단한 조건문 하나만 넣어면 네이버블로그로 나오게 충분히 할 수있겠네요.. 코드야 모르니 뭐 그렇지만 네이버라면... ㅎㅎㅎㅎ

  8. BlogIcon Qhtlr 2007.08.16 09:17  댓글주소  수정/삭제  댓글 남기기

    제 글도 검색해보면 펌글이 우선순위에 놓여있습니다.

  9. BlogIcon 학주니 2007.08.16 09:46  댓글주소  수정/삭제  댓글 남기기

    네이버의 기술력이 그다지 딸리는 편은 아닌데 영 결과물은 아니올시다에요.. -.-;

  10. BlogIcon SEO 2007.08.16 10:01  댓글주소  수정/삭제  댓글 남기기

    잘 읽었습니다.
    가두리양식장 네이버가 현재 할 수 있는 것은 중복,펌글 필터링 밖에
    없을 것입니다. 그거라도 해주니 다행입니다만 웹페이지 D/B가 워낙 빈약하다보니 웹페이지로 부터의 중복글을 필터링 못하는게
    결국은 반쪽 필터링에 불과하고 그 결과는 오히려 엉뚱한
    부작용이 예상됩니다.

  11. BlogIcon 마래바 2007.08.16 10:37  댓글주소  수정/삭제  댓글 남기기

    저도 제 글 검색하면 불펌해간 네이버 블로그가 먼저 나오고 제글 아예 나오지 않던가 나오더라도 몇 페이지 뒤에 나오더라구요.
    이러다가 나중에는 제가 글을 써 놓고도 불펌 블로거라는 오명을 쓸지도 모르겠다는 생각이 듭니다.

  12. BlogIcon 프로채터 2007.08.16 13:05  댓글주소  수정/삭제  댓글 남기기

    이거 이런식으로 나오면 원본과 사본을 구분할수 없겠는걸요?

  13. BlogIcon 대나무밭 2007.08.16 16:56  댓글주소  수정/삭제  댓글 남기기

    네이버가 어쩌면 방조하는 있는 건지도 모르겠네요.

  14. BlogIcon 공상플러스 2007.08.17 15:31  댓글주소  수정/삭제  댓글 남기기

    네이버의 귀챠니즘과 무개념 블로거들의 붙여넣기 신공이
    욕을 먹어야 하는건데;; ㅋ

  15. BlogIcon 외로운까마귀 2007.08.17 18:55  댓글주소  수정/삭제  댓글 남기기

    사실 이런 부분은 다음도 마찬가지입니다. 제가 다음 블로그를 사용했을 때 검색에 나타나지 않아서 호되게 당한 적이 있습니다. 네이버만 이야기할 부분이 아니에요..

  16. BlogIcon 썬샤인 2007.08.18 04:08  댓글주소  수정/삭제  댓글 남기기

    뭐..할말을 잃었습니다..
    원본이 안나온다면 도데체 필요가 없는 시스템이네요..
    검토를 다시 해봐야할듯 -_-;;

  17. 2007.08.20 14:18  댓글주소  수정/삭제  댓글 남기기

    비밀댓글입니다


라라만물상