작성일: 2010년 3월 12일 금요일

구글은 사람이 인위적으로 순위를 조작하지 않는 객관적인 검색 결과 노출로 유명한데요, 그 순위가 어떻게 결정되는지 많은 문들이 궁금해 하실 것 같습니다. 오늘은 구글이 사용하는 웹사이트의 순위결정 방법과 그 이유, 그리고 그 밖에 구글이 소통하는 방식에 대해 말씀드리고자 합니다.

구글의 페이지 순위결정 방법 중 가장 많은 관심을 가져주시는 것 중 하나가 페이지랭크입니다. 여기 논문을 보시면 그 레서피가 담겨 있는데요, 이는 구글 초창기에 작성된 것으로 페이지랭크를 결정하는 공식뿐만 아니라 앵커텍스트, 문서 내 단어 위치, 문서내 검색어의 상대적 인접성, 사용된 글자의 크기 및 폰트, 각 페이지의 원본 HTML 코드, 대문자로 처리된 단어 등 랭킹 작업에 필요한 다른 많은 신호들을 다루고 있습니다. 구글은 지난 수 년 동안 수 백여건의 연구논문을 발표해왔습니다. 많은 논문들이 구글의 작동원리를 다루고 있으며, 구글이 사용하는 중대한 인프라구조문서로 입증한 내용들입니다. 이들 논문 중 일부는 오픈소스 프로젝트는 물론 모든 기업들이 스스로 움직이게 하는 자극제가 되기도 했습니다.

이러한 학술 논문 말고도 구글은 다른 많은 방식을 통해 사람들과 정보를 공유하고 교육적 역할을 수행하는 목표를 갖고 있습니다. 1999년 세르게이 브린은 웹마스터를 위한 최초의 검색엔진 전략(Search Engine Strategies) 컨퍼런스에 참여했습니다. 2001년 구글은 웹마스터 월드(WebmasterWorld)라는 퍼블리셔 포럼에 온라인으로 참여한 최초의 검색엔진 중 하나였습니다. 참가자 중 한 명(구글가이 블로그)은 2800회의 글을, 다른 참가자(애드워즈 어드바이저 블로그)는 5000회에 가까운 글을 공유했습니다.

투명성과 소통을 위한 구글의 노력은 웹의 발전과 함께 진보했습니다. 저희가 블로그를 시작한 것은 2004년 5월이었으며, 이후 구글의 공식 블로그를 통해 수 천 건의 글을 올렸습니다. 구글은 현재 70개가 넘는 공식 블로그를 운영하고 있으며 이중 공식 웹마스터 블로그는 특별히 웹사이트 소유주가 구글의 작동 원리를 이해하고 구글의 검색결과에서 사이트의 순위가 적절하게 결정될 수 있도록 도움을 주고 있습니다. 구글은 어떤 기업보다도 많은 글을 블로그에 올리고 있습니다. 또한 퍼블리셔를 위한 도움말을 담은 웹마스터 센터를 운영하며 수 십여개의 언어로 된 공개 툴과 문서를 제공하고 있습니다.

저는 구글의 문서화된 웹마스터 가이드라인의 위반 시도를 막기 위한 구글 웹 스팸 팀을 이끌면서 구글의 작동원리에 대한 질문을 종종 받습니다. 이는 제가 2005년부터 개인블로그를 시작한 이유이기도 합니다. 저는 이후 구글에 관한 수 백 건의 글을 올렸습니다. 주제는 웹사이트에서 범하는 흔한 실수에서부터 새롭게 블로그를 시작하는 사용자를 위한 조언까지 다양합니다. 저는 30건 이상의 검색관련 컨퍼런스에 참여해 웹사이트 소유주와 소통하고, 공공 웹사이트 리뷰 활동을 즐거운 마음으로 해왔습니다. 사실 지난 삼월 초에도 10여 명의 구글 동료와 함께 또 하나의 검색 컨퍼런스에 참여하였습니다.

저희는 구글의 검색순위가 어떻게 작동하는지에 대한 사이트 소유주의 이해를 돕기 위해 온갖 종류의 실험을 시도해왔습니다. 수 백 명이 동시에 참여하는 실시간 온라인 웹마스터 채팅을 다수 운영했습니다. 트위터도 시도했으며 포드캐스팅도 이용했습니다. 이러한 시도 중 제 마음에 든 한가지는 동영상을 이용한 것이었습니다. 저희는 지난 1년 동안 받은 이용자의 질문을 토대로 동영상 답변을 만들어 웹마스터 비디오 채널에 공개했습니다. 이 동영상 시청 기록은 150만 회가 넘었습니다! 우리는 또한 각종 블로그를 통해 구글의 방식에 대한 질문에 답했습니다.

이게 전부가 아닙니다. 구글은 다른 검색엔진과 연계해 웹사이트 소유주가 편리하게 이용할 수 있도록 했습니다. 이 같은 결과로 선호하는 웹사이트 url 포맷을 특정화할 수 있고, 웹마스터가 크롤링에 사용할 수 있는 사이트의 페이지 정보를 검색 엔진에게 쉽게 알릴 수 있는 사이트맵과 같은 표준이 만들어졌습니다. 구글은 구글 직원 외에 외부 “파워유저”도 특정 사이트에 대한 질문에 답변할 수 있는 웹마스터 포럼도 제공하고 있습니다. 또한 1대1 피드백과 조언을 위해 개별 웹마스터 클리닉을 운영하고 있습니다. 이러한 클리닉은 샌프란시스코에서 인도, 러시아에까지 설치됐으며, 스페인에서는 버추얼 사이트 클리닉이 운영되고 있습니다. 저희는 구글이 자체 알고리즘에서 사용하지 않는 키워드 메타 태그와 같은 검색순위 신호까지 확인하고 있습니다. 이를 통해 사이트 소유주가 불필요한 작업을 하지 않고, 경미한 법적 소송도 피할 수 있도록 도움을 주고 있습니다.

그러나 2만 명의 구글 직원 모두가 웹사이트 퍼블리셔의 질문에 종일 매달린다 해도 전세계 모든 웹사이트 소유주와 소통할 수는 없습니다. 전세계에서 등록된 웹사이트 주소만 1억9200만 개에 달하기 때문입니다. 구글은 이런 이유로 구글 웹마스터 도구를 도입했습니다. 사이트 소유주가 무료로 이용할 수 있는 구글의 강력한 도구를 설명하는 데는 또 하나의 블로그를 만들어도 부족하지만 수 많은 기능 중 중요한 몇 가지를 요약하면 다음과 같습니다.

• 사이트 소유주는 중복 메타 설명, 타이틀 태그 누락 등의 에러와 관련한 권고사항을 받을 수 있습니다.
웹마스터 가이드라인을 위반해 구글 인덱스에서 상응하는 조치를 받을 경우 사이트 재검토 요청을 제출할 수 있습니다.
• 해킹 피해를 입은 경우 멀웨어에 관한 상세한 정보를 얻을 수 있다. 해킹된 컨텐츠를 제거한 뒤에 구글봇이 악성 컨텐츠의 제거를 확인하고 사이트 소유주는 자신의 사이트에서 필요한 페이지를 가져올 수 있습니다.
• 구글이 각 사이트를 크롤링하면서 발견하는 에러를 사이트 소유주가 볼 수 있습니다.

한 구글 직원이 자신의 대역폭 제한 용량을 초과한 웹호스팅 에러 진단을 위해 최근 무료로 이용할 수 있는 공개 툴의 사용법을 블로그에 올렸습니다. 이와 유사하게 수 백만 명의 웹마스터들은 사이트 소유주가 구글의 무료 툴을 사용해 자신의 사이트에 관한 유용한 정보를 얻을 수 있도록 했습니다.

구글은 개방할 수 있는 것은 최대한 개방하려고 노력하고 있습니다. 심지어 사용자가 구글 제품으로부터 자신의 데이터를 내보낼 수 있도록 하고 있습니다. 저희는 동시에 어떤 기업이라도 영업비밀이 있다고 생각합니다. 최소한 스패머와 해커들이 구글의 시스템을 훼손하게 방치할 수는 없기 때문입니다. 만일 검색순위를 조작하려는 사람들이 구글의 검색순위 원리에 대한 내용을 자세하게 알고 있다면 이들은 쉽게 구글의 검색페이지를 ‘스팸’으로 만들어 적절하지 않은 결과가 나오도록 하거나 포르노나 멀웨어와 같은 사이트로 다른 이용자들을 괴롭히게 될 것입니다.

하지만 구글은 수 년 동안 하루도 빠짐없이 공개적인 시스템을 운영하고, 이를 통해 구글이 사이트의 순위를 결정하는 방법을 퍼블리셔에게 알리고 퍼블리셔와 사용자의 질문에 답변을 하기 위해 노력해 왔습니다. 앞으로도 이러한 노력은 계속될 것입니다.

작성자: 검색 품질팀 수석 엔지니어 매트 컷츠(Matt Cutts)