본 블로그와 동일한 내용이 구글 공식 블로그에도 게재되었습니다. 구글 검색의 목표는 사용자가 최대한 빠르게 유용한 정보를 찾을 수 있도록 돕는 것입니다. 이 정보는 다양한 형식으로 표시될 수 있습니다. 구글은 지난 수년 동안 검색결과 페이지를 끊임없이 개선해서 다른 웹페이지로의 링크뿐만 아니라 원하는 정보를 더 빨리 찾을 수 있는 다양한 기능을 제공하게 되었습니다. 예를 들면, 관련있는 정보를 먼저 보여주는 추천 스니펫입니다. 또한 지식 패널로 특정 인물 또는 어떤 주제에 대한 핵심 정보를 보여주기도 하고 자동 완성 기능으로 검색 결과에 더 빨리 도달할 수 있도록 도와주기도 합니다.
 |
(왼쪽부터) 추천 스니펫, 지식 패널, 자동 완성 기능의 예
|
|
각각의 정보들이 강조되는 방식이 다르고 어떤 정보는 사용자가 명시적으로 요청하지 않아도 표시될 수 있기 때문에 구글에서는 정보 표시 여부를 결정하는 정책을 시행하고 있습니다. 정책에 따라 일부의 경우에는 구글이 오류를 바로 바로잡거나 어떤 기능을 특정 페이지에서 삭제할 수 있다는 뜻입니다.
이는 구글이 웹 및 이미지 검색 목록을 다루는 방식 및 이러한 결과가 검색에 표시되는 방식과 다소 차이가 있습니다. 따라서 몇 가지 예를 들어 그 이유를 설명해 드리려고 합니다.
추천 스니펫
유용한 정보 형식 중 하나가 바로 추천 스니펫입니다. 추천 스니펫은 구글의 시스템에 따라 사용자가 찾고 있는 정보를 포함하고 있을 가능성이 높다고 판단되는 웹 페이지를 강조표시합니다. 추천 스니펫의 형식이나 위치 때문에 해당 정보가 믿을 만한 우수한 정보라고 여겨질 수 있기 때문에, 구글에서는 추천 스니펫에 표시될 수 있는 정보의 기준을 발표했습니다.
구글은 음란물, 증오성 콘텐츠, 폭력적 콘텐츠, 합의되지 않은 공익적 주제에 관한 콘텐츠 등 구글의 정책을 위반하는 스니펫은 허용하지 않습니다.
구글의 자동화 시스템은 이러한 정책을 위반하는 스니펫을 표시하지 않도록 설계되었습니다. 그러나 시스템의 실수로 정책을 위반하는 스니펫이 표시되는 경우, 구글에서 직접 해당 스니펫을 삭제합니다. 이러한 경우 해당 페이지는 웹 검색 목록에서는 삭제되지 않으나 더 이상 추천 스니펫으로 강조표시되지 않습니다.
지식 그래프
구글 검색의 지식 그래프는 세상의 지식, 즉 인물, 장소, 사물에 관한 사실을 알고리즘을 통해 이해하고 구글 검색결과에 표시합니다. 지식 그래프는 웹에서 수집된 정보, 구조화된 데이터베이스, 라이선스를 받은 데이터 등의 출처를 기반으로 실제 개체의 속성 및 관계를 자동으로 매핑하며, 이러한 사실을 한 데 수집합니다. 따라서 예를 들어 ‘베시 콜먼’이라고 검색하면 유명 비행사였던 해당 인물에 관한 여러 정보가 지식 패널에 표시됩니다.
지식 그래프에 등장하는 정보는 사실에 기반을 두어야 하며 사실을 제공해야 합니다. 그러나 가능한 한 정확한 정보를 제공하려고 노력하지만 구글의 시스템도, 구글이 참고하는 원본 데이터도 완벽하지는 않습니다. 따라서 구글은 사용자의 의견을 반영하며, 만일 어떤 정보가 정확하지 않거나 시스템에서 오류를 잡아내지 못한 경우에는 수동으로 정보를 확인하고 업데이트합니다. 또한, 더 광범위한 정보 생태계의 발전을 위해 이렇게 정정된 정보를 위키피디아 등의 출처에 다시 제공할 수 있는 도구와 절차를 개발했습니다.
뿐만 아니라 개인 및 조직이 지식 패널에 관해 소유권을 주장하고 자신의 정보에 대해 구글에 권위 있는 의견을 제공할 수도 있습니다. 그 외의 방식으로 잘못된 정보에 대해 알게 되는 경우 저희가 이러한 오류를 바로잡기 위해 노력합니다. 이미지 또는 지식 패널에 표시되는 구글 이미지 결과 미리보기가 인물이나 장소, 사물을 정확하게 표현하지 않는다면 구글에서 이러한 오류도 정정합니다.
예측 기능
자동 완성 및 관련 검색어 등 ‘예측’에 기반을 둔 기능은 사용자가 더 신속하게 검색결과에 도달할 수 있도록 도와줍니다. 자동 완성은 사용자가 검색창에 글자를 입력하기 시작하면 해당 단어와 짝이 맞고 보편적인 검색어를 표시하여 시간을 절약해 줍니다. 검색결과 페이지에서는 ‘관련 검색어’라는 제목의 섹션이 표시되어 원하는 정보를 찾지 못했거나 주제를 더 폭넓게 탐구하고 싶을 때 관련 주제를 탐색할 수 있도록 도와줍니다.
사용자가 이러한 관련 검색어를 보여달라고 요청한 것이 아니기 때문에 구글에서는 예상 검색어가 충격적이거나 불쾌하거나 특정 개인 또는 집단에 부정적인 영향을 미치는 일이 없도록 주의하고 있습니다. 이와 관련된 정책에 대해 자세히 알아보세요.
사용자의 검색어 입력에는 제약이 없지만, 일반적인 검색어에 대해 가능한 모든 예상 검색어가 표시되는 것은 아닙니다. 만일 예상 검색어가 표시되지 않거나, 관련 검색어가 표시될 줄 알았는데 그렇지 않은 경우에는 구글의 알고리즘이 검색어가 정책을 위반할 가능성이 있는 콘텐츠를 포함하는 것으로 판단했을 수 있습니다. 또는 예상 검색어가 신고되어 정책을 위반하는 것으로 판명되었거나, 일반적으로 잘 사용하지 않는 검색어를 입력한 경우일 수 있습니다.
구글의 지속적인 노력에도 불구하고 부적절한 예상 검색어가 표시되는 경우가 있을 수 있습니다. 정책을 위반하는 것으로 보이는 예상 검색어가 있는 경우, 예상 검색어를 신고하실 수 있습니다.
구글은 앞서 언급한 모든 기능을 제공하는 데 있어 사용자가 명시적으로 요청하지 않은 콘텐츠로 인해 충격을 받거나 모욕감을 느끼는 것을 결코 원하지 않기 때문에 폭력이나 욕설 등을 포함한 콘텐츠가 이러한 기능에 표시되지 않도록 노력하고 있습니다.
자연 검색 결과
지금까지는 대부분 검색 결과 페이지에서 볼 수 있는 유용한 기능에 대해 알아보았지만, ‘구글 검색 결과’ 하면 가장 많은 사람이 떠올리는 것은 역시 자연 검색 결과일 것입니다. 이제는 익숙해진 웹페이지 검색결과의 ‘파란 링크’들이나, 구글 이미지 페이지에 정렬된 이미지 검색 결과나, 동영상 모드에서 검색되는 웹 비디오들 말이죠.
이러한 검색 결과의 경우, 각 결과의 순위는 알고리즘을 통해 결정됩니다. 구글 검색 결과 페이지의 내용을 수집하고 배열하는 데에는 인간의 큐레이션 작업이 개입하지 않습니다. 대신, 자동화된 시스템을 사용하여 구글의 색인(인터넷을 크롤링하여 수집한 수천억 건의 웹 페이지 정보)에서 사용자의 검색어와 연관이 있는 콘텐츠를 빠르게 찾아냅니다.
그 후에 구글의 시스템은 다양한 요인을 고려하여 어떤 페이지가 사용자의 검색 내용과 관련하여 가장 유용한 사이트일지를 판단하고 이에 따라 검색 결과의 순위를 결정합니다. 이에 관한 더욱 자세한 내용은 ‘구글 검색의 원리’ 웹사이트에서 확인하실 수 있습니다.
모든 주제에 대해서 관련성 높은 결과를 제공하고 가장 의미 있고 유용한 결과에 우선순위를 부여하도록 하는 것이 구글의 목표이지만, 모든 자동화 시스템이 그렇듯이 구글의 검색 알고리즘도 완벽하지는 않습니다. 검색어와 별 관계 없는 사이트가 상위 검색 결과로 올라오기도 하고, 신뢰할 수 없는 정보를 담고 있는 웹사이트가 공식 웹사이트보다 위에 나타나기도 합니다.
종종 사용자가 이러한 문제를 발견하고 구글에 이를 ‘수정할’ 계획이 있냐고 문의하곤 합니다. 이때 검색 결과 페이지에서 특정한 결과를 수동으로 재정렬하거나 제거하는 작업을 생각하는 경우가 많지만, 과거에도 여러 번 말씀드렸듯이 구글은 검색 순위상의 문제를 해결하기 위해 특정한 검색 결과에 수작업으로 개입하는 방법은 채택하지 않고 있습니다.
여기에는 여러 가지 이유가 있습니다. 구글에서는 매년 수조 건의 검색이 이루어지기 때문에, 검색어 하나를 ‘수정’한다고 해서 이와 유사한 다른 검색어들에서 발생하는 문제를 해결하거나 검색 품질을 전체적으로 향상시킬 수 없습니다.
그럼 어떻게 해야 할까요? 구글은 검색 시스템에 대한 모든 변경에 동일한 접근 방식을 채택하고 있습니다. 이 방식이란 문제가 발생한 특정 사례를 활용하여 어떤 부분을 개선할 수 있을지 고민하는 것입니다. 즉, 해당 검색어뿐만 아니라 광범위하게 유사한 검색 사례에 도움이 될 수 있는 해결책을 찾아냅니다. 그 후에는 실제 검색 트래픽으로 진행하는 라이브 실험과 검색 평가자의 평가 데이터에서 얻은 인사이트를 활용하여 변경사항을 철저하게 테스트합니다. 그 후 이 변경사항이 전반적으로 긍정적인 변화를 가져온다고 판단되면(수많은 검색 결과를 더욱 유용하게 만들면서도 다른 곳에서 눈에 띄는 손실을 초래하지 않으면) 실제 서비스에 적용합니다.
구글의 검색 알고리즘은 변수가 수백 가지에 달하는 복잡한 수학 방정식이며, 검색 시스템에는 작년에만 3,200건 이상의 변경사항이 적용되었습니다. 이 중 일부는 눈에 보이는 신규 기능을 추가한 것이었지만, 다른 많은 변경은 인터넷 콘텐츠가 변화하는 데 맞춰 검색 결과의 관련성과 유용함을 유지하기 위한 일상적인 업데이트였습니다. 또 다른 일부는 일반 사용자의 신고나 자체적인 상시 품질 평가를 통해 발견한 문제에 대한 개선 작업이었습니다. 정책을 위반하는 문제가 발생하면 빠르게 고칠 수 있는 검색 기능과는 달리, 검색 결과 순위에 관한 문제의 근본 원인을 파악하는 데 시간이 필요한 경우가 있으며 개선 작업이 즉시 이루어지지 않을 수도 있습니다. 하지만 지금까지 20년 이상을 그래왔듯이, 구글은 이와 같은 문제를 파악하고 더 좋은 검색을 만들기 위해 최선을 다하고 있습니다.
스팸 및 어뷰징 방지
그렇지만 자연 검색 결과에 적용되는 정책이나 가이드라인이 아예 없는 것은 아닙니다. 검색 결과에 노출되는 콘텐츠는 오래 전부터 활용된 웹마스터 가이드라인을 준수해야 하며, 이는 스팸, 멀웨어, 가짜 사이트 등으로부터 사용자를 보호하기 위한 것입니다. 이와 같은 콘텐츠가 있을 경우 스팸 방지 시스템이 자동으로 개입하여 순위 결정 시스템에서 상위에 노출시키지 못하도록 합니다.
스팸 방지 시스템이 작동하지 않는 경우, 구글은 오래 전부터 웹페이지나 사이트 단위로 직접 조치를 취하고 있습니다. 이러한 조치는 구글 서치 콘솔의 직접 조치 보고서를 통해 고지하여 웹사이트 소유자들이 정책에 어긋나는 행동을 멈출 수 있도록 하고 있습니다. 또한 이러한 조치는 특정 검색 결과나 검색어와는 어떤 관련도 없으며, 문제가 있는 콘텐츠 일반에 대하여 시행됩니다.
법률 및 정책에 의한 삭제
누구나 폭넓게 정보를 이용할 수 있도록 하는 것이 구글의 사명이므로, 아동 학대 사진 및 영상이나 저작권 위반 신고 등 법률로 요구되는 제한적인 상황에 검색 결과에서 웹페이지를 삭제하도록 하고 있습니다. 또한 민감한 개인정보를 포함한 콘텐츠 등 구글이 개발한 자체 정책에 따라 사용자 또는 일반 시민을 보호하기 위해 검색 결과를 삭제하는 경우도 소수 있습니다.
이처럼 법률과 정책에 따른 조치를 통해 경우에 따라 특정 검색에서 사람 이름 등의 결과를 삭제하기도 합니다. 하지만 이와 같은 삭제는 구글이 미흡한 검색 결과를 ‘수정’하려는 것이 아니라 모두를 보호하기 위해 투명하게 공개된 정책을 적용하고 법률을 준수하기 위한 조치입니다.
구글은 검색 결과 및 결과 페이지의 기능을 최대한 유용하고 의미 있게 만들기 위해 끊임 없이 노력하고 있으며, 또한 어떤 부분에 개선이 필요한지 파악하는 데에 큰 도움이 되는 사용자 의견을 늘 소중히 여기고 있습니다.
작성자: 대니 설리번(Danny Sullivan), Public Liaison for Search
https://i.postimg.cc/SxpC5B3r/1.png 작성자 이름: 대니 설리번 작성자 타이틀(예: Public Liaison for Search
) 작성자 소속