날짜: 2008년 7월 28일 월요일

날짜: 2008년 7월 28일 월요일

매일 바쁜 일상 속에서 업무를 처리하다보면 나도 모르게 컴퓨터에 수 십 개의 파일이 쌓이기 쉽습니다. 나름대로 정리한다고 해보지만 하루에 열 두 번도 넘게 열고 닫은 문서들을 찾기 쉽게 정리하기란 여간 어려운 일이 아닙니다. 갑자기 급한 일이 생겼을 때는 찾고자 하는 파일이 꼭꼭 숨어서 나오지 않아 당황하기도 하고요. 여기저기 파일이 쌓이기 전에 미리 정리하는 일은 주말에 큰 맘먹고 제 방을 청소를 하는 것 만큼이나 어려운 일입니다. 시간을 내서 깨끗이 정리를 해도 하루에 수없이 열고 닫은 수많은 파일들을 바로바로 찾아내기란 쉽지 않지요. 저와 같은 경험을 한 번이라도 해 보신 분이 계시다면 여러분들께 구글 데스크톱을 적극 추천합니다!

구글 데스크톱은 이메일, 파일, 사진, 채팅, 내가 본 웹페이지 등 내 컴퓨터에 있는 필요한 정보를 '검색'으로 바로 찾아줍니다. 또한 검색기능 뿐만 아니라 가젯 및 사이드바를 통해 새로운 정보를 수집하여 체계적으로 여러분의 일상을 관리하는 것을 가능하게 합니다.
구글 데스크톱의 다양한 기능에 대해 좀더 자세히 살펴보면 아래와 같습니다.

효과적인 색인
구글 데스크톱을 설치하면 컴퓨터에 저장된 이메일, 파일 및 웹 기록에 대한 색인이 생성됩니다. 내가 받은 이메일, 업데이트한 파일, 열어본 웹페이지, 채팅 기록 등을 곧바로 색인에 추가하여 최신 상태로 유지합니다.
삭제된 파일 찾기
중요한 문서를 실수로 삭제했을 경우 데스크톱을 활용해 복구할 수 있습니다. 구글 데스크톱은 열어본 페이지의 스냅샷을 만들어 하드 드라이브에 저장해 놓습니다. 삭제된 파일도 되살릴 수 있기 때문에 어떤 상황에서도 당황하지 않고 안심할 수 있습니다.

사이드바와 빠른 검색창
구글 데스크톱을 사이드바로도 활용할 수 있다. 사이드바에는 달력, 할일 목록, 계산기, 뉴스, 날씨 등 맞춤형 가젯을 추가하여 필요한 기능과 정보들을 손쉽게 사용할 수 있습니다. 사이드바가 자신에게 맞지 않다면 데스크바 혹은 이동식 데스크바를 활용할 수도 있습니다. 또한, Ctrl키를 두번 누르면 빠른 검색창이 떠 내가 원하는 순간에 즉시 데스크톱 검색을 할 수 있습니다.
구글 데스크톱을 이용한 스마트한 업무 처리로 누구보다도 쿨~한 여름 되시기 바랍니다.

작성자: 구글블로그 운영팀

날짜: 2008년 7월 24일 목요일

여러분이 사용하시는 이메일 계정에는 은행 거래내역서나 연애편지 등과 같은 개인적인 정보가 들어있을 수 있습니다. 이런 이메일은 분명 타인과 공유하고 싶지 않을 것입니다. 여러분들의 지메일(Gmail) 계정이 얼마나 중요한지를 잘 알고 있기 때문에 이를 보호할 수 있는 새로운 기능을 추가했습니다. 이 기능을 통해 사용자는 자신의 최근 활동을 체크할 수 있으며 원격으로 로그아웃을 할 수 있습니다.
날짜: 2008년 7월 24일 목요일

여러분이 사용하시는 이메일 계정에는 은행 거래내역서나 연애편지 등과 같은 개인적인 정보가 들어있을 수 있습니다. 이런 이메일은 분명 타인과 공유하고 싶지 않을 것입니다. 여러분들의 지메일(Gmail) 계정이 얼마나 중요한지를 잘 알고 있기 때문에 이를 보호할 수 있는 새로운 기능을 추가했습니다. 이 기능을 통해 사용자는 자신의 최근 활동을 체크할 수 있으며 원격으로 로그아웃을 할 수 있습니다.

여러분도 저와 마찬가지로 여러 컴퓨터를 통해 지메일에 로그인을 하실 것입니다. 예를 들어 저는 가끔 중요한 이메일을 확인해야 할 때 친구 집에서 지메일 계정에 접속합니다. 사용 후에 로그아웃을 한다고는 하지만 가끔은 제대로 로그아웃을 했는지 모를 때가 있습니다. 이제는 더 이상 이런 고민을 하지 않아도 됩니다.

받은 편지함 아래에는 여러분이 이메일 계정을 사용한 마지막 활동시간 정보와 함께 계정에 로그인한 정보를 보여주는 IP주소가 표시됩니다:



위의 예에서 보듯이 제 계정이 현재 다른 장소에서 로그인되어 있는 것을 확인할 수 있습니다. 그런데 IP 주소를 보면 현재 로그인 상태인 컴퓨터가 제 동료의 컴퓨터임을 알 수 있습니다. 방금 회의를 하면서 잠시 동료의 컴퓨터를 쓰고 지메일 계정을 그대로 열어두고 왔던 것입니다. IP 주소는 여러분이 인터넷에 접속할 때 사용하는 컴퓨터를 표시하는 숫자 정보입니다. 여러분 중에는 IP 관리를 위해 자신의 IP 주소를 알고자 하는 분이 계실 것 입니다(아래에 IP주소를 알아내는 방법에 대해서는 다음에 다시 다루겠습니다). IP 정보를 두고 생각하고 싶지 않으신 분은 따로 정보를 얻을 필요가 없습니다. 위의 예에 대해 설명을 더 드리면 세부정보를 클릭해 나의 최근 지메일 활동에 대해 자세히 알아볼 수 있습니다:


"최근 계정활동"은 이메일 사용 시간과 함께 최근 이용 상황을 보여줍니다. 이 박스의 아래쪽에 나와있는 IP 주소는 현재 사용중인 IP 주소를 보여줍니다.

이 정보를 통해 저의 지메일 계정 활동의 주체는 바로 제 자신이었다는 것을 금새 확인할 수 있습니다. 표에 나와있는 시간대와 장소에서 지메일을 사용한 기억이 있습니다. 다른 컴퓨터에 로그인 상태로 놓아둔 계정을 원격으로 로그아웃하려면 "다른 모든 세션에서 로그아웃 하십시오” 버튼을 클릭하면 됩니다.

참고: 저희는 현재 이 기능을 지메일 최신 버전에 제공하는 과정에 있습니다. 이 기능은 인터넷 익스플로러7과 파이어폭스를 통해 확인하실 수 있습니다. 지메일은 구글 첫페이지 하단 첫번째 아이콘을 통해 쉽게 이용하실 수 있습니다.

작성자: 지메일 엔지니어 어윈 드 수자(Erwin D'Souza)

날짜: 2008년 7월 23일 수요일

지난번 저는 구글 검색순위에 담긴 철학을 소개해드렸습니다. 이번 시간에는 검색 품질과 관련해서 구글의 검색기술에 대해 좀 더 자세히 말씀 드리겠습니다. 구글의 검색순위 시스템의 핵심기술은 정보검색(IR: Information Retrieval) 분야에서 출발합니다. 정보검색 분야는 학계에서 50년 가까이 연구되어 왔으며, 여기서 페이지 순위를 매기기 위한 단어빈도와 같은 용어의 특징을 통계 부호로 사용하게 됩니다(정보검색 기술에 대한 설명 ...
날짜: 2008년 7월 23일 수요일

지난번 저는 구글 검색순위에 담긴 철학을 소개해드렸습니다. 이번 시간에는 검색 품질과 관련해서 구글의 검색기술에 대해 좀 더 자세히 말씀 드리겠습니다. 구글의 검색순위 시스템의 핵심기술은 정보검색(IR: Information Retrieval) 분야에서 출발합니다. 정보검색 분야는 학계에서 50년 가까이 연구되어 왔으며, 여기서 페이지 순위를 매기기 위한 단어빈도와 같은 용어의 특징을 통계 부호로 사용하게 됩니다(정보검색 기술에 대한 설명은 "현대 정보검색의 개괄" 참조). 이같은 정보검색은 많은 부분에서 구글 검색 기술에 토대를 마련해줬고 구글은 이를 바탕으로 링크, 페이지 구조, 그리고 다른 다양한 혁신들을 통해 거대한 시스템을 구축했습니다.

지난 10년 동안 검색은 '내가 말한 것'을 찾아주던 시대에서 '내가 원하는 것'을 찾아주는 시대로 진보했다고 볼 수 있습니다. 이로 인해 검색에 대한 사용자의 기대치는 자연스럽게 높아졌습니다. 구글은 사용자 한 분 한 분의 기대를 충족시키기 위해 최선을 다하고 있으며 이를 위해서 페이지, 검색어, 그리고 사용자들을 더욱 깊이 이해하려고 노력하고 있습니다. 이 같은 3가지 검색 과정의 구성요소를 이해하기 위해 지난 10년 동안 완전히 새로운 차원에서 검색 기술을 개발해 왔습니다.

구글에서 검색어를 말할 때는 괄호 [ ]를 사용해 검색어의 시작과 끝을 구분합니다(참조: 매트 커츠의 "검색어 쓰는 방법"). 이번 글에서도 같은 방법을 사용하겠습니다(페이지와 검색결과는 수시로 바뀌기 때문에 이 글에 나오는 검색어 사례는 설명대로 나오지 않을 수도 있습니다).

페이지에 대한 이해: 구글은 수년 동안 웹페이지 크롤링과 색인생성 시스템 개발에 노력해 온 결과 현재 최신의 대규모 색인을 보유하고 있습니다. 정보의 규모와 최신성은 물론 새로운 방식으로 색인을 생성하는 방법을 개발함으로써 더욱 시스템을 향상시켜왔습니다. 페이지를 이해하기 위해 구글이 개발한 핵심 기술 중 하나는 주요 개념들이 페이지에 명확하게 나오지 않아도 이들 개념들을 결부시키는 페이지를 생성해 내는 능력에 관한 것입니다. 예를 들어 이탈리어로 [galleria sprovieri londra]를 치면 공식 홈페이지에는 ‘런던’ 혹은 ‘런드라(Londra: 이탈리어로 ‘런던’)’라는 단어가 없더라도 런던의 스프로비에리 갤러리(Sprovieri Gallery)를 찾을 수 있는 것 입니다. 미국에서 [cool tech pc vancouver, wa]을 입력한 사용자는 http://www.cooltechpc.com/ 홈페이지를 찾게 됩니다. 홈페이지에는 이 회사가 미국 워싱턴주 밴쿠버에 위치하고 있다는 내용이 어디에도 없는데도 말이지요. 구글이 개발한 또 하나의 기술은 페이지 내 단어의 중요도나 정보의 최신성을 찾아내는 기술입니다.

검색어에 대한 이해: 검색어가 가지고 있는 일반적인 의미를 넘어서 사용자들이 진정 무엇을 찾는가를 이해하는 것은 검색 기술의 핵심입니다. 이 분야와 관련해 업계 최고의 스펠링 제시 시스템, 첨단 동의어 구별 시스템, 그리고 매우 강력한 개념 분석 시스템 등의 몇 개의 괄목할만한 진전을 이루어냈습니다.

대부분의 사용자들은 구글의 스펠링 제시 시스템을 한 두 차례 사용해 보았을 것입니다. 이 시스템은 [kofee annan]을 입력한 사람은 사실 Kofi Annan을 검색하는 것으로 인식하고 “이것을 찾으셨나요: kofi annan”라고 하면서 올바른 철자를 제시합니다. 반면 [kofee beans]을 입력한 사람이 찾는 것은 실제로 coffee beans를 찾는 것으로 구별해야겠지요. 이러한 기능을 국제적인 차원에서 매우 정확하게 제공하는 것은 어려운 일인데 구글은 이를 능숙하게 처리하고 있습니다.

동의어는 우리가 검색어를 이해하는 과정에서 바탕이 됩니다. 이는 구글에서 가장 어려운 문제 중 하나입니다. 사람에게는 자명한 것일지라도 기계적인 언어 처리에서는 여전히 풀리지 않은 문제로 남아 있습니다. 저는 사용자로서 검색어에 어떤 단어를 입력해야 할지 너무 많은 생각을 하고 싶지 않습니다. 알맞은 단어가 무엇인지조차 종종 모를 때가 있습니다. 바로 이때 구글 동의어 시스템이 필요합니다. 구글의 동의어 시스템을 이용하면 복잡한 검색어의 수정이 가능합니다. 예를 들어 [Dr Zhivago]라는 검색어에서 'Dr'라는 단어는 의사를 뜻하는 Doctor로 알고 있습니다. 반면에 [Rodeo Dr]에서의 Dr는 거리를 뜻하는 Drive 입니다. [back bumper repair]를 입력한 사용자가 찾는 정보는 후방(rear) 범퍼 수리에 관한 것으로 해당된 결과를 얻을 수 있습니다.

[Ramstein ab]에 대해서는 자동으로 Ramstein Air Base를 찾아주고; [b&b ab]에 대해서는 캐나다주 앨버타에 있는 Bed and Breakfasts 관련 정보를 찾아줍니다. 이 같은 수준의 검색어를 100여 개의 언어로 분별할 수 있는 구글의 기술력을 매우 자랑스럽게 생각합니다.

구글 랭킹 시스템이 사용되는 또 다른 기술은 개념 확인에 관한 것입니다. 검색어에 있는 단어의 중요한 개념을 이해하면 자연스럽게 더 관련성이 높은 결과가 나타납니다. 예를 들어 구글의 알고리듬은 [new york times square church]와 같은 검색어에 대해 사용자가 타임즈 광장에 있는 유명한 교회를 찾고 있다고 파악하지 뉴욕 타임즈의 기사를 찾는 게 아니라는 것을 정확히 알아냅니다. 저희는 이러한 개념을 인지하는 것에 그치지 않고 올바른 개념으로 검색어를 더욱 구체화시키는 작업을 합니다. 예를 들어 누군가 [PC and its impact on people]을 입력해 관련 정보를 찾는다면 이 사람은 실제로 컴퓨터가 사회에 미치는 영향을 찾고 있는 것입니다. 혹은 [rainforest instructional activities for vocabulary]의 검색어로 정보를 찾는 사람의 경우에는 실제 rain forest lesson plans을 찾고 있다고 파악하는 것이지요. 구글의 검색어 분석 알고리듬에는 많은 첨단 기술이 녹아 있습니다. 거듭 말씀 드리지만 이 같은 검색 서비스는 전세계 거의 모든 언어로 제공되고 있습니다.

사용자에 대한 이해: 사용자의 의도를 해석하는 일은 사람들이 검색어로 쓴 그대로가 아니라 진정 마음 속으로 원하는 결과를 찾아주기 위한 것입니다. 이 작업은 세계적인 수준의 구글 현지화 시스템에서 의해 이루어지며 여기에 구글의 첨단 개인화 기술과 사용자 의도를 해석하는 구글 유니버설 검색(Universal Search)과 같은 기술이 추가됩니다.

"전세계적으로 제공되는 최고의 현지화된 연관 검색결과"에는 구글의 현지화 노력에 반영돼 있습니다. 여러나라에서 입력된 동일한 검색어라 하더라도 결과는 전혀 다를 수 있습니다. 미국에서 [bank]를 입력한 사용자는 미국은행에 관한 정보를 얻어야 하겠지만, 영국 사용자는 Bank Fashion line 혹은 영국의 금융 기관을 찾는 것일 수 있습니다. 호주, 캐나다, 뉴질랜드, 남아프리카와 같은 영어권 국가에서는 이 검색어가 현지 금융 기관을 결과로 보여져야 합니다. 비영어권 국가인 이집트, 이스라엘, 일본, 러시아, 사우디아라비아, 스위스에서 입력될 경우에는 재미난 현상이 나타납니다. 마찬가지로 [football]이라는 검색어는 호주, 영국, 미국에서 각각 완전히 다른 스포츠를 의미합니다. 이러한 예들은 구글이 동일한 개념에 대한 현지화 버전을 정확하게 보여준다는 것을 증명해줍니다(금융 기관, 스포츠 등). 그러나 동일한 검색어는 서로 다른 나라에서는 완전히 다른 것을 의미할 수 있습니다. 예를 들어 [Côte d'Or]는 프랑스에서는 지리학적 지역이지만, 인접하고 있는 불어권 국가 벨기에에서는 대형 초코렛 제조업체의 이름으로 쓰입니다. 네, 그렇습니다. 구글은 이것도 정확하게 집어내고 있습니다 :-).


구글 검색 시스템에 있어 또 다른 강력한 특징 중 하나는 각 개인 사용자에게 맞춤형 검색결과를 제공하는 개인화에 관한 것입니다. 로그인한 상태로 검색을 하는 사용자들이 웹 히스토리(Web History)에 등록되어 있으면 일반적인 구글 검색결과에 비해 더욱 관련성이 높은 결과를 얻게 됩니다. 예를 들어, 미식축구와 관련된 검색을 많이 하는 사용자라면 [자이언츠]를 검색할 때 미식축구와 관련한 정보를 더욱 많이 얻게 되지만, 다른 사용자들은 야구팀 자이언츠에 대한 결과를 얻을 확률이 높습니다. 마찬가지로 특정한 쇼핑 사이트의 결과를 선호하는 경향이 있다면 어떤 상품을 검색할 때 그 사이트로 부터 결과를 얻을 가능성이 높습니다. 구글의 분석에 따르면 개인화된 결과들이 비개인화된 결과에 비해 더욱 관련성이 높은 것으로 나타났습니다.

사용자 의도를 파악하기 위한 또 하나의 사례는 [chevrolet magnum]과 같은 검색어에서 찾아 볼 수 있습니다. Magnum은 실제로 Dodge가 만들지 Chevrolet가 만들지 않습니다. 따라서 검색 결과도 Dodge Magnum을 찾는 것으로 파악하고 dodge magnum 을 제안하게 됩니다.

유니버설 검색은 구글이 사용자 의도를 해석해 그들이 진정으로 원하는 정보를 제공해주는 또 하나의 예입니다. [bangalore]를 찾는 사용자는 주요 웹페이지는 물론 방갈로어의 지도나 거리의 모습을 보여주는 비디오, 교통정보, 관련 뉴스와 블로그 등도 제공받게 됩니다. 이 비디오를 보면 마치 정말 방갈로어에 와 있는 것 같습니다 :-).

마지막으로 구글이 검색에서 가장 최근에 이룬 성과 중 하나를 말씀드리면 바로 교차언어검색(CLIR: Cross Language Information Retrieval)입니다. 교차언어검색은 사용자가 자신이 쓰는 언어가 아닌 다른 언어로 된 정보를 발견하는 때 구글의 번역 기술을 이용해 이 정보에 접근할 수 있도록 하는 것입니다. 저는 이러한 진전을 이렇게 부릅니다: 내가 원하는 정보를 모든 언어로! 러시아어로 된 토니 블레어 전기를 찾는 누군가가 러시아어 검색어인 [Тони Блэр биография]를 입력하면 검색 결과 밑에 다음과 같이 영어 웹사이트에서 검색할 것을 제안 받습니다.

마찬가지로 이집트에서 [أغاني أفلام ديزني]라는 검색어로 디즈니 영화 음악을 검색하면 영어 웹사이트에서 검색할 것을 제안 받습니다. 저희는 교차언어검색에 거는 기대가 큽니다. 왜냐하면 교차언어검색은 전세계 정보를 체계화해 누구나 편리하게 이용할 수 있도록 하는 구글의 미션을 달성하는데 큰 도움이 되기 때문입니다.

구글의 랭킹 시스템의 우수성을 보여주는 첨단 기술 사례를 계속해서 설명드릴 수 있지만 사실 검색은 절대로 완벽하게 해결된 문제가 아닙니다. 많은 검색어들이 여전히 구글의 검색으로 만족스러운 결과를 얻지 못하고 있습니다. 하지만 각각의 검색어는 구글의 랭킹 시스템을 향상시킬 수 있는 기회이기도 합니다. 저희 그룹에서 개발 중인 수많은 기술이 가까운 장래에 구글의 랭킹 알고리듬에 큰 향상을 가져다 줄 것을 확신합니다.

제가 구글 검색 결과와 관련해 올린 두 개의 글이 우리가 매일 같이 검색과 함께하며 그 어느때 보다도 열정을 기울이고 있다는 사실을 분명하게 보여줄 수 있기를 바랍니다. 전세계 사용자들을 위해 최고의 서비스를 제공하고자 하는 이러한 우리의 열정은 전례가 없습니다. 구글은 뛰어난 랭킹 시스템을 운용하며 매일 더 좋은 시스템을 개발하기 위해 부단히 노력하고 있습니다.

작성자: 아미트 싱할(Amit Singhal), 구글 펠로우(Google Fellow)

날짜: 2008년 7월 18일 금요일

지난번 우디 만버(Udi Manber) 부사장이 검색결과의 랭킹 업무를 담당하고 있는 구글 검색 품질(search quality) 팀에 대해 소개한 적이 있습니다. 만버 부사장은 핵심 랭킹(Core Ranking), 인터내셔널 검색(International Search), 사용자 인터페이스(User Interfaces) 그리고 그 외의 팀들을 포함한 ‘퀄러티(Quality)’ (검색 품질을 담당하는 팀을 줄여서 주로 “퀄러티” 라고 부르고 있습니다) 내의 다양한 팀에 대해 소개 했습니다. 저는 이번 시간에 이 중 한 팀에 대해 보다 자세히 설명 드리고자 합니다. 이는 바로 핵심 랭킹(Core Ranking) 팀입니다.
날짜: 2008년 7월 18일 금요일

지난번 우디 만버(Udi Manber) 부사장이 검색결과의 랭킹 업무를 담당하고 있는 구글 검색 품질(search quality) 팀에 대해 소개한 적이 있습니다. 만버 부사장은 핵심 랭킹(Core Ranking), 인터내셔널 검색(International Search), 사용자 인터페이스(User Interfaces) 그리고 그 외의 팀들을 포함한 ‘퀄러티(Quality)’ (검색 품질을 담당하는 팀을 줄여서 주로 “퀄러티” 라고 부르고 있습니다) 내의 다양한 팀에 대해 소개 했습니다. 저는 이번 시간에 이 중 한 팀에 대해 보다 자세히 설명 드리고자 합니다. 이는 바로 핵심 랭킹(Core Ranking) 팀입니다.

먼저 제 소개를 드리겠습니다. 제 이름은 아미트 싱할(Amit Singhal)이며, 현재 구글 랭킹 팀에 소속되어 있습니다. 1990년 대학원에서 컴퓨터 과학을 전공하며 처음 검색을 접한 이래로 지난 18년 간 검색분야에서 일해 왔습니다. 학계에서는 검색 분야를 정보검색(IR, Information Retrieval) 이라고 합니다. IR 연구원으로 10년을 일한 뒤 2000년도에 구글에 입사했으며 그 후 지금까지 구글 랭킹업무를 담당하고 있습니다.

구글 랭킹은 사용자의 검색어에 대한 가장 적합한 결과를 찾기 위한 알고리듬의 집합입니다. 구글은 매일 수 억 개의 검색어와 함께 수 십 억 개에 해당하는 웹 페이지 집합을 기반으로 이 같은 작업을 수행하고 있습니다. 이러한 알고리듬은 구글의 검색 서비스로 유입되는 모든 검색어에 적용됩니다. 가장 많이 알려진 구글 웹 검색에 사용되는 알고리듬은 이미지나 뉴스, 유튜브, 구글맵스, 제품 검색, 북서치 등과 같은 다른 검색 서비스에도 새롭게 적용되고 있습니다.

구글 랭킹과 관련해 제가 가장 많이 받는 질문은 “어떻게 랭킹 작업을 하는가?”에 관한 것입니다. 물론 구글과 같은 최신식의 랭킹 시스템을 구축하기 위해서는 많은 작업이 필요합니다. 이전에 블로그를 통해 이 같은 시스템을 가능하게 하는 기술에 대해 분석해 드린바 있습니다. 오늘은 구글 랭킹의 기본이 되는 철학에 대해 간단하게 설명드리고자 합니다.

1) 지역적 적합성을 가장 잘 반영한 결과를 전세계로 전달
2) 간단명료한 구성
3) 수작업의 배제

첫번째 철학은 이해하시기 쉬울 것입니다. 구글은 검색에 대한 열정을 다해 모든 사용자들의 검색이 가장 적합한 결과를 얻기를 원하고 있습니다. 국가나 언어, 검색어의 종류를 막론하고 이상적인 결과를 얻지 못했을 경우에는 이로부터 교훈을 얻어 향후 감색결과에 반영될 수 있도록 노력합니다(검색은 쉽게 풀리는 문제가 아니기 때문에 이 같은 일은 물론 일어나지요).

두 번째 철학 역시 이해하시기 쉽습니다. 모든 시스템 개발자들의 바람이 바로 시스템을 ‘간단명료’하게 하는 일 아니겠어요? 다양한 언어와 광범위한 분야의 검색어에 대한 결과 제공을 위해 더 복잡한 구조의 시스템으로 증가하는 검색어를 커버할 수도 있습니다. 하지만 구글은 검색결과의 품질을 떨어트리지 않으면서 구글의 시스템을 간단명료하게 유지시키는 일에 주력하고 있습니다. 이 같은 노력은 매우 가치 있는 것이기 때문에 계속적으로 진행하고 있습니다. 저희는 매주 10회 가량 랭킹을 변화시키고 있는데 이 같은 변화를 감행함에 있어 간단함은 매우 중요한 고려사항입니다. 구글 엔지니어들은 주어진 검색어에 대해 왜 이 같은 방식으로 페이지가 랭킹되는지에 대해 정확히 이해하고 있습니다. 이처럼 간단하고 이해하기 쉬운 시스템을 통해 구글은 보다 빠른 속도로 혁신을 단행하고 있으며 이는 결과로 나타납니다. 구글의 ‘간단 명료한 구성’ 에 관한 철학은 구글을 이끄는 중요한 핵심 요소 중 하나입니다.

구글 랭킹에 대해 이야기할 때 항상 일반적으로 따라오는 잘못된 질문이 있습니다: 바로 ‘구글은 검색결과를 편집하는가?’에 관한 것입니다. 이에 대한 대답은 ‘수작업의 배제’라는 세 번째 철학에 잘 드러나 있습니다. 웹은 사용자들에 의해 구축된다는 것이 구글의 입장입니다. 페이지를 만드는 것은 사용자 여러분들에 의해 이루어지고 구글은 그 페이지를 연결시키는 역할을 하고 있는 것이지요. 저희는 이 모든 사용자들의 업적을 구글 알고리듬을 통해 활용하고 있다고 볼 수 있습니다. 검색결과에 대한 최종적인 순위는 수작업이 아닌 바로 위대한 인터넷 커뮤니티의 산물을 활용하고 있는 구글 알고리듬에 의한 것입니다. 모든 사람들의 주관적 판단은 그야말로 주관적인 것이라고 생각합니다. 구글 알고리듬에 의해 추출된 정보는 이 같은 개인적 주관성에 비해 훨씬 뛰어난 것이라고 믿고 있습니다.

제대로 된 결과를 얻지 못하는 검색어가 나올 경우, 구글은 이를 랭킹 알고리듬을 보다 향상시킬 수 있다는 가능성의 의미로 받아드립니다. 이것이 검색결과에서 수작업을 배제하고 검색 알고리듬 향상에 주력하는 두 번째 이유입니다. 근본적인 알고리듬의 향상은 단순히 해당 검색어를 향상시키는 일에 그치지 않습니다. 이를 통해 검색어 전체에 대한 결과를 향상시킬 수 있으며 많은 경우 모든 언어에 적용이 가능합니다. 다만 구글에 의해 추천받은 웹사이트들에 대해서는 명확한 정책이 구축되어 있다는 점을 알려드립니다. 또한 구글의 정책에 위배되거나 기타 위반사항(법률적 요구, 아동포르노, 바이러스/멀웨어 등)이 있는 사이트들에 대해서는 제재조치를 취하고 있습니다.

다음 시간에는 구글 랭킹의 기술적 측면에 관해 현재 시행 중인 최첨단 테크닉의 몇 가지 예를 말씀드릴 예정이니 계속해서 관심 부탁 드립니다. 검색을 향한 저희 검색 연구원들의 열정은 그 누구보다도 뜨겁습니다. 그리고 저는 이 세상에서 가장 멋진 직업을 가진 사람입니다 :-).

작성자: 아미트 싱할(Amit Singhal), 구글 펠로우(Google Fellow)

작성자: 구글 그룹스 사용자 경험 부문 디자이너 브렛 라이더 구글 그룹스에서 가장 만족할 만한 성과 중 하나는 각 개별 그룹의 새로운 디자인입니다. 심플해진 디자인과 더욱 다양해진 새로운 기능들을 함께 통합하는 것이 가능해졌습니다. 그룹 운영자는 환영 메시지를 생성하거나 그룹을 상징하는 로고를 만들 수 있습니다. 글꼴이나 색상도 자신이 좋아하는 스타일을 선택 ...
작성자: 구글 그룹스 사용자 경험 부문 디자이너 브렛 라이더
날짜: 2008년 7월 14일 월요일

오늘은 여러분들께 더욱 새로워진 구글 그룹스를 소개해 드리고자 합니다. 여러분이 처음 구글 그룹스를 보고 ‘쿨’한 또는 ‘매력적’인 서비스라고 생각했을지 모릅니다. 구글 그룹스의 기능 향상 업무를 담당하고 있는 저에게 구글 그룹스 팀에서 일할 수 있다는 것은 굉장히 설레고 흥분되는 일이었습니다. 그룹스 디자이너로서 이전에 개발된 구글 제품을 더욱 멋지고 사용하기 편리하도록 만드는 것은 저에게 아주 소중한 경험입니다.
구글 그룹스에서 가장 만족할 만한 성과 중 하나는 각 개별 그룹의 새로운 디자인입니다. 심플해진 디자인과 더욱 다양해진 새로운 기능들을 함께 통합하는 것이 가능해졌습니다. 그룹 운영자는 환영 메시지를 생성하거나 그룹을 상징하는 로고를 만들 수 있습니다. 글꼴이나 색상도 자신이 좋아하는 스타일을 선택해 맞춤형으로 제작할 수 있습니다. 다시 말해 여러분들이 여러 차례 피드백을 주신 것처럼 여러분들의 그룹을 자신의 스타일에 맞게 만들 수 있는 것입니다.

특별히 또 말씀드리고 싶은 것은 그룹 내 웹페이지 작성 기능으로 그룹 내 회원 누구나 페이지를 보고 의견을 제시할 수 있어 페이지의 공동 작성이 가능해 졌다는 것입니다. 저희는 고정화된 템플릿을 제공하는 대신 구글 페이지 작성기의 많은 기능을 그룹스 안으로 통합했습니다. 이것을 이용하면 ‘학교 에세이’, ‘가족사’, ‘사진이 있는 웹 페이지’, ‘링크 모음’ 등 여러분이 그룹 내에서 필요한 것을 정확히 만들 수 있습니다.

기타 향상된 그룹스 기능은 다음과 같습니다:

· 온라인 또는 그룹내 토론을 지메일(Gmail)의 메시지 카드를 이용해 쉽게 만들 수 있습니다.
· 파일 기능이 추가돼 그룹 내의 다른 사람들과 문서를 공유할 수 있습니다.
· 회원 정보 페이지를 통해 다른 회원에 대한 이해를 더욱 높일 수 있습니다.

직접 구글 그룹스를 한번 사용해 보세요. 그리고 어떤 점이 좀더 개선되어야 하는지 꼭 알려주시기 바랍니다.

날짜: 2008년 7월 10일 목요일
작성자: 소프트웨어 엔지니어 매트 커츠

안녕하세요?

현재 구글 웹스팸 업무를 총괄하고 있는 소프트웨어 엔지니어 매트 커츠입니다. 저는 여러분들께 최대한 관련성이 높고 유익한 검색결과를 전달하는 책임을 맡고 있습니다. 혹시 웹스팸을 처음 들어보신 분들을 위해 간단히 설명 드리면, 웹스팸은 웹사이트가 교묘하게 페이지랭크에서 높은 순위를 차지하거나 또 다른 방법으 ...
날짜: 2008년 7월 10일 목요일
작성자: 소프트웨어 엔지니어 매트 커츠

안녕하세요?

현재 구글 웹스팸 업무를 총괄하고 있는 소프트웨어 엔지니어 매트 커츠입니다. 저는 여러분들께 최대한 관련성이 높고 유익한 검색결과를 전달하는 책임을 맡고 있습니다. 혹시 웹스팸을 처음 들어보신 분들을 위해 간단히 설명 드리면, 웹스팸은 웹사이트가 교묘하게 페이지랭크에서 높은 순위를 차지하거나 또 다른 방법으로 검색엔진 품질 가이드를 위반하였을 때 검색결과로 나타나는 스팸 정보를 의미합니다. 아래 검색결과 링크를 클릭해보면 웹스팸이 무엇인지 알 수 있습니다.


이런 페이지는 검색 의도와는 무관한 내용으로 사용자에게 불편을 줍니다. 위의 예에서 볼 수 있듯이 웹스팸은 연관된 내용 없이 부적절한 링크를 제공하기 때문에 사용자들에게 전혀 도움이 되지 않는 정보를 제공합니다. 여러분이 이러한 검색결과에 노출되지 않도록 하기위해 저희는 부단히 노력하고 있습니다. 구글 검색결과에 있는 링크를 클릭했는데 위와 같은 페이지로 연결된다면 사용자가 받는 스트레스는 이만 저만이 아닐 것입니다.

최근에는 사용자들이 이처럼 노골적인 웹스팸을 접하게 되는 경우가 많이 줄었습니다. 하지만 구글이 인기있기 전부터 또 효과적인 스팸 방지 기능을 개발하기 이전부터 웹스팸은 매우 심각한 문제였습니다. 자신의 이름을 검색했는데 성인 사이트가 나오면 조금 불쾌하고 성가신 일로 그칠 수 있습니다. 하지만 대다수의 경우 검색결과에서 관련성이 매우 중요하기 때문에 웹스팸 문제는 굉장히 심각합니다. 예로 들어 전립선암에 관한 검색을 했는데 링크된 페이지들이 스팸으로 가득차 있다면 유용한 도구로서의 검색엔진의 가치는 크게 떨어지게 됩니다.

구글이 웹스펨을 차단하기 위해 사용하는 방법 중 하나는 검색 로그와 관련된 데이터를 활용해 연관성이 높은 정확한 검색 결과를 전달하는 것입니다. IP주소나 쿠키 정보와 같은 로그 데이터로 인덱스의 크기, 커버리지, 결과의 최신성, 스팸 등과 같은 검색품질의 다양한 측면을 파악할 수 있는 측정지표를 만들 수 있습니다.

구글은 새로운 측정지표를 개발할 때마다 반드시 기존 검색어와 결과를 이용해 로그 데이터를 검토하고 새로운 스팸 지표를 산출합니다. 검색 로그를 통해 과거로 돌아가 구글이 몇 개월 전 검색어에 대해 얼마나 적절한 검색결과를 제공했는지 확인해보는 것입니다. 새로운 유형의 스팸을 더욱 정확하게 측정하는 지표가 개발되면 앞으로 있을 웹스팸 검출 성공 사례를 추적하는 동시에 로그 데이터를 이용해 몇 개월 전 혹은 몇 년 전에 존재한 웹스팸 처리방법을 확인할 수 있습니다.

이처럼 사용자의 IP주소와 쿠키 정보는 웹스팸 방지를 위해 매우 중요한 정보라고 할 수 있습니다. 합법적인 사용자에 의한 검색인지 혹은 검색봇(bot)이나 기타 부정한 방법에 의한 검색인지를 가려낼 수 있기 때문입니다. 예를 들어 검색봇이 구글에 같은 검색어를 반복적으로 보낸다면 우리는 이 검색어들을 폐기한 뒤 사용자들이 접하는 스팸의 양을 측정합니다. 이러한 로그 데이터, IP 주소, 쿠키와 같은 모든 정보는 여러분의 검색 결과를 더욱 정확하고 관련성 있게 만들어 줍니다.

웹스팸은 완전히 해결된 문제가 아닙니다. 구글은 작년에도 중국 도메인 인덱스에 다량의 웹스팸이 들어 있는 것을 발견했습니다. 일부 스패머들이 저렴한 .cn 도메인을 대량으로 구매한 뒤 잘못된 철자와 포르노 관련 문구로 도메인을 가득 채운 것입니다. 관심이 높은 사용자들은 블로그를 통해 관련 내용을 접해보셨겠지만, 일반 사용자들은 이런 사실 조차 알지 못했을 것입니다. 대다수의 사용자들이 잘못된 검색 결과를 인식하지 못한 데는 이유가 있습니다. 구글이 .cn 관련 스팸을 찾아낸 뒤 이에 신속하게 대응할 수 있는 엔지니어링 프로젝트를 수립했기 때문입니다. 이같은 문제를 파악하기 위한 기초 정보인 로그 데이터가 없었다면, 더욱 많은 구글 사용자들이 웹스팸 공격을 당했을지도 모릅니다.

가장 이상적인 것은 대부분의 사용자들이 구글에 웹스팸 팀이 있다는 사실 조차 인식하지 못하는 것입니다. 우리가 맡은 업무를 잘 수행한다면 사용자 여러분이 간혹 낮은 수준의 검색 결과를 얻는다 하더라도 적어도 교묘하게 다른 URL로 유도하는 리다이렉트나 원치 않는 성인 사이트, 횡설수설하는 기타 웹스팸들과 마주치는 경우는 생기지 않을 것입니다. 결론적으로 로그 데이터는 사용자의 검색 경험 품질이 낮아지지 않도록 구글이 한발 앞서 새로운 스팸 트렌드를 발견하고 이에 대응할 수 있게 해줍니다. 앞으로도 사용자들을 위한 이러한 노력은 계속 될 것입니다.

작성자: 사이트 신뢰도 엔지니어 올리비어 베이작
날짜: 2008년 7월 3일 목요일

1년 전 제가 지메일(Gmail)을 쓰기 시작했을 때 기존에 쓰던 다른 계정에 많은 이메일이 보관되어 있었습니다. 저는 이메일을 오랫동안 저장해 두고 자주 검색해 보는 편이라 기존 메일을 모두 지메일로 옮겨서 하나로 사용하기를 원했습니다. 메일을 하나로 통합하는 작업은 매끄럽게 진행되었고 이후 휴대폰을 포함한 모든 기기를 통해 편리하게 이메일에 접속할 수 있었습니다. 이 과정에서 발견한 몇 가지 유용한 팁을 여러분과 공유하고 싶습니다.
작성자: 사이트 신뢰도 엔지니어 올리비어 베이작
날짜: 2008년 7월 3일 목요일

1년 전 제가 지메일(Gmail)을 쓰기 시작했을 때 기존에 쓰던 다른 계정에 많은 이메일이 보관되어 있었습니다. 저는 이메일을 오랫동안 저장해 두고 자주 검색해 보는 편이라 기존 메일을 모두 지메일로 옮겨서 하나로 사용하기를 원했습니다. 메일을 하나로 통합하는 작업은 매끄럽게 진행되었고 이후 휴대폰을 포함한 모든 기기를 통해 편리하게 이메일에 접속할 수 있었습니다. 이 과정에서 발견한 몇 가지 유용한 팁을 여러분과 공유하고 싶습니다.

설정
우선 POP 설정을 통해 기존 계정에서 메일을 회수하는 단계를 거쳐야 합니다. 먼저 지메일 상단의 환경 설정 > 계정 > 다른 계정에서 메일 가져오기 > 다른 메일 계정 추가를 클릭합니다. 새로운 창이 열리면 가져올 이메일 주소를 입력한 뒤 "다음단계"를 클릭합니다.

다른 계정에서 받은 이메일에는 "가져옴"(혹은 자신이 적합하다고 생각하는 라벨)이라고 라벨 표시를 해둔다면 추후에 가져온 이메일을 따로 구분하기 쉽습니다.


이후 "계정추가"로 인증을 받은 뒤 마지막으로 "아이디@gmail.com으로 메일을 보내기를 원합니다"를 선택하시면 됩니다. 저는 지메일의 "from:나" 검색 기능을 자주 사용합니다. 이 기능은 제가 어떤 이름이나 주소를 사용했는지에 관계없이 제가 보낸 모든 메일을 볼 수 있게 해줍니다. 저는 예전 주소와 닉네임으로 보낸 모든 이메일들을 찾을 수 있도록 해두고 싶었고 앞서 말한 마지막 단계가 이를 가능하게 했습니다.

기존 주소로 이메일 보내기
지메일 발신자 메시지에서 "보낸사람" 입력란에 지메일 주소가 아닌 기존 이메일 주소가 표시되도록 하려면 다음 단계를 참고하세요.

환경설정 > 계정 > 다음주소에서 메일 보내기 > 다른 메일 계정 추가.

"다음 단계"와 "인증 보내기"를 클릭하시면 다른계정 인증 받기에 관한 설명을 이메일을 통해 받게 됩니다. 설정이 완료되면 메일을 회신 또는 전달할 때 "보낸 사람" 필드에서 여러분이 설정한 주소를 선택할 수 있습니다.

지메일로 기존 주소에 있던 모든 메일을 가져오는 데는 시간이 좀 걸릴 수 있습니다. 하지만 적어도 저에게는 그것이 충분히 가치 있는 작업이었습니다.