작성일: 2008년 5월 30일 금요일
서치 퀄러티(Search Quality)는 구글 검색결과의 순위를 책임지고 있는 팀의 이름입니다. 저희가 하는 일은 구글을 통해 하루에 검색되는 수 억개의 질문들에 대해, 1초도 안되는 시간에 수십억 개의 웹페이지 중 어떤 페이지를 어떤 순서로 보여줄 것인가를 결정하는 것입니다.수많은 사람들이 구글을 이용하지만, 검색 결과 순위가 어떻게 매겨지는지에 대해 알려진 바는 놀라울 정도로 없는 편입니다. 이는 전적으로 저희 책임이지만 사실은 고의적인 것입니다. 솔직히 말씀 드리면, 저희 스스로 업무를 비밀에 붙이고 있습니다. 여기에는 ‘경쟁력’과 ‘남용방지’ 라는 두 가지 이유가 있습니다. 경쟁력에 관해서는 굳이 부가 설명이 필요없을 듯 합니다. 자사의 기술력을 경쟁사와 공유하려는 회사는 없기 때문이지요. 남용방지는 구글의 랭킹 공식을 누구나 쉽게 알 수 있을 경우 발생할 수 있는 문제 즉, 사람들이 쉽게 속임수를 쓰는 것을 막기 위한 것입니다. 모호성을 이용한 보안은 가장 강력한 수단도 아니고 전적으로 의존할 수 있는 것은 아니지만 위와 같은 남용을 막는 데 크게 기여할 수 있습니다.
랭킹 알고리즘 기술은 여러 측면에서 볼 때 구글의 보석과도 같은 존재입니다. 저희는 이를 매우 자랑스럽게 여기며, 또 이를 보호하기 위해 최선을 다하고 있습니다. 한 명의 프로그래머 혹은 과학자가 이 일을 전담했다고 가정해 봤을 때 천 년 이상이 소요될 시간과 노력이 이 알고리즘 개발에 직접 투입됐습니다. 또한 지금까지 개선을 위한 혁신의 노력을 게을리 하고 있지 않습니다.
그러나 비밀유지를 고집하는 것만이 이상적인 것은 아닙니다. 이 블로그를 통해 여러분들과 과거보다 좀더 많은 정보를 공유하고자 합니다. 정기적으로 새로운 소식을 전해 드리는 것과 더불어, 잘 알고 있지 못한 기존의 스토리에 대해 설명해 드릴 것입니다. 또한 관련하여 조언을 드리며, 뉴스를 전달하고 함께 대화에 참여하도록 노력하겠습니다. 우선 저희 팀에 관한 전반적인 설명을 드리도록 하겠습니다. 이후 보다 많은 내용들이 블로그를 통해 전달될 것 입니다.
먼저 제 소개를 드리자면, 제 이름은 우디 만버(Udi Manber)이며, 구글의 엔지니어링 부사장으로 서치 퀄러티(Search Quality) 팀을 책임지고 있습니다. 구글에서 일한지는 2년이 조금 넘었으며 검색 기술 분야에서 20년 가까운 경력을 가지고 있습니다.
저희 조직의 심장부는 핵심 랭킹 업무를 담당하는 팀입니다. 순위에 관한 업무는 대부분의 사람들이 생각하는 것보다도 훨씬 더 어렵습니다. 그 이유 중 하나는 본래 언어 자체가 가지고 있는 모호성 때문입니다. 또한 각각의 웹페이지 문서들이 일정한 규칙에 따라 작성되고 있지 않으며, 정보를 전달하는 방법에 표준 규격이 있지 않은 문제가 있습니다. 따라서 저희는 누가 어떤 이유에서 만들었는가에 상관없이 모든 웹페이지를 이해하고 있어야 합니다. 여기까지가 문제 해결의 절반에 해당합니다. 이에 더해, 검색어를 통해 사용자들의 의도를 파악해야 하는데, 검색어는 보통 세 단어 이하의 조합으로 이루어지기 때문에 이를 이해하는 것은 쉽지 않습니다. 또 이 같은 검색어를 저희가 알고 있는 모든 웹페이지와 매칭시켜야 합니다. 검색을 하는 사람들이 다른 만큼 검색의 이유 또한 천차만별이지요. 저희는 이 모든 것을 1000분의 1초 안에 처리해야 합니다.
저희 랭킹 알고리즘의 가장 대표적인 것은 구글의 설립자인 래리 페이지와 세르게이 브린이 개발한 페이지랭크 알고리즘입니다. 이 페이지랭크는 지금까지 사용되고 있지만, 이는 현재 매우 거대한 시스템의 일부만을 구성하고 있습니다. 다른 부분들은 언어 모델(구절, 동의어, 발음 구별 표시, 맞춤법 검사 등을 다루는 능력), 검색어 모델(단어 자체만이 아니라 현재 그 단어를 사람들이 사용하는 방식), 시간 모델(일부 검색어는 30분 전에 올라온 페이지 혹은 테스트 중인 페이지가 정확한 답을 포함하고 있을 수 있음), 그리고 맞춤형 모델(모든 사람들이 똑같은 것을 원하는 것은 아님)이 있습니다.
저희 조직 중 한 팀은 우리의 업무가 제대로 진행되고 있는가를 평가하는 일을 담당하고 있습니다. 평가방식은 매우 다양하게 진행되지만, 목표는 늘 동일합니다. 바로 사용자 경험을 향상시키는 것입니다. 이것은 우리의 유일한 목표입니다. 평가는 크게 세 가지로 이루어 집니다. 잘못된 점이 없는가를 확인하기 위해 매분 당 이뤄지는 자동 평가, 전반적인 검색 품질에 관한 정기 평가, 그리고 가장 중요한 과학적 알고리즘의 개선에 관한 평가가 있습니다. 엔지니어의 아이디어를 통해 개발된 새로운 알고리즘은 저희팀을 통해 철저하게 검증됩니다. 이 팀은 새로운 아이디어에 대한 모든 데이터를 검사하고, 그 아이디어의 가치를 결정하는 통계학자들로 구성되어 있습니다. 회의를 통해 매주 새로운 아이디어를 검토하고 신규 서비스 런칭을 승인합니다. 이 같은 과정을 통해 2007년 한 해 동안 새롭게 향상된 450건의 서비스를 런칭했으며, 이는 일주일 평균 9건에 해당하는 것입니다. 이 중 일부는 내용이 아주 간단해 단번에 알 수 있는 것들도 있습니다. 히브리어 약자 표기를 처리하는 방법에 관한 것이 바로 그 대표적인 예입니다(히브리어에서 약자 표기는 마지막 글자 앞에 (") 표시를 함, IBM은 IB"M으로 표기). 물론 복잡한 경우도 있습니다. 지난 1월 페이지랭크 알고리즘에 커다란 변화를 준 것이 한 예입니다. 저희는 대부분의 시간을 관련성(relevancy)을 향상시키는 방법을 연구하는데 사용하고 있지만, 알고리즘 자체를 단순화하기 위한 프로젝트도 진행합니다. 단순한 것이 좋은 것이니까요.
인터내셔널 검색은 지난 2년 동안 저희가 중점을 두어온 분야 중 하나입니다. 이는 주요 언어뿐만 아니라 지구상에서 쓰이는 모든 언어를 대상으로 하는 것입니다. 예를 들어, 지난해 우리는 전 세계에서 오직 8백만 명이 쓰는 언어인 아제르바이잔어 검색마저 현저히 향상시켰습니다. 지난 몇 달 동안 맞춤법 검사 기능을 추가한 언어는 에스토니아어, 까딸루나어, 세르비아어, 세르보-크로아티아어, 우크라이나어, 보스니아어, 라트비아어, 타갈로그어, 슬로베니아어, 페르시아어입니다. 저희는 전세계 사람들과 네트워크를 형성해 이 같은 언어 서비스에 대한 피드백을 받았고, 서로 다른 언어를 사용하는 구글 내의 많은 자원 봉사자들로부터 도움을 얻어 검색 서비스를 향상시키고 있습니다.
또다른 팀은 새로운 기능과 사용자 인터페이스(UI)에 관한 연구에 매진하고 있습니다. 멋진 자동차에는 그에 맞는 뛰어난 엔진이 필요하지만 그것만으로는 충분하지 않습니다. 운전자가 편안한 느낌을 갖고 손쉽게 운전할 수 있도록 해야합니다. 구글 검색의 사용자 인터페이스는 매우 간단합니다. 구글 사용자들 중 도움말 페이지를 읽는 사람들은 거의 없습니다. 이는 설명이 필요 없을 정도로 쉽게 검색을 할 수 있다는 뜻입니다(하지만 도움이 될 만한 내용이기에 지속적으로 업데이트하고 있습니다.). 새로운 기능을 추가할 때에 가장 중요한 점은 바로 파악이 가능하고, 모든 사람들이 쉽게 사용할 수 있어야 한다는 것입니다. 과거 1년 동안 가장 눈에 띄는 변화 중 하나가 바로 유니버설 서치였습니다. 이외에 구글 노트북, 맞춤 검색 등이 있고 iGoogle 역시 크게 향상됐습니다. UI 팀은 사용자를 연구하고 새로운 기능을 평가하는데 전문가 팀의 도움을 받고 있습니다. 이들은 사용자 패턴을 파악하기 위해 전세계를 돌며 사용자 집을 직접 방문하기도 합니다(걱정 마세요, 이들은 불청객이 아니니 느닷없이 찾아가는 일은 없습니다!).
웹스팸이나 기타 웹남용 퇴치 업무에만 전념하는 팀도 있습니다. 이 팀은 특정 검색어가 숨겨진 텍스트, 주제와 관련 없는 내용으로 구성된 오프토픽(off-topic) 페이지, 그리고 검색 결과 순위를 높이기 위해 이용되는 교묘한 수법에 관한 문제들을 연구합니다. 이들은 스팸의 새로운 현상을 찾고 측정 가능한 방법으로 이에 관한 대책을 마련합니다. 모든 다른 팀들과 마찬가지로 이들 역시 국제적인 차원에서 업무를 진행하고 있습니다. 웹스팸 그룹은 구글 웹마스터 센트럴 팀과 긴밀히 협력해 모든 사람들과 지식을 공유하며 사이트 운영자들의 목소리에 귀 기울이고 있습니다.
특정 프로젝트를 전담하는 팀들도 있습니다. 저희 조직구조는 정해진 틀에 맞춰져 있지 않습니다. 서로 자유롭게 오가며 늘 새로운 프로젝트와 함께 합니다.
검색에서 중요한 것 중 하나는 사용자들의 기대치가 빠르게 높아지고 있다는 점입니다. 내일의 검색어는 오늘의 검색어 보다 더 어렵고 복잡해 질 것입니다. 컴퓨팅 속도가 18개월마다 두배씩 늘어난다는 무어(Moore)의 법칙처럼, 어렵고 복잡한 검색어 또한 단시간에 두배씩 늘어난다는 것은 불문율과도 같습니다. 이를 정확히 측정하는 것은 불가능하지만 우리 모두가 그렇게 느끼고 있습니다. 저희는 과거의 영광에 자만하지 않고 더욱 열심히 노력해서 새로운 도전에 맞설 것입니다. 앞서 말씀 드린 바와 같이, 여러분께 서치 퀄러티에 관한 새로운 내용을 지속적으로 전달해 드리겠으니 많은 관심 부탁 드립니다.
작성자: 우디 만버(Udi Manber) 구글 엔지니어링 부사장
작성자: 구글코리아 엔지니어링팀 김현경 날짜: 2008년 5월 28일 수요일 안녕하세요?
구글 엔지니어분들과 서로 정보를 교류 할 수 있는 구글나이트(기술 강연회, Tech Talk) 행사에 외부 소프트웨어 엔지니어 여러분들을 초대합니다.
구글 엔지니어팀의 근무 환경을 설명할 때 흔히 '수평적인 조직 문화', '정보 공유', '열려진 대화' 등의 표현이 사용됩니다. 특히 구글 엔지니어들은 프로젝트를 수행하는데 있어 근무하는 지역이 한정되어 있지 않아, 다른 국가의 구글 오피스에서 근무하는 엔지니어들간의 교류가 항상 열려 있습니다.이러한 구글 엔지니어링 문화를 외부 개발자분들과 공유할 수 있는 기회를 갖고자, 6월 4일 수요일 저녁 7시 구글코리아 본사에서 아래와 같은 주제로 다른 국가에서 근무하고 계시는 구글 엔지니어분들과 함께 구글 나이트(기술 강연회, Tech Talk) 행사를 마련했습니다.
Fred Zhang•Topic: Google Picasa•Bio: Fred Zhang is a software engineer at Google. Since Aug, 2006, he has been working on Google Picasa client application, mainly focusing on video, text rendering, slideshow and animations. Before joining Google, he had worked in software industry on Video-On-Demand/DRM, gaming, networking, image processing and CAD/CAM for over 14 years. He received B.S. in Computer Science from Zhejiang University (China) and M.S. in Electrical Engineering from University of Washington (Seattle). He enjoys sports, movies, and bridge game.David Ziegler•Topic: Internet-Scale Computing•Bio: David Ziegler has been at Google since graduating from MIT in 2005, where he studied operating systems and distributed systems. Since joining the web search indexing team, he has become one of the tech leads within the group. Currently, he is leading a group designing and implementing new infrastructure for the indexing system.관심있으신 분들께서는 아래 인적사항을 작성해 gnightevent@gmail.com으로 보내주시기 바랍니다. 참석이 확정되신 분에 한해 개별적으로 연락드리겠습니다.이름 : / 출신학교 : / 전공학과 :경력 : / 현직장 : / 직책 :현재 담당 업무 혹은 프로젝트 (1줄 이내)관심 있으신 분들의 많은 신청 바랍니다. 감사합니다.
작성자: 카이푸 리, 구글 차이나 대표 날짜: 2008년 5월 19일 월요일 일주일 전 진도 7.8의 강진이 중극 쓰촨성을 강타했습니다. 이로 인해 중국에 있는 모든 사람들이 큰 충격에 빠졌습니다. 사망자가 1만 명에서 2만 명, 다시 3만 2000명으로 증가했다는 소식을 들었을 때 모두들 실의에 잠겼습니다. 사망자수는 계속해서 늘어나고 있고, 부상자와 실종자 수는 이 보다 몇 배 많은 상태입니다. 그러나 이 같은 대참사에도 불구하고 중국인들은 강한 회복력과 용기를 보여주고 있습니다. 피해자를 돕기 위한 공수 물자 지원, 헌혈 및 구조 행렬이 끝없이 이어지고 있습니다. 한 용감한 임직원은 자신의 지프차로 수백 마일을 이동하면서 구조물들을 들어내고 몇몇의 소중한 생명들을 구해내기도 했습니다. 택시 운전기사들은 영업을 포기하고 피해지역으로 가서 사람들을 도왔습니다. 수십만 명의 용감한 군인들은 자신의 생명을 무릅쓰고 가능한 많은 생존자들를 구하기 위해 힘쓰고 있습니다. 이곳 베이징에서도 천 여 개의 가정이 자발적으로 나서 갑작스럽게 부모를 잃은 어린이들을 입양하고 있습니다. 모든 사람들이 도움의 손길을 보내오고 있습니다. 이는 구글러도 예외가 아닙니다. 지진 발생 후 얼마 지나지 않아 중국 구글팀은 한자리에 모여 구글의 자원과 기술로 이들을 돕기위해 나섰습니다. 구글은 중국 정부와 협력해 쓰촨성(Earth KML)의 새로운 위성 사진을 확보했으며, 이를 통해 정부차원의 복구 노력에 도움을 주고 있습니다. 또 구글 맞춤 검색(CSE: Custom Search Engine)을 기반으로 한 “잃어버린 사랑하는 사람 검색(lost loved one search)” 기능을 개발해 가동하고 있습니다. CSE 인덱스를 추가하기 위해 수백 명의 구글러들이 24시간 일하며 간행물에 나온 일람표나 병원기록, 뉴스 보도, 커뮤니티 사이트 등을 면밀히 조사했으며, 구글 차이나에서 제공하는 뉴스 검색, 비디오 검색, 이미지 검색, 블로그 검색, 원박스 등을 통해 상세한 내용을 전달하고 있습니다. 또, 파트너십을 통해 커뮤니티 사이트를 구축하고, 홈페이지 프로모션과 지도 기반 정보 페이지를 도입했습니다. 중국 구글팀은 매우 헌신적이고 열정적입니다. 저는 이들과 함께 일하는 것을 매우 영광스럽게 생각합니다.중국 구글러들의 이 같은 노력에 더해 전세계 구글러들은 상당한 액수의 기부금을 조성해 구조활동을 돕고 있습니다. 우리는 기금 조성 광고와 공익 광고 집행을 위해 필요한 대규모 예산을 기부해 전세계 구호 기구들을 돕기로 결정하였고, 2백만 달러의 별도 기금을 조성해 재난구호와 복구를 위해 사용할 것을 약속했습니다. 우리는 또한 구글 기부 페이지 (Google Checkout donations page)를 만들었습니다. 이를 통해 누구나 손쉽게 중국빈곤퇴치재단(China Foundation for Poverty Alleviation)의 협력 기관인 머시코(Mercy Corps)와 중국적십자협회(Red Cross Society of China)의 협력기관인 청화재단(Tsinghua Foundation)에 기부금을 전달할 수 있습니다. 이들 단체로부터 모든 기부금은 즉시 재난 구호에 쓰이게 된다는 확인을 받았습니다.구글의 노력은 정부, 민간기업, NGO을 포함한 지구촌 수많은 사람들의 거대한 노력의 일부분에 지나지 않습니다. 모든 사람들이 이번 재해를 총체적으로 가급적 빠르고 해결하기 위해 고군분투하고 있습니다. 지진으로 희생된 사람들의 명복을 빌어주세요. 부상자들과 생존자들은 하루빨리 회복되시길 진심으로 바랍니다. 우리 모두가 중국 사람들로부터 근심을 용기로, 고통을 연민으로, 슬픔을 사랑으로 바꾸는 방법을 배울 수 있기를 바랍니다. Dunxa9EVJZVnl+9UOlCa2deelwCQW7PMSkS8qOPB6LY=
작성자: 구글 소프트웨어 엔지니어 이충식날짜: 2008년 5월 18일 일요일안타깝지만 전세계 웹페이지 중 한글로 된 것은 어림잡아 3% 정도밖에 안된다고 합니다. 그렇다면 국내 인터넷사용자들에게 다른 나라 언어로 된 97% 웹페이지는 있으나마나한 정보가 될 수도 있지 않을까요? 즉 언어가 다르기 때문에 국내사용자가 접할 수 있는 정보 양이 극히 적어질 수 있다는 것은 참으로 안타까운 일입니다.
구글은 이러한 언어의 장벽을 없애고자 자동번역서비스에 많은 기술력을 투자해오고 있었고, 그 결과물로 최근 저희 구글은 전세계 23개 언어를 자동 번역하는 구글 번역 서비스를 확장, 출시하였습니다.
국내 사용자분들도 이 구글번역 서비스를 활용하여 다른 나라 언어로 되어 있더라도 편리하게 정보를 접하시길 바라는 마음에, 오늘은 구글 번역 서비스가 어떻게 달라졌는지를 소개해드릴까 합니다.먼저 구글 번역 서비스에 가보시면 예전과 다른 인터페이스로 여러분을 맞이하고 있다는 것을 알 수 있습니다.
뿐만 아니라 22개 언어를 한국어로 그리고 한국어를 22개 언어로 번역할 수 있도록 서비스를 확장했습니다. 기존에 제공되었던 영어는 물론이고 일본어, 중국어, 스페인어, 이탈리아어, 독일어, 러시아어로 된 문장을 한국어로 번역할 수 있습니다. 또한 ‘언어감지’ 기능을 통해 번역하고자 하는 문장의 언어를 자동으로 찾아내 원하는 국가의 언어로 검색할 수 있는 편리한 기능이 포함되어 있습니다.그렇다면 구글 번역 서비스를 통해 우리는 무엇을 할 수 있을까요?
위 그림은 구글 한국 뉴스가 아닙니다. 구글 일본 뉴스를 구글 번역 서비스를 통해 한국어로 번역한 화면입니다. 이제는 전세계의 많은 웹페이지를 한국어로 번역해서 볼 수 있게 되었습니다. 비록 완벽한 번역이 아니더라도 어떤 의미인가를 파악하는데는 큰 도움이 될 수 있습니다.이뿐만이 아닙니다. 구글의 강력한 번역 기능을 통해 외국어 웹 문서를 한국어로 검색할 수 있게 되었습니다. 기무라타쿠야, 모닝구무스메, 우타다히카루와 같은 일본 연예인들에 대한 정보를 얻고자 하는데 한국 사이트에서 제공하는 정보로 충분하지 않으시다고요? 혹은 교토 여행을 하고 싶은데 관련 정보가 충분하지 않나요? 그렇다면 구글 번역 서비스에서 ‘번역 검색’으로 들어가셔서 ‘기무라타쿠야’, ‘교토 여행’을 입력하고 일본어를 선택해 보세요. 여러분이 정말로 원하셨던 정보를 찾을 수 있는 기회가 한층 더 높아졌기를 바랍니다.그 외에도 구글 번역 가젯을 이용하면 여러분의 웹사이트를 다른 나라 언어로 보여줄 수도 있고, 구글 토크(GTalk)에서 자주 사용하시는 번역기를 등록하면 이 편리한 인터페이스로 간편하게 사전처럼 사용하실 수도 있습니다. iGoogle에 구글 번역 가젯을 등록해 언제든지 쉽게 구글 번역 서비스를 사용하실 수 있습니다.구글의 번역 서비스가 완벽하다고는 볼 수는 없습니다. 하지만 사용자 여러분들께 도움을 드리고자 지속적으로 서비스를 발전시켜 나가고 있습니다. 구글 번역기의 성능이 아직 여러분들의 기대에 미치지 못한다고 생각되더라도 너그러운 마음으로 사용해 주시고 아낌없는 조언을 부탁드립니다. 여러분의 의견에 언제나 귀 기울이고 있으며 앞으로 더욱더 정확한 번역 서비스로 보답하도록 최선을 다하겠습니다. =
안녕하세요. 구글코리아 블로그 운영팀입니다. 일년 중 가장 아름다운 계절 5월, 구글코리아에서 진행하는 아이구글(iGoogle) 오픈파티에 블로거 여러분들을 초대합니다!
이번 행사는 IT 분야 뿐만 아니라 예술, 문화, 지식 등 다양한 분야에서 참여와 공유라는 웹 2.0 의 시대정신을 가장 활발히 나누고 계신 블로거분들을 모시는 자리입니다. 아이구글(iGoogle) 오픈 파티에는 아이구글의 소개와 더불어 재미있고 알찬 내용들이 가득 준비되어 있습니다. 각기 다른 여러 분야에서 다양하게 활동하고 계신 블로거분들이 서로 교류하실 수 있는 장이 될 것이라 생각됩니다. 참여를 원하시는 분은 아래 연락처로 5월 12일 월요일까지 참가신청을 해주시기 바랍니다(행사 참가신청이 마감 되었음을 알려드립니다.).
- 일시 : 2008년 5월 14일(수) 오후 7시- 8시 30분
- 장소 : 구글코리아 본사 / 역삼역(2호선) 강남파이낸스센터(옛 스타타워) 22층
- 행사참가 문의 : 아이구글 행사 운영자 google@newscom.co.kr 02-6323-5072, 5043
변경전
이 프로젝트에는 제프 쿤스를 비롯해, 데일 치후리(Dale Chihuly), 콜드플레이(Coldplay), 다이앤 본 퍼스텐버그(Diane von Furstenburg), 돌체앤가바나(Dolce&Gabana), 얀 아르튀스-베르트랑 (Yann Arthus-Bertrand), 마이클 그레이브스(Michael Graves), 필립 스탁(Philippe Starck), 로버트 맨코프(Robert Mankoff), 마크 모리스(Mark Morris), 오스카 드 라 렌타(Oscar de la Renta), 앤 게디스(Anne Geddes), 토리 버치(Tory Burch) 등 이름만 들어도 알만한 세계적인 아티스트들과 디자이너들이 대거 참여하고 있습니다. 테마 작품을 만든 아티스트들 자체도 인상적이지만(여기 언급한 사람들은 전체의 20%밖에 안 됩니다), 더욱 놀라운 것은 그들의 작품입니다 – 모든 작품들이 너무나도 아름답습니다!지금까지의 아이구글이 사용자가 원하는 콘텐츠로 자신의 구글 홈페이지를 꾸밀 수 있게 하는 것이었다면, 아이구글 아티스트 테마편은 이 같은 개인화를 한 차원 더 높인 것이라고 할 수 있습니다 – 자신이 선택한 세계적인 아티스트의 작품을 나만의 홈페이지에 개성있게 나타낼 수 있기 때문이지요. 이는 훌륭한 예술이 그에 맞는 기술을 만났을 때 가능한 것입니다.이번 아이구글 아티스트 캠페인을 알리기 위해 금주 뉴욕 미트패킹 지역에서 야외 갤러리가 꾸며질 예정입니다. 이번 행사는 아이구글 아티스트들의 작품 이미지를 영상으로 제작해 야간에 빌딩과 보도, 그리고 거리에 투영시키는 행사로서 5월 1일 목요일부터 3일 토요일까지 진행됩니다. 링크를 클릭해서 행사장 위치를 확인하세요. 행사 장면은 비디오로 촬영한 후 유튜브에도 올릴 예정입니다.전시될 작품을 지금 확인해 보세요. 예술은 그 자체를 말해 드립니다! 지금 링크를 클릭해 여러분에게 어울리는 아이구글 테마 작품을 선택해 보세요.
작성자: 구글 보안팀 Panayiotis Mavrommatis 날짜: 2008년 4월 28일 월요일
구글은 온라인상의 정보(본문의 글과 같은 블로그)를 어떻게 하면 보다 안전하게 만들고 유해 프로그램으로부터 우리 스스로를 보호할 수 있는지에 관해 많은 고민을 합니다.-편집자
컴퓨터 보완과 관련하여 오늘은 멀웨어(malware)에 대해 이야기해 보도록 하겠습니다. 멀웨어란 "악성 소프트웨어(malicious software)"에서 나온 용어로 여러분이 사용하는 컴퓨터나 소프트웨어에 해를 끼칠 목적으로 만들어진 프로그램을 말합니다.
멀웨어는 여러분이 인식하거나 또는 그렇지 못한 상황에서 다양한 방법으로 우리의 컴퓨터에 침입하게 됩니다. – 이러한 침입은 흔히 멀웨어가 포함되어 있는 웹사이트를 방문하거나 겉으로 보기에는 아무 이상이 없는 소프트웨어를 다운로드 받을 때 일어날 수 있습니다. 멀웨어는 감염된 컴퓨터의 시스템을 느리게 하거나 사용자의 이메일 계정을 통해 가짜 메일을 전송하기도 합니다. 또한 여러분의 컴퓨터에 저장된 신용카드 번호나 패스워드 등 중요한 정보를 빼내어 갈 수도 있습니다.
과거에는 이 같은 멀웨어의 피해를 막는 방법으로 멀웨어 확산 목적으로 만들어진 유해 사이트나 기타 위험성이 있는 사이트에 대한 접근을 피하는 것이 해결책의 전부였습니다. 그러나 구글의 최근 연구에 따르면 멀웨어의 공격은 여러분이 흔히 안전하다고 느끼거나 합법적이라고 판단되는 사이트를 통해 더욱 많이 발생하고 있습니다. 이러한 사이트들은 실제로 여러분의 시스템을 지켜줄 보안 능력이 없습니다.
구글은 웹상의 멀웨어를 찾기위해 보안업계와 긴밀하게 협력하고 있으며, 관련 정보도 더욱 광범위하게 공유하고 있습니다. 구글은 수많은 자동화 시스템을 통해 잠재적 위험이 있는 사이트에 인덱스를 형성하고, 멀웨어를 확산하는 연결 사이트에 라벨을 추가 하고 있습니다. 구글에서 검색을 할 때 신고 표시가 있는 링크를 클릭하면, 사이트 실행에 앞서 경고 페이지가 뜨는 것을 볼 수 있습니다.
구글은 또한 안전하지 않은 사이트를 발견했을 경우, 사이트의 웹마스터에게 이를 알리게 됩니다. 이를 통해 웹마스터가 직접 해당 사이트를 정리하고 검사를 요청할 수 있는 방법을 제공하게 됩니다. 구글은 머지않아 멀웨어 확산을 부추기는 것으로 판단되는 사이트에 대한 상세한 정보를 제공할 것입니다. 이를 통해 사용자들은 왜 우리가 특정 사이트에 신고 표시를 했는지를 더욱 잘 이해할 수 있고, 웹마스터들은 자신들이 관리하는 웹사이트와 관련한 문제를 더욱 쉽게 파악해 문제점을 바로잡을 수 있을 것입니다.
구글의 이러한 모든 정책은 보안에 관한 구글의 철학을 반영하는 것입니다. 다시 말해 우리 모두가 위협요인을 찾고 이를 몰아내기 위해 함께 노력한다면 구글은 더욱 안전한 웹 공간을 만들 수 있을 것이라고 생각합니다. 물론 우리가 모든 것을 다 해결할 수는 없겠지요. 그만큼 구글 사용자들이야말로 멀웨어 방지에 핵심적인 역할을 하고 있다고 할 수 있습니다.
멀웨어에 노출될 가능성을 줄일 수 있는 몇 가지 유용한 방법을 아래와 같이 제안합니다:
• 바이러스 백신 프로그램의 사용. 대부분의 바이러스 백신 프로그램은 사용자 컴퓨터에 유해한 프로그램을 찾아 제거할 수 있는 기능을 갖고 있습니다. 여러분의 컴퓨터에 바이러스 백신 프로그램이 설치되어 있는지를 확인해 보세요. (만일 설치되어 있지 않다면 Google Pack을 통해 무료로 백신 샘플을 사용할 수 있습니다. 백신 프로그램은 항상 업데이트 해야하며 시스템 전체에 대해서도 주기적으로 검사해보아야 합니다.
• 운영체제와 브라우저의 주기적인 업데이트. 멀웨어가 전형적인 공격 표적으로 삼는 것은 컴퓨터 운영체제(Operating System)의 취약한 부분으로 여러분의 브라우저를 통해 멀웨어가 컴퓨터에 침입하도록 만듭니다. 운영체제와 브라우저 업체는 이 같은 취약점을 해결하기 위해 종종 프로그램 업데이트를 제공합니다. 브라우저와 운영체제는 모두 자동 업데이트를 설정해 놓으시고, 최신 업데이트가 잘 되고 있는지, 보안은 제대로 작동하는지를 경고 기능을 통해 확인할 수 있도록 설정하시기 바랍니다.
• 다운로드는 무엇이든 조심. 구글과 온라인 커뮤니티의 모든 사람들이 유해 사이트를 찾기 위해 열심히 노력하고 있음에도 불구하고, 멀웨어는 새로운 소스를 통해 계속적으로 나타나고 있습니다. 이메일 첨부문서를 열거나 플러그-인을 설치할 때 또는 익숙하지 않은 소프트웨어를 다운로드 받을 경우에는 항상 철저하게 생각하는 습관을 가지세요. 여러분이 위험성이 있는 다운로드를 항상 찾아낼 수 있는 것은 아니지만 몇 가지 주의 의무를 실천한다면 이러한 위험을 충분히 감소시킬 수 있을 것입니다.
신고 표시가 안된 잠재적 위험성이 있는 사이트를 발견하시면, 바로 신고를 부탁 드립니다. 멀웨어의 예방에 관한 더 자세한 설명은 StopBadware.org의 도움말 페이지를 참고하시기 바랍니다.
오늘은 지구의 날입니다!
지구의 날은 지구환경문제의 위기를 극복하고 함께 뜻을 모으기 위한 전 세계 시민들의 축제 입니다. 한국을 포함한 세계 184개국 약 50,000여개의 단체들이 지구의 날 행사에 참여하고 있으며, 매년 4월 22일 지구의 날에 각 국의 환경, 사회 상황에 맞게 자유롭게 지구를 위한 행사를 진행하고 있습니다. 세계 각 국에서 약 5억명 이상의 시민들이 참여하는 역사상 최대 규모의 글로벌 네트워크를 통한 환경행사가 바로 지구의 날인 것입니다.음식 남기지 않기, 휴지 줍기와 같은 작지만 큰 실천으로 지구를 사랑하는 하루가 되시길 바랍니다.
작성자: 구글 블로그 운영팀 날짜: 2008년 4월 18일 금요일
한국 최초의 우주인인 이소연씨가 10일간의 우주생활을 마치고 귀환합니다. 한국 우주인의 무사귀환을 기원하며 우리나라가 이로써 전세계 36번째 우주인 배출 국가가 되는 것을 축하하기 위해 18일부터 21일간 유튜브코리아 메인 페이지에서는 모두 12개의 우주 관련 동영상을 추천 동영상으로 소개하는 “스페이스 코리아 데이”를 진행합니다.유튜브는 세계 최대의 동영상 사이트로 우주와 관련된 동영상도 다양하게 검색해 찾아 볼 수 있습니다. 이번에 소개드리는 추천 동영상에는 방송에 소개되지 않았던 이소연씨와의 인터뷰, 소유즈 우주선의 발사 시뮬레이션 화면 뿐 아니라, 닐 암스트롱이 달에 착륙한 화면, 우주인들이 식사를 하고 이발을 하는 등의 다양한 우주 관련 동영상이 포함되어 있습니다.
작성자: 구글 R&D 센터 소프트웨어 엔지니어 변정근 날짜: 2008년 4월 17일 목요일
먼저 blogsearch.google.co.kr 검색창에 blogurl:'나의 블로그주소'를 입력합니다. 예를 들어 구글 코리아 블로그(http://googlekoreablog.blogspot.com)의 글들을 찾아보시려면 검색창에 blogurl:googlekoreablog.blogspot.com을 입력합니다.
내 블로그 글이 없다면 핑 서비스를 이용해보세요. 핑 서비스는 새로 작성된 블로그 글을 검색 엔진에 알려주는 서비스입니다. 새로운 주소의 블로그가 만들어졌거나 새로운 글이 작성되었을 때 검색 엔진이 바로 수집하는 것은 쉽지 않습니다. 그래서 새롭게 작성된 블로그 글을 검색 엔진에 직접 알려주어 가능한 빠른 시간내에 검색 가능하도록 하는 것이 핑 서비스입니다.
블로그 사이트나 설치형 블로그 저작 도구에 핑 서비스가 제공되는지 확인합니다.
• 핑 서비스가 제공되는 경우:관리자 설정 페이지에 명시적으로 구글로의 핑 서비스 제공 여부를 선택할 수 있는 경우가 있습니다. 그렇지 않은 경우 해당 업체에 문의합니다.• 핑 서비스가 제공되지 않는 경우:새로운 글을 작성하신 후, http://blogsearch.google.com/ping 에서 블로그 주소를 입력하고 'Submit Blog'버튼을 누릅니다.
핑이 완료되면 다음과 같은 메시지가 출력됩니다.
Thanks for the ping.
검색 허용
핑 서비스는 블로그 검색에 새로운 글이 작성 되었음을 알려주는 방법입니다. 핑 서비스를 이용하는 것이 곧 검색 결과에 포함되는 것을 의미하지는 않습니다. 특히 블로그 사이트의 기술적인 문제로 검색이 허용되지 않는 경우도 있으므로 블로그 사이트의 검색 수집 설정 및 정책을 확인하시는 것이 바람직합니다.
웹 페이지를 검색 엔진이 검색해도 되는지를 명기하고 검색엔진이 이를 지키도록 하는robots.txt라는 파일과 이와 관련된 사항들이 있습니다. 현재 구글 블로그 검색은 다음의 세 항목이 모두 검색 허용되어 있는 경우에 한하여 검색 수집을 하고 있습니다.• 블로그 URL: 블로그 HTML 페이지가 존재하는 주소예를 들어 http://blog-searchable.blogspot.co.kr/robots.txt에는 다음과 같은 내용이 있습니다.
User-agent: Mediapartners-GoogleDisallow:
User-agent: *Disallow: /searchDisallow: /
위 예제의 내용은 모든 검색 엔진이 이 블로그 안의 모든 글을 수집할 수 없다는 의미입니다.• 피드(Feed) URL: RSS나 ATOM이 존재하는 주소피드에 대한 수집 정책은 별도로 명시하지 않는 경우가 많습니다. 이 경우 피드를 검색할 수 있습니다.• Permalink: 블로그 글 각각의 주소 및 해당 HTML 페이지robots.txt뿐 아니라 소스의 NOINDEX, NOFOLLOW 관련 메타 태그도 없어야 합니다. 예를 들어 http://blog-searchable.blogspot.com/2008/04/blog-post.html의 HTML 원문을 보시면 < content="'NOINDEX,NOFOLLOW'" name="'robots'/">와 같은 메타 태그가 있어 검색 수집이 불가능합니다.
일부 국내 포털의 경우 블로거가 해당 블로그 또는 블로그 글을 검색 가능하도록 설정하더라도 블로그 URL과 메타태그를 검색 허용하지 않는 경우가 있사오니 위 내용을 확인해 주시기 바랍니다. 피드 URL만 검색 허용하는 경우 다음과 같은 이유로 정상적인 검색을 구현할 수 없습니다.• 피드 내용과 본문 내용이 일치하지 않는 경우, 블로그 검색이라기 보다 피드 검색 결과를 출력함.• 피드에 블로그 글의 부분 공개만 이루어지는 경우, 전문 내용과 이미지 등을 검색 결과에 반영할 수 없음.• 최신 글들에 의하여 피드에서 제외된 글의 변경된 내용을 검색에 반영할 수 없음.
보다 자세한 기술적 내용은 다음의 문서를 참조하시기 바랍니다.• Google Blog Search Pinging Service• Google Blog Search Pinging Service API
작성자: 자나니 라비, 소프트웨어 엔지니어날짜: 2008년 4월 2일 수요일
구글 워드프로세스팀은 어떻게 하면 사용자들이 이동 중에도 구글 문서도구(Google Docs)를 좀더 편리하게 사용할 수 있을까에 관해 많은 고민을 합니다. 여러분들은 구글 문서도구가 언제 어디서나 쉽게 사용 가능하다는 사실을 이미 알고 있을 것입니다. 뿐만 아니라 구글 문서도구를 통해 이메일로 자신에게 파일을 보내거나 드라이브에 백업 파일을 저장하지 않아도 된다는 것이 얼마나 편리한지, 또한 얼마나 쉽게 다른 사용자들과 공동으로 작업을 할 수 있는지를 경험했을 것입니다.물론 구글 문서도구 사용을 위해서는 인터넷 연결이 필요하다는 작은 문제가 있었습니다. 그러나 이제 이러한 제약이 없어졌습니다. 구글 문서도구 블로그에도 공지되어 있는 바와 같이 오늘부터 오프라인상에서도 편집이 가능한 서비스를 제공하고 있습니다. 이제 사용자들은 인터넷에 접속하지 않고도 좋은 생각들이 떠오르면 언제든지 작업할 수 있게 되었습니다. 비행기나 카페에서도 자동으로 언제든지 자신의 컴퓨터에 있는 구글 문서도구를 사용하실 수 있습니다. 오프라인 상에서의 구글 문서도구 사용법을 확인하고 싶으신 분들은 관련 동영상을 참조하시기 바랍니다.
작성자: 구글 Search Quality팀 석인혁, Chao Ma 날짜: 2008년 4월 2일 수요일
검색엔진은 자신의 사이트를 많은 사람에게 알릴 수 있는 가장 좋은 방법 중 하나입니다. 이를 활용하기에 앞서 고려해야 할 것은 여러분들의 사이트에 있는 정보를 얼마 만큼 외부에 제공할 것인가를 설정하는 일입니다.
만약 여러분의 사이트에 검색엔진을 통해 색인이 생성되지 않도록 하려는 콘텐츠가 있다면, robots.txt 파일을 사용하여 웹을 색인하는 검색엔진 로봇(이하 "검색봇")을 차단하거나 필요한 부분만을 검색엔진에 나타나게 할 수 있습니다. 검색봇은 자동으로 작동하며, 한 사이트의 하위 페이지에 접근하기 전에 먼저 특정 페이지에 대한 접근을 차단하는 robots.txt 파일이 있는지 여부를 확인합니다. 이번 기회를 통하여 여러분들에게 올바르게 robots.txt를 사용하는 방법을 제공하고자 합니다.
robots.txt 의 배치
robots.txt는 HTML 파일이 아닌 일반 텍스트 파일로 도메인의 root에 있어야 하며 반드시 'robots.txt'로 저장되야 합니다. 검색봇은 도메인의 root에 있는 robots.txt 파일만을 체크하기 때문에 하위 디렉토리에 있는 파일은 유효하지 않습니다.
예를 들어 http://www.example.com/robots.txt는 유효한 위치이지만, http://www.example.com/mysite/robots.txt는 유효하지 않습니다.
robots.txt 사용 예제:User-agent: *Disallow: /cgi-bin/Disallow: /tmp/Disallow: /~name/
전체 웹사아트를 검색엔진이 색인하도록 허용하고자 할 때에는 다음과 같이 robots.txt 파일을 추가합니다.User-agent: *Disallow:또 다른 해결 방법으로는 단순하게 robots.txt를 사이트로부터 제거 하는 것입니다.
검색엔진에서 사이트를 삭제하고 향후 어떤 검색봇도 접근하지 못하게 하려면 robots.txt 파일에 다음 내용을 추가합니다. User-agent: *Disallow: /주의) 이 경우 검색봇이 차단되어 사이트가 더이상 검색엔진에 나타나지 않게 됨으로 검색엔진을 통해 들어오게 되는 사용자들에게 불이익을 제공하게 됩니다.
각 포트에는 전용 robots.txt 파일이 있어야 합니다. 특히 http와 https 모두를 통해 사용자들에게 콘텐츠를 제공하려면 이 두 가지 프로토콜에 대해 각각의 robots.txt 파일이 있어야 합니다.
예를 들어 검색봇을 통해 https 페이지를 제외한 모든 http 페이지에 대한 수집을 허용하려면 다음 robots.txt 파일들을 각각의 프로토콜에 사용해야 합니다.
http 프로토콜의 경우(http://yourserver.co.kr/robots.txt): User-agent: *DIsallow:
https 프로토콜의 경우(https://yourserver.co.kr/robots.txt): User-agent: *Disallow: /
예를 들어, 검색봇이 특정 디렉토리(예: board )의 모든 페이지를 검색하지 않도록 차단하려면 다음과 같이 robots.txt를 사용 하시면 됩니다.User-agent: *Disallow: /board/
Googlebot이 특정 형식(예: .gif)의 파일을 모두 검색하지 않도록 차단하려면 다음과 같이 robots.txt를 사용 하시면 됩니다.User-Agent: GooglebotDisallow: /*.gif$
Googlebot이 ‘?’가 포함된 URL 즉, 도메인 이름으로 시작되거나 임의의 문자열 또는 물음표로 구성된URL 검색을 차단하려면 다음과 같이 하시면 됩니다. User-agent: GooglebotDisallow: /*?
구글은 웹마스터 도구의 일원으로 robots.txt 분석 도구를 사용자들에게 제공하고 있습니다. robots.txt 분석도구는 여러분의 robots.txt 화일을 검색봇이 읽는 그대로 인식하여 그 결과를 여러분들께 제공하고 있습니다. robots.txt의 올바른 사용으로 사이트 방문자들에게 보다 쉬운 접근 방법을 제공하는 동시에 필요한 부분을 보호, 차단할 수 있기 바랍니다.
Google
취재 문의 이메일 주소: skr-google@ketchum.com 미디어 취재 문의가 아닌 경우 응답해 드리지 않습니다. 다른 문의사항이 있는 경우 Google 도움말 센터를 방문하시기 바랍니다.