안녕하세요.

경제에 관심있는 분들에게 좋은 소식 하나 전해드리려고 합니다. 이제 구글 홈페이지에서도 한국 기업들의 주가 정보를 한눈에 확인하실수 있습니다.

지금까지는 구글에서 주가 정보를 보려면 구글이 제시해준 웹페이지를 직접 방문해서 찾아봐야 했지만, 이제는 검색결과의 첫 페이지에 원하시는 주가 정보를 그래프와 표로 잘 정리하여 보여드립니다.

이 내용은 데스크탑 뿐만 아니라 모바일에서도 한국 증권 시장 상장 기업들의 주가정보를 쉽고 편리하게 확인하실 수 있습니다.

미국발 위기로 시작됐던 세계 경제 격동기도 서서히 안정되어 가고 한국 기업들이 눈부신 실적을 내고 있는 이 시점에서, 늦게나마 주가 정보를 제공해 드릴수 있게 되어 한명의 개발자로, 또한 한명의 개인 투자자로서 대단히 기쁘게 생각합니다:-)

비록 작은 개선이지만 구글을 사용해 주시는 분들의 정보활용과 건전한 투자생활에 조금이나마 도움이 되면 좋겠습니다.

앞으로도 사용자 여러분들에게 유용한 정보들을 더 편리하게 제공해 드릴수 있도록 꾸준히 노력하도록 하겠습니다.


<모바일에서 검색> <데스크탑에서 검색>

작성자: 구글코리아 소프트웨어 엔지니어 최영& 강경원


어제 “검색로봇 100배 활용하기(상)”을 통해서 ’은둔형 외톨이' 웹사이트의 실태를 한 가지 사례를 통해 살펴보았는데요, 사실 단순 실수이든 의도적이든 웹사이트의 검색 로봇 차단은 생각보다 많은 사이트들에서 일어나고 있습니다.

오늘은 간단한 방법으로 어떻게 검색 로봇이 웹페이지를 읽도록 허용하고 차단하는지 알아보겠습니다.

우선 검색엔진이 어떻게 동작하는지에 대해 간단히 설명해보겠습니다.

검색 엔진의 동작 방식

일반적인 검색 엔진이 웹에 존재하는 공개된 문서를 사용자에게 제공하기까지의 처리 순서는 다음과 같습니다. 아주 간략하게는 웹에 공개되어 있는 문서의 링크를 따라가며 문서를 수집(검색 용어로는 이 단계를 크롤(crawl)이라고 부름)하고, 문서에서 단어(토큰)를 추출하여 색인(인덱스)을 만든 다음 사용자가 검색어를 입력하였을 때 미리 만들어 둔 색인에서 관련된 문서를 찾아 제공하는 구조입니다.
검색 로봇이라고 불리는 웹 공개 문서 수집 소프트웨어는 검색 엔진의 첫 번째 단계에서 공개된 질 좋은 문서를 얻기 위해 웹 문서에 포함된 링크를 따라 다른 페이지를 찾아다닙니다. 그런데 웹 문서를 수집하기 전에 반드시 맨 먼저 확인하는 것이 있습니다. 바로 해당 사이트의 어떤 문서를 수집하지 말아야 하는지가 적힌 robots.txt파일입니다.

robots.txt의 내용은 검색 엔진이 지켜야 할 법적 강제 사항은 아니지만 웹 사이트를 관리하는 웹마스터와 검색엔진 사이의 약속으로 구글을 포함한 대부분의 건전한 검색엔진들은 이 약속을 이행하고 있습니다. 즉, 웹마스터가 검색 로봇을 부릴 수 있는 권리인 것입니다.


robots.txt 파일을 올바로 설정해야 하는 이유

robots.txt 파일을 올바로 설정해야 할 가장 큰 이유는 공개하지 말아야 할 문서의 범위를 검색 로봇에게 알리기 위함입니다. 초기의 웹은 정보의 공유와 홍보의 목적으로 만들어졌기 때문에 검색 엔진에 공개되어도 문제가 없는 것들이 대부분이었지만 웹이 발전하면서 실수로든 의도적으로든 웹에 공개되어서는 안될 정보들이 올라오고 이를 검색 로봇이 비의도적으로 수집을 하게 된 것입니다. robots.txt 는 검색 로봇에 수집하지 말아야 할 것을 알려주는 가장 기본적이며 간단한 약속입니다.

그러면 어떻게 robots.txt를 설정하는 것이 올바른 방법일까요? 정보 공유를 위해 홍보를 위해 정성들여 만든 문서를 문을 걸어두고 집안에만 감춰두는 ‘은둔형 외톨이’식이 좋을까요, 감춰두어야 할 비밀스러운 것까지 모두 내 보이는 ‘과다노출증’식이 좋을까요? 네, 감출 것은 적절하게 가리고 사람들에게 알려야 할 것은 적극적으로 알려야겠습니다.

자, 그럼 아주 간단하게 robots.txt 파일을 설정하는 방법을 알려드리겠습니다.


robots.txt 파일의 배치

robots.txt는 HTML 파일이 아닌 일반 텍스트 파일로 호스트의 root에 있어야 하며 반드시 'robots.txt' 파일명으로 저장되어야 합니다. 검색 로봇은 해당 호스트의 root에 있는 robots.txt 파일만을 체크하기 때문에 하위 디렉토리에 있는 파일은 유효하지 않습니다. 예를 들어 http://www.example.com/robots.txt는 유효한 위치이지만, http://www.example.com/mysite/robots.txt는 유효하지 않습니다.


간단한 robots.txt 작성 규칙

robots.txt 파일에서 가장 중요한 규칙 두 가지가 User-agent와 Disallow입니다. 먼저 User-agent는 해당 규칙이 어떤 검색 로봇을 대상으로 하는 것인지 규정합니다. 참고로, 대부분의 검색 로봇은 고유의 이름을 가지고 있습니다. 예를 들어, 구글의 웹 검색 로봇의 이름은 Googlebot입니다. 그 다음으로 Disallow에는 어떤 디렉토리 또는 파일을 검색 로봇이 읽지 못하도록 할 것인지를 알려줍니다.

http://www.example.com/ 사이트의 간단한 예는 다음과 같습니다.
User-agent: *
Disallow: /private/

이렇게 하면 모든 검색 로봇에게 http://www.example.com/private/ 하위의 문서들은 수집하지 않도록 합니다.

다른 곳은 공개하되 예를 들어, /admin/ 과 /bbs/ 이하의 모든 파일을 로봇으로부터
차단하려면 다음과 같이 하시면 됩니다.
User-agent: *
Disallow: /admin/
Disallow: /bbs/

이런식으로 더 차단하고 싶은 디렉토리를 추가하실 수 있습니다.


robots.txt 파일을 사용하여 전체 웹사이트를 크롤 허용 또는 차단하기

드문 경우이긴 하지만 웹 사이트 내의 모든 정보를 공개하지 않겠다면 다음과 같이 설정하십시오.
User-agent: *
Disallow: /

또, 웹 사이트 내의 모든 문서가 공개가능한 것이라면 다음과 같이 설정하십시오.
User-agent: *
Disallow:

Disallow란이 공백임을 꼭 주의하십시오. 모든 검색 로봇에 수집을 허가한다는 뜻입니다.

robots.txt 파일 설정 여부 확인

가장 간단한 방법은 웹브라우저에서 확인하는 것입니다. http://robot_example.co.kr 을 예로 들겠습니다. robots.txt파일을 robot_example.co.kr 서버의 루트에 제대로 위치시키셨다면, 인터넷 익스플로러 또는 구글 크롬 등의 웹브라우저에서 다음의 URL을 입력해보세요. http://robot_example.co.kr/robots.txt (robots.txt의 철자를 확인하세요.)

robots.txt파일에 입력했던 내용이 잘 보이면 제대로 설정된 것입니다.

더 확실하게 확인하려면 구글 웹마스터 도구를 사용하세요. 구글 웹마스터 도구에서 웹사이트를 등록하고 ’사이트 구성' -> ‘크롤러 액세스' 페이지에 방문하면 실제로 어떤 페이지들이 허용되고 차단되는지 테스트해보실 수 있습니다. 자세한 내용은 아래에 링크된 문서를 참고하세요.
http://www.google.com/support/webmasters/bin/answer.py?hl=kr&answer=156449


robots.txt에 대한 더 자세한 정보

robots.txt에 대한 좀 더 자세한 정보를 원하시면 다음의 링크를 참고하세요.

robots.txt 파일을 사용하여 페이지 차단 또는 삭제
http://www.google.com/support/webmasters/bin/answer.py?hl=kr&answer=156449

구글 검색에 웹사이트를 알리는 방법
http://www.google.com/support/webmasters/bin/answer.py?hl=kr&answer=34397

웹사이트가 구글에 색인되어 있는지 확인하는 방법
http://www.google.com/support/webmasters/bin/answer.py?hl=kr&answer=35256

* 웹마스터를 위한 검색이야기의 다른 시리즈를 보시려면 여기를 눌러주세요.

작성자: 구글코리아 소프트웨어 엔지니어 이동휘


전세계 20개국 모임인 G20의 서울 정상회의가 성공적으로 끝났습니다. 개인적으로는 이번 정상회의를 통해 한국이 의장국으로서 전세계의 주목을 받아 한국인이라는 자부심을 느끼게 되는 계기가 되었는데요, 옥의 티같은 아쉬운 점이 있어 이야기를 해보려고 합니다.

여러분은 G20 서울 정상회의의 공식 홈페이지가 어디에 있는지 아십니까?

주요 검색 사이트에서 ”G20 서울 정상회의 공식 홈페이지"라고 검색하면 바로 찾을 수 있습니다. 한국의 이미지를 잘 살려서 정성스레 준비한 홈페이지인 http://www.seoulsummit.kr/ 이나 http://www.g20.go.kr/ 을 찾으실 수 있습니다. 실은 이들 주요 검색사이트에서 바로 나오는 "G20" 관련 사이트 검색결과는 인위적으로 만들어놓은 바로가기 사이트입니다.


그런데 한국어를 모르는 외국인이 영어로 된 공식 홈페이지를 찾으려면 어떻게 될까요? “G20 Seoul Summit official homepage”라고 주요 검색 사이트에서 검색을 하면 서울 정상회담 공식 홈페이지는 찾기가 힘듭니다. 대신 원하지 않았던 뉴스 사이트나 서울 정상회담의 공식홈페이지가 아닌 일반 G20 홈페이지 등이 검색결과로 나옵니다. 사실 영어로 된 서울 정상회담 공식 홈페이지가 홍보를 위해 정성들여 잘 준비되어 있음에도 이 공식 페이지는 검색 사이트(국내 포털에서 조차)에서 검색결과에 나오지 않습니다.


세계의 관심과 기대를 모았던 행사의 공식 홈페이지조차 검색되지 않는 이 사태를 외국인들은 어떤 시각으로 바라보았을지 얼굴이 뜨뜻해집니다.

왜 그럴까요? 이것이 G20 Summit 사이트 한 사이트만의 문제일까요? 대한민국의 많은 사이트들이 세계적으로 잘 알려진 ’검색 로봇 제어 표준'이라는 간단한 기술 표준을 잘못 사용하면서 이런 현상이 한국 웹 전체에 만연하고 있습니다. 홍보를 위해 정보 공유를 위해 정성을 들여 만들어 놓고는 정작 문을 꼭 닫고 집안에 들어앉은 ’은둔형 외톨이'가 되고 만 것입니다.

홍보를 위해 많은 투자를 하고 있지만 사실은 단순한 기술 표준만 지키면 돈을 들이지 않고도 전세계에 시간과 공간을 뛰어넘어 우리가 보여주고 싶은 것들을 원없이 알릴 수 있는 곳이 바로 인터넷입니다. 과연 그 방법이 무엇인지 궁금하지 않으세요?

자, 다음번 포스트에서는 정말 간단한 방법으로 세계인들의 주목을 받을 수 있는 방법을 소개해 드리겠습니다. 기대해 주세요.

* 웹마스터를 위한 검색이야기의 다른 시리즈를 보시려면 여기를 눌러주세요.

작성자: 구글코리아 소프트웨어 엔지니어 이동휘


지난 3월 유튜브가 분당 24시간 분량의 동영상 업로드 기록을 돌파했다는 소식을 발표한지 불과 7개월 만에 또다시 분당 35시간 분량을 기록했다는 소식을 전해드리게 되었습니다.

분당 35시간 분량의 동영상 업로드에 대한 이해를 돕자면, 이것은 곧 시간당 2천100시간, 하루 5만400시간 분량의 동영상이 업로드 된다는 뜻입니다. 이를 영화로 환산하면, 평균 할리우드 영화 상영시간을 120분으로 가정하였을때 매주 17만6천편의 영화가 만들어지는 것과 동일합니다. 또 다른 비교로 미국 3대 방송사가 하루 24시간 1년 365일을 쉬지 않고 60년 동안 방송을 한다고 해도 유튜브에 30일 동안 업로드된 동영상 전체 분량에 못 미친다는 것을 의미합니다.

그럼 35 시간 동안 할 수 있는 일이 무엇이 있을까요? 이 시간 동안 할 수 있는 몇 가지 일들을 예를 들면 다음과 같습니다:

• 역사상 가장 긴 축구 시합하기.
• 유튜브 본사가 있는 캘리포니아주 샌브루노에서 일리노이주 시카고까지 쉬지 않고 운전하기.
• 기구를 타고 지구 반바퀴 돌기.

유튜브 동영상 업로드 분량 성장 추이


위 그래프에서 보는 것처럼 유튜브의 업로드 동영상은 지난 2년 동안 2배 이상 증가했습니다. 이 같은 증가 배경에는 다음과 같은 요인이 있었습니다.

• 동영상 길이 제한을 기존 10분에서 50%늘어난 15분으로 확대.
• 업로드 파일크기가 지난 몇 년 사이 10배 이상 늘어난 2GB로 확대 (유튜브 표준 업로더 기준).
• 동영상을 빠르고 쉽게 올릴 수 있는 스마트폰의 확산
• API 기반 프로그램 확산으로 유튜브 사이트 외부에서도 업로드 가능 (eg. 액티비전사의 Call of Duty Black Ops로 사용자가 자신의 게임 내용을 녹화해 동영상으로 공유).

유튜브는 분당 48시간 분량의 업로드 달성을 목표로 노력하겠습니다. 분당 48시간은 정확히 이틀 분량의 동영상이며 2010년 3월 기록보다 두 배 높은 양입니다.

작성자: 유튜브 팀


강남역을 가실 일이 있으시다면 이제부터 미디어폴을 주목해 주세요! 강남대로에 있는 미디어폴에서 구글 지도를 사용해 원하는 곳 이곳 저곳 길찾기를 하실 수 있습니다. 또한, 미디어폴 광고면에는 구글 제품들이 소개되구요:-)

여기서 깜짝 이벤트 하나! 미디어폴에 있는 구글 지도 또는 구글 광고와 함께 인증샷을 찍어 구글코리아 트위터 (@googlekorea)로 다음주 금요일까지(18일) 보내주시면 추첨을 통해 30분께 안드로이드 USB를 보내드립니다~ 많은 참여 바랍니다!


작성자: 구글코리아 블로그 운영팀


2010년 11월 9일 화요일

구글 순간검색은 검색어 입력과 동시에 결과를 볼 수 있지만 여러분의 검색이 끝난 것은 아닙니다. 일단 결과 페이지가 나오면 사용자는 대개 제목, 텍스트 발췌 (스니펫) 그리고 url를 통해 자신이 찾는 정보에 맞춰 관련 있는 사이트를 고르게 되기 때문입니다. 저희는 그 동안 검색 결과와 스니펫을 꾸준히 향상시켜 사용자가 멋진 페이지를 고를 수 있도록 했습니다. 이제 이러한 단계에서 더욱 도약해 이미지 기반의 스냅샷을 볼 수 있도록 만들었습니다. 이 기능은 새로운 비주얼 검색으로 “순간 미리보기(Instant Previews)”로 불리는 이 검색은 제대로 된 결과를 더 빨리 고를 수 있도록 도와줍니다.

순간 미리보기는 검색결과를 이미지로 제시하면서 관련성이 가장 높은 부분을 강조 표시해 줍니다. 이를 통해 사용자는 찾고자 하는 정보의 웹사이트를 잡지를 넘겨 보는 것처럼 쉽고 빠르게 찾을 수 있습니다. 검색결과의 제목 옆에 있는 돋보기를 클릭하기만 하면 오른쪽으로 해당 웹사이트의 이미지가 나타납니다. 이 상태에서 다른 결과에 커서를 위치만 시키면 다른 웹사이트의 이미지를 미리 볼 수 있습니다. 최근에 마우스를 더 이상 사용하지 않고 검색을 하시는 분들은 이제 오른쪽 화살표 키를 눌러 미리보기를 사용하면 됩니다. 그리고 계속 브라우징을 하시려면 아래쪽 화살표를 누르면 됩니다. 다음은 순간 미리보기 사용법을 설명한 동영상입니다.




자체 테스팅 결과 미리보기를 이용해 검색한 사람들은 클릭하여 얻은 결과에 약 5% 정도 더 만족하는 것으로 나타났습니다. 이 같은 기능은 검색 결과를 판단하는 새로운 방법을 제공해 여러분이 정보를 찾고자 하는 웹사이트를 더욱 확실히 찾을 수 있게 합니다. 아래는 순간 미리보기의 장점을 요약한 것입니다.

· 결과를 빠르게 비교할 수 있다 – 검색 결과를 시각적으로 비교하기 때문에 자신이 찾는 결과를 고르는데 도움이 된다. 어떤 사이트가 가장 멋있는지를 빠르게 살펴 볼 수 있다.
· 관련성 있는 컨텐츠를 족집게처럼 잡아낸다 – 검색어 관련 내용이 웹페이지에 나올 때 오렌지색으로 관련 텍스트가 강조돼 이를 통해 자신이 찾고자 하는 내용인지를 알 수 있다.
· 검색 페이지와 상호 연동된다 – 페이지 미리보기를 통해 검색 결과를 클릭하기 전에 웹페이지의 레이아웃을 볼 수 있다. 웹페이지 내에서 차트나 그림, 지도, 리스트 등을 찾는다면 미리보기를 통해 확인할 수 있다.

순간 미리보기는 여러 작업에 유용하게 쓰일 수 있습니다. 예를 들어 이전에 본 웹페이지를 다시 검색하려고 할 때 미리보기 기능을 이용하면 낯이 익은 부분을 쉽게 찾을 수 있습니다. 또한 공식 웹사이트— 로고나 양식을 찾는 경우 미리보기를 통해 파악할 수 있습니다. 또한 웹사이트가 예제 그림이나 단계별 설명이 잘 되어 있는지도 쉽게 알아낼 수 있습니다.

저희는 처음부터 이러한 서비스가 유용하기 위해서는 빛처럼 빠르게 작동해야 한다고 생각했습니다. 불과 얼마 전만 해도 이미지 하나 다운로드 받는데 20-30초가 걸렸지만 지금은 많은 웹사이트에서 이미지 업로드조차 4-5초면 가능합니다. 그러나 순간 미리보기는 사용자의 검색어를 전체 웹 인덱스와 매칭시켜 각 웹사이트의 연관된 부분을 잡아내 이를 한 데 모아 사용자를 위한 맞춤식 미리보기 결과를 보여주는데, 불과 10분의 1초 정도의 시간이 걸립니다. 일단 돋보기를 클릭하는 순간 배경에 있는 다른 검색의 미리보기가 로딩되기 때문에 기다릴 필요 없이 미리보기를 볼 수 있습니다.

이 정도면 순간 미리보기에 대한 설명으로 충분할 것으로 생각합니다. 그러면 조만간 직접 이용해 보시기 바랍니다. 새로운 기능은 점차적으로 만나보실 수 있으며, 며칠 안에 40개 언어로 지원됩니다. google.co.kr에서도 오늘부터 2~3일 안에 순차적으로 순간 미리보기를 만나보실 수 있습니다.

작성자: 프로덕트 매니저 라지 크리슈난(Raj Krishnan)


오늘 구글 첫화면을 보셨나요? 오늘은 독일의 물리학자 뢴트겐(Wilhelm Conrad Röntgen)이 엑스레이를 처음 발견한 날입니다. 뢴트겐은 엑스레이의 발견으로 최초의 노벨물리학상을 수상하기도 했습니다.

작성자: 구글코리아 블로그 운영팀


지난 5월 구글이 애드몹(AdMob)을 인수한 후 두 회사는 새로운 제품과 신기능 개발을 위해 노력해 왔습니다. 오늘 두 회사의 결합을 통해 애드몹 게시자와 구글 광고주 모두에게 혜택을 드릴 수 있는 중대한 변화를 발표하게 되어 매우 기쁘게 생각합니다.

앞으로 몇 주에 걸쳐 점진적으로, 애드몹 네트워크에서 아이폰이나 안드로이드 앱을 만드는 개발자는 가용한 애드몹 광고가 없을 경우 애드센스 광고를 게시할 수 있습니다. 이를 통해 게시자들은 광고 인벤토리를 더 효율적으로 사용하고 해당 인벤토리의 광고 점유율을 높일 수 있습니다. 이는 또한 구글 광고주가 애드몹의 네트워크에 있는 수천 개의 모바일 앱 (예를 들어, Rovio’s Angry Birds와 같은 인기 게임)에도 모바일 광고를 확대할 수 있게 합니다.

구글은 애드몹 게시자가 새로운 광고 영역에 가급적 쉽게 접근할 수 있도록 노력을 기울였습니다. 최신 버전의 SDK를 사용하는 게시자는 코드를 업데이트할 필요가 없으며, 보고서 기능도 애드몹 계정에 통합이 되어 기존과 마찬가지로 한달에 한번 애드몹에서 애드센스를 포함한 수익을 받으시게 됩니다.

게시자분들은 계정에 로그인 하시면 Sites & Apps 섹션 > “App Settings” 탭에서 구글 광고를 게시할 자격이 있는지 확인하고 구글광고에 옵트인(opt-in) 하실 수 있습니다. 단, 애드몹 광고필터 기능을 설정해 놓지 않으셨다면 자동으로 옵트인되어 애드센스 광고가 게시됩니다. 하지만 필터 설정을 해 놓으신 경우에는 수동으로 옵트인을 하셔야 합니다. 현재 애드센스 광고는 광고의 종류(예: 카테고리,URL)를 필터링하실 수 없습니다.

광고 필터를 사용하지 않는 아이폰과 안드로이드 앱 퍼블리셔는 앞으로 몇 주에 걸쳐 단계적으로 구글 광고가 게시가 되도록 해당 기능에 옵트인하게 됩니다. 자세한 내용은 도움말에서 얻을 수 있습니다. 애드센스 광고를 노출시키는 모든 퍼블리셔는 구글 애드센스의 사용약관을 준수해야 합니다.

오늘 말씀드린 사항은 애드몹과 구글의 결합으로 생기는 많은 흥미로운 기술 중 그 첫 번째입니다. 앞으로도 많은 기대 부탁드립니다.

작성자: 프로덕트 매니저 제이슨 모스(Jason Morse)