지식 그래프: 더욱 똑똑한 검색
2012년 5월 29일 화요일
*5월 17일 미국에서 발표된 구글 지식그래프에 관심을 많이 보이셔셔, 구글 글로벌 블로그에 올라간 글을 번역해서 올립니다.
배움에 대한 인간의 근본적인 욕구를 충족시켜주는 검색 활동은 새로운 것을 발견하는 과정입니다. 이를 통해 지식의 지평은 넓어집니다. 그러나 검색 하는 일은 결코 쉽지만은 않습니다. 그래서 이번에 새로운 정보를 더욱 빠르고 쉽게 찾을 수 있는 지식 그래프(Knowledge Graph)를 출시하였습니다.
타지 마할[taj mahal]이라는 검색어를 예로 들어 봅시다. 지난 40년 동안 검색이란 본질적으로 키워드와 검색 쿼리의 매칭에 불과했습니다. 그동안 검색엔진의 입장에서 타지 마할[taj mahal]은 그냥 두개의 단어에 지나지 않았습니다.
그러나 [타지 마할]에는 여러가지 다양한 의미가 있습니다. 세계 최고의 사원 중 하나, 그래미상을 받은 음악가, 뉴저지주 아틀란틱시티에 있는 카지노, 가까운 인도 음식점 등 다양한 의미를 가질 수 있습니다. 그래서 구글은 이런 현실을 반영할 수 있는 보다 똑똑한 모델을 연구해왔습니다. 전문가 용어로 “그래프”라는 건데요, 현실 속의 사물들을 이해하고 이들간의 관계도 이해하는 것입니다. 즉, 단순한 문자열이 아니라, 의미를 지닌 사물(things)로 이해하는 것입니다.
지식 그래프는 사물, 인물, 장소를 찾을 수 있도록 해줍니다. 랜드마크, 유명인, 도시, 스포츠팀, 빌딩, 지형물, 영화, 천체, 예술작품 등 구글 정보 중 관련성 있는 내용을 바로 볼 수 있도록 제공합니다. 이는 차세대 검색을 구축하기 위한 중요한 첫 단계입니다. 차세대 검색은 웹의 집단 지성을 활용하고 좀 더 사람과 유사하게 세상을 이해합니다.
구글의 지식 그래프는 프리베이스(Freebase), 위키피디아, CIA 월드 팩트북 같은 공공 정보만을 활용한 것이 아닙니다. 또한 그 폭과 깊이가 방대하기 때문에 더욱 큰 규모로 확장됩니다. 지식 그래프는 5억개 이상의 인물, 지역, 사물 정보를 담고 있습니다. 이를 바탕으로 대상이나 대상간 관련성에 관한 사실을 35억개 이상으로 세분하고 있습니다. 이 같은 내용은 사람들이 검색하는 내용과 우리가 인터넷에서 발견하는 것을 기초로 하고 있습니다.
지식 그래프는 크게 3가지 측면에서 구글 검색을 향상시켜 줍니다.
1. 정확한 내용을 찾는다
언어는 모호할 수 있습니다. 타지마할은 사원을 의미할 수도 음악가를 의미할 수도 있기 때문입니다. 이제 구글은 이들의 차이를 이해합니다. 그래서 사용자의 검색 결과를 사용자가 실제 의미하는 대상으로 좁힐 수 있습니다. 특정 결과를 보려면 아래 링크 중 하나를 클릭하기만 하면 됩니다.
이는 지식 그래프가 구글 검색을 더욱 똑똑하게 만드는 한 가지 방법입니다. 우리는 이들 실체와 의미적 뉘앙스를 사용자와 마찬가지로 이해하기 때문에 사용자는 더욱 관련성 높은 결과를 얻게 됩니다.
2. 최고의 요약 내용을 제시한다
구글은 지식 그래프를 통해 사용자의 검색어를 더 잘 이해할 수 있습니다. 이에 따라 특정 내용에 필요할 수도 있는 핵심 사실만을 간추려 해당 주제의 콘텐츠를 제시할 수 있습니다. 예를 들어 과학자 마리 퀴리를 검색한다면 사용자는 그녀의 출생과 사망 연도를 보게 되고, 학력이나 과학적 업적에 관한 자세한 내용도 볼 수 있습니다.
그런데 각 검색 내용마다 어떤 사실이 필요할지는 어떻게 알까요? 이를 위해 우리는 사용자가 각 검색에 대해 구글에 무엇을 요구하는지를 전체적으로 분석하고 있습니다. 예를 들어 사람들은 찰스 디킨스가 쓴 책에 대해서는 궁금해 하지만 프랭크 로이드 라이트는 그의 책보다는 그가 설계한 건물에 더 많은 관심을 갖습니다.
지식 그래프는 또한 사물간의 관계를 이해하는데도 도움을 줍니다. 마리 퀴리는 지식 그래프에서 인물로 나오며, 2명의 자식을 두었는데 그 중 한 명이 노벨상을 받았고, 남편인 피에르 퀴리도 노벨상을 받아 한 가족이 세 번이나 노벨상을 받은 것으로 나타납니다. 이 모든 내용이 그래프에서는 하나로 연결돼 있습니다. 대상을 단순히 나열해 놓은 카탈로그가 아니라 이들의 관계를 설명하고 있습니다. 서로 다른 실체 사이의 관계를 이해하는 지성이 핵심입니다.
3. 더 깊고 더 넓게 간다
마지막으로 가장 재미있는 부분은 지식 그래프가 예기치 않았던 것들을 발견하게 해준다는 점입니다. 사용자는 새로운 사실이나 전혀 새로운 검색을 유도하게 하는 새로운 연결고리를 발견할 수 있습니다. 만화 심슨 가족 (제가 가장 좋아하는 프로그램 중 하나)을 그린 매트 그로닝이 주인공인 호머, 마지, 리사의 이름을 어디서 따왔는지 아시나요? 아신다면 놀라실 겁니다.
사실 구글은 사용자가 다음 질문을 물어보기도 전에 그에 대한 답을 할 수도 있습니다. 기존에 유사한 내용을 검색한 다른 사람들이 이와 더불어 무엇을 검색했는지에 대한 정보를 기반으로 정보를 보여주기 때문입니다. 예를 들어 ‘톰 크루즈’에 대한 지식그래프 안에는, 일반적으로 사람들이 ‘톰 크루즈’를 검색한 다음 검색하는 내용 중 37%정도가 이미 반영되어있습니다. 실제로 제가 지식 그래프를 사용하면서 가장 뜻밖에 알게 된 정보는 “같이 많이 하는 검색(People also search for)”이라는 마술 같은 기능을 통한 것입니다. 제가 좋아하는 책 중 하나는 아라빈드 아디가(Aravind Adiga)의 데뷔작이자 맨 부커(Man Booker)상을 받은“화이트 타이거(The White Tiger)”입니다. 지식 그래프를 이용해 저는 같은 상을 받은 3권의 책을 알게 됐고, 퓰리처 상을 받은 다른 한 권도 알게 됐습니다. 이 같은 내용은 정확했습니다.
구글 지식 그래프는 현재 미국 사이트에서부터 서비스가 시작됐습니다. 앞으로는 모바일 서비스를 비롯해 다양하게 확대될 예정입니다. 모바일 기기에 최적화된 지식 그래프에 대해서도 알아보시기 바랍니다. 지식 그래프와 관련 기술에 관한 자세한 내용은 동영상을 통해 실제프로젝트를 추진했던 팀의 설명을 들어 보시기 바랍니다.(지식 그래프 사이트에서도 확인하실 수 있습니다.)
구글 지식 그래프는 여러분이 찾는 검색을 더욱 정확하게 하고, 더욱 똑똑한 검색 결과를 얻도록 도와주며, 새로운 토픽에 대한 여러분의 호기심을 자극할 것입니다. 지식 그래프가 첫 발을 내딛게 되어 기쁘게 생각합니다. 지식 그래프는 검색을 더욱 똑똑하게 만들어 주어 제가 늘 꿈꿔왔던 스타트렉에 나오는 컴퓨터의 등장을 더욱 앞당길 것입니다. 이제 더 쉬워진 구글 검색으로 발견의 기쁨을 누리시기 바랍니다. 이제 검색 시간은 줄이고 여러분이 좋아하는 것을 할 수 있는 시간은 더욱 늘릴 수 있습니다.
작성자: 구글 엔지니어링 수석 부사장 아밋 싱할(Amit Singhal)