웹의 발전으로 전세계의 20억명 이상의 사람들이 손가락 하나로 세상의 지식에 쉽게 접근할 수 있게 되었습니다. 검색어 하나만 넣으면 수천킬로미터나 멀리 있는 나라 서버의 웹페이지에 접속할 수 있게 된 것입니다. 그런데 여러분이 한국어나 영어만 이해할 수 있는데, 보고 싶은 웹 페이지가 힌두어나 아프리칸스어, 아이슬란드어로로 되어 있다면(혹은 그 반대의 경우라면) 어떨까요?

구글 번역은 2001년에 처음으로 영어와 8개 언어간 번역을 지원하며 서비스를 시작했습니다. 그때 당시 최신 기술이었던 기계 번역 시스템(MT: machine translation)을 사용했지만 번역 품질은 만족스럽지 못했고, 첫 1~2년 동안은 큰 발전을 보이지 못했습니다. 드디어 2003년, 몇몇 구글 엔지니어들이 뭉쳤습니다. 즉, 번역 품질을 개선하고 번역 언어를 더 추가하고자 하는 공동의 목표를 세웠습니다. 이 때 저도 동참하게 되었는데 그때 저는 DARPA 프로젝트 연구원으로 기계 번역에 대한 새로운 접근 방법을 연구하고 있었었습니다. 데이터로부터 학습하는 방식인데, 더 나은 번역 품질을 제공할 수 있는 가능성을 가지고 있었습니다. 번역 품질 향상을 위해 모인 구글러들이 저에게 전화를 걸어 이 데이터 학습 방식을 구글 번역 시스템에도 적용할 수 있을 것이라고 저를 확신시켰습니다.(그때 저는 회의적이었습니다.)

구글에 합류하고,구글 번역 시스템을 재정비해 연구기관들과 기업들이 더 나은 기계 번역 시스템을 구축하기 위해 만든 평가인 NIST 기계 번역 평가(NIST machine translation evaluation)에서 경쟁할 수 있도록 재 정비하기 시작했습니다. 구글의 엄청난 컴퓨팅 인프라와 웹 데이터는 좋은 결과를 가져왔습니다. 이것이 전환점이 되었습니다. 데이터 기반 접근방식이 얼마나 효율적인지를 입증했습니다.

하지만 그 당시 이 시스템은 너무 느려서 실제로 서비스 할 수 있는 단계가 아니었습니다. 천 문장을 번역하는데 천대의 기계로 40시간이나 걸렸으니까요. 그래서 속도 개선에 중점을 두었고, 일년 뒤에는 한 문장을 1초내로 더 잘 번역할 수 있게 되었습니다. 2006년 초에는 첫 언어인 중국어 번역을 출시했고, 그 다음으로 아랍어 번역이 나왔습니다.

2008년 4월 28일에 구글의 통계적 기계 번역 방식(statistical MT approach)을 발표하고 그 후 6년동안 번역 품질과 지원 언어 확대를 중심으로 노력해 왔습니다. 지금은 64개 언어간 교차 번역이 가능합니다. 벵갈어, 바스크어, 스와힐리어, 이디쉬어, 에스페란토어까지, 웹에 많이 존재하지 않는 언어들까지도 포함합니다.

현재 translate.google.com을 이용하는 사용자는 2억명이 넘습니다. (물론 이 숫자는 크롬이나 모바일 애플리케이션, 유튜브 등 구글 번역 서비스를 사용할 수 있는 제품 사용자까지 포함하면 훨씬 더 늘어납니다.) 모바일을 통해 들어오는 트래픽은 연간 4배의 증가세를 보이고 있습니다. 구글 사용자들은 정말 글로벌합니다. 전체 트래픽의 92% 이상이 미국 이외의 국가에서 들어오고 있습니다. 

하루에 구글 번역에서 번역하는 텍스트는 거의 책 백만권 정도에 달하는 양입니다. 달리 말하면, 전 세계 모든 전문 번역가들이 1년동안 출판해 내는 양이 구글 번역 시스템으로는 하루만에 가능하다는 것입니다. 이렇게 측정한다면 지구상에 존재하는 거의 모든 번역은 구글 번역으로 이루어지고 있다고도 할 수 있겠습니다.(우주에서는 상황이 다를 겁니다. 아마 더글라스 아담스의 책에 나오는 “바벨 피쉬”가 번역을 다 할테니까요 ; *책에 나오는 바벨 피쉬는 전 우주의 모든 언어를 알아들을 수 있게 해 주는 신비한 물고기) 물론, 번역의 뉘앙스나 매우 중요한 번역을 할 경우를 생각한다면 어떤 것도 사람이 하는 번역을 따라갈 수 없습니다. 기계 번역이 사람들이 자신의 언어로 더 많이 이야기 하게 되며 전 세계적인 소통을 하는 것을 돕기 때문에, 지금은 번역 전문가가 그 어느 때보다 더 중요한 역할을 담당하고 있다고 생각합니다.

전 세계 모든 사람들이 어떤 언어로 되어 있는 정보라도 공유하고 소비할 수 있는 미래를 상상합니다. 구글은 크롬 브라우저에 웹 페이지 번역 서비스를 제공하고 있습니다. 모바일 사진에 있는 텍스트 번역과 유튜브 동영상 캡션(자막), 스마트폰의 “대화모드” 등의 번역 서비스도 제공하고 있습니다. 구글은 사람들의 소통에서 언어의 장벽이 사라지기를 바랍니다. 앞으로의 6년동안 어떤 발전이 있을지 무척 기대가 됩니다.

*구글 번역이 이루어지는 과정을 쉽게 볼 수 있는 동영상입니다.



작성자: 구글 번역 선임 연구 과학자 프란츠 오슈(Franz Och)


*구글 공식 블로그(OGB)에도 포스팅 되었습니다.



모바일 기술과 웹 덕택에 많은 사람들이 쉽게 정보에 접근할 수 있게 되었으며, 서로 소통하기도 수월해 졌습니다. 하지만 그럼에도 불구하고 여전히 언어의 장벽이라는 장애물이 있습니다. 구글은 이 장벽을 낮춰 모든 사람들이 보다 쉽게 소통할 수 있도록 하기 위해 노력하고 있습니다.

올해 초 안드로이드용 구글 번역(Google Translate)에 대화모드(Conversation Mode)라고 하는 실험적 기능이 추가된 업데이트를 출시했었습니다. 대화 모드는 서로 다른 언어간 대화를 번역해 주는 기능으로, 당시에는 영어-스페인어 번역만으로 시작했었습니다. 오늘 대화모드에 14가지 언어 지원이 추가 되었음을 알려드립니다. 추가된 언어는 다음과 같습니다: 한국어, 브라질-포르투갈어, 체코어, 네덜란드어, 프랑스어, 독일어, 이탈리아어, 일본어, 북경어, 폴란드어, 러시아어
   

대화 모드를 사용방법은 다음과 같습니다. 휴대폰의 마이크에 대고 말을 하면 번역 애플리케이션으로 자동으로 번역을 해서 번역된 내용을 음성으로 들을 수 있습니다. 상대방이 자신의 언어로 이야기를 해도 대화 모드를 이용하면 번역된 우리말을 음성으로 들을 수 있습니다. 

이 기술은 현재 시작 단계이기에, 주위가 시끄럽거나 사투리 억양으로 말을 한다면 음성을 정확하게 인식하기 어렵습니다. 하지만 구글 번역은 축적된 데이터를 통해 학습하기 때문에, 사용자들이 더 많이 사용해 더 많은 예시가 축적될 수록 번역의 질이 향상됩니다. 구글 번역이 전 세계 어디서나 누구와도 대화를 나눌 수 있는데 도움이 되었으면 합니다. 

음성 번역을 더욱 쉽게 하고, 번역 결과 확인을 쉽게 할 수 있는 몇 가지 새로운 기능도 추가되었습니다. 예를 들면, “차를 어디서 타나요?”라고 말했는데 휴대폰이 “차를 어디서 파나요?”로 인식하는 경우가 있습니다. 이럴 때는 번역을 하기 전에 잘못된 단어만 고칠 수 있으며, 사전에 새로운 단어를 추가할 수도 있습니다. 

화면으로 출력되는 번역결과를 볼 때에도 번역 결과 옆에 있는 돋보기 아이콘을 클릭해 전체화면으로 확대해 옆 사람에게 쉽게 보여줄 수도 있습니다. 















<돋보기 아이콘을 눌러 전체 화면으로 보시기 바랍니다>

또한 구글 번역 애플리케이션은 안드로이드 태블릿의 큰 화면에도 맞도록 최적화되어 있습니다.

대화모드 지원 언어가 14개 언어로 확대된 가운데, 현재 안드로이드용 구글 번역은 63개 언어 번역, 17개 언어의 음성 입력, 24개 언어의 문자-음성(text-to-speech) 변환을 지원하고 있습니다. 

안드로이드 마켓에서 구글 번역 애플리케이션를 다운로드 받아보세요. 안드로이드 2.2 이상의 태블릿과 스마트폰에서 이용할 수 있습니다.

작성자: 구글 프로덕트 매니저 제프 친(Jeff Chin)


언어라는 것은 불확실성으로 가득한 시스템입니다. 구글 번역은 사용자들이 의도했던 바를 정확히 추론하려고 언제나 최선을 다하고 있지만, 앞서 언급한 언어의 모호성 때문에 원래 의도를 파악하기는 쉽지 않고 오류의 가능성이 언제나 존재합니다.

구글 번역에 새롭게 추가된 '대체 번역'은 번역된 문장의 각 단어나 구문에 대한 다른 가능한 번역을 제시하는 기능입니다. 번역된 문장의 단어나 구문을 클릭하면 선택된 구문이 강조되면서 팝업창이 뜨고, 팝업창에는 해당 구문에 대한 다른 가능한 번역 후보가 제시됩니다. 이 기능은 모호한 번역 결과를 사용자들이 더 정확히 이해할 수 있도록 돕는 기능인 동시에, 구글 번역 시스템이 향후 오류를 최소화하는데 도움이 되는 자료로 사용될 수 있습니다.

이 새로운 기능은 통계 기반 기계번역 방식인 구글 번역 시스템의 방대한 데이터를 기반으로 구현되었습니다. 구글 번역 시스템이 하나의 문장을 번역하기 위해서는 일반적으로 수백, 수천만개의 번역 후보 중에서 가장 확률적으로 그럴듯한 단어와 문장을 선택하고 조합하는 과정을 거치게 됩니다. '대체 번역' 기능은 이러한 중간 결과물의 일부를 사용자에게 보여주는 기능입니다. 구글 번역 시스템의 보다 상세한 동작 원리가 궁금하신 분은 이곳에서 볼 수 있습니다.

이 기능은 구글 번역의 성능을 향상시키는데 도움이 될 수 있습니다. 단어나 구문 단위로 선택 혹은 제시되는 대체 번역은 구글 번역 시스템의 통계 모델에 좋은 피드백이 될 수 있고, 구글 번역 개발자들이 번역 성능을 향상시키기 위한 유용한 데이터로 사용될 수 있습니다.

대체 번역 기능이 구글 번역을 애용하시는 여러분들에게 유용하게 사용되기를 바라며, 또한 여러분들이 번역 성능을 개선하는데 도움을 주는 통로가 되기를 기대합니다.



작성자: 수석 소트프웨어 엔지니어 조쉬 에스텔레(Josh Estelle)

눈치 채신 분도 계시겠지만 구글 번역(Google Translate)이 더욱 밝은 톤으로 바뀌었습니다. 현재 페이지 디자인이 바뀌고 있으며, 이 같은 변경으로 텍스트, 웹페이지, 문서의 번역작업이 한결 편리해졌다는 느낌을 받으실 것입니다.


오늘 공개된 기능과 시각적 변화로 구글 번역이 제공하는 특징과 통합 기능을 쉽게 찾고 이용할 수 있습니다. 예를 들어 구글 번역을 사용해 언어의 종류와 관계없이 웹검색을 할 수 있습니다. 또는 지메일의 받은 편지함 내용을 번역하거나 스마트폰에서 구글 번역을 사용할 수 있습니다. 이와 같은 새로운 기능에 대한 자세한 소개는 구글 번역 활용팁(Do more with Google Translate) 페이지에서 볼 수 있습니다.

이와 함께 구글 번역에 대해 알아보기(Inside Google Translate) 페이지도 개설했습니다. 이 페이지는 구글 번역의 원리 등을 설명하고 있습니다. 구글 번역이 마법의 요정의 작품일까요? 아니면 학식 높은 언어학자의 작품일까요? 구글 엔지니어 안톤 안드리이예브(Anton Andryeyev)가 아래의 동영상에서 자세하게 설명해드립니다.



구글 번역이 전세계 언어 장벽을 넘어 사람들의 소통을 돕고 있다는 점은 매우 흥미롭습니다. 예를 들어 미국에 사는 리사는 최근 구글 번역기를 통해 중국에 사는 조부모와 연락하고 있습니다. 리사는 6살 때 중국에서 이민을 왔기 때문에 중국어와 영어가 유창하지만 중국어를 읽지는 못합니다. 조부모한테 중국어로 된 이메일을 받으면 구글 번역으로 문장을 해석합니다. 그리고 구글 번역을 사용해 답장을 씁니다.

구글 번역을 통해 다른 나라에 있는 친척과 연락하거나, 외국의 뉴스를 보거나 방학 기간을 알차게 보내신 분은 이 곳에 자신의 이야기를 공유해주시기 바랍니다. 여러분의 이야기가 구글 번역 블로그에 선정될 수도 있습니다.

* 구글 번역 페이지 변화는 순차적으로 진행되고 있습니다.

작성자: 프로덕트 매니저 아와니시 베르마(Awaneesh Verma)