구글 번역이 더 정확해지고 자연스러워집니다
2016년 11월 29일 화요일
*본 포스팅은 11월 15일 구글 영문블로그에 크로스 포스팅된 것입니다.
10년 전 구글 번역은 몇 개의 소수 언어에서 시작해 이제는 103개 언어를 지원하고 있습니다. 구글 번역을 통해 서로 다른 언어를 사용하는 사람들이 소통하고, 언어의 장벽을 허물고, 국경을 초월해 운명의 상대를 찾기도 합니다. 초기에 구글 번역은 방대한 통계에 입각한 단순한 기계번역 기술, 즉 통계학적 모델을 사용해 텍스트를 번역하는 방식을 사용했습니다. 오늘 구글에서는 구글 번역을 한 단계 더 업그레이드하는 새로운 신경망 기계번역 기술을 선보입니다.
신경망 기계번역 기술은 수년간 구글에서 흥미로운 연구 대상이었고 올해 9월 구글 연구팀은 ‘구글 신경망 기계번역(Google Neural Machine Translation)’ 기술을 공개했습니다. GNMT 시스템은 부분 부분 번역하는 것이 아니라, 보다 높은 수준에서 문장 전체로 텍스트를 한 번에 번역합니다. 문장 전체의 문맥을 살펴서 가장 적합한 번역을 파악한 후, 재배열하고 문법 규칙에 따라 실제 인간이 말하는 문장에 가깝도록 수정합니다. 각 문장이 더 이해하기 쉬워짐으로써 번역된 문단, 더 나아가 전체 텍스트의 가독성이 훨씬 개선됩니다. 이 모든 것이 신경망 기계번역 기술을 토대로 구축된 엔드-투-엔드 학습 시스템으로 가능해진 것입니다. 다시 말해, 이 시스템은 배운 것을 축적하여 시간이 갈수록 더 나은, 더 자연스러운 번역을 제공합니다.
최근 구글에서는 신경망 기계번역 기술을 8개 언어 조합(영어-프랑스어, 영어-독일어, 영어-스페인어, 영어-포르투갈어, 영어-중국어, 영어-일본어, 영어-한국어, 영어-터키어)에 시범 적용을 시작했습니다. 이 언어들은 전 세계 인구의 약 3분의 1이 사용하는 모국어이며, 전체 구글 번역 검색 요청의 35% 이상을 차지합니다.
이번 업데이트를 통해 구글 번역 서비스는 지난 10년간 있었던 모든 업데이트를 합친 것 이상의 도약을 하게 됩니다(이상의 놀랄만한 발전을 이루게 되었습니다). 하지만 이는 단지 시작에 불과합니다. 이번에는 8개 언어 조합으로 구글 검색, 구글 번역 앱, 웹사이트에서 시작하지만, 신경망 기계번역을 점차 103개 언어 모두에 확대 적용하고 구글 번역을 이용할 수 있는 모든 지점에서 이를 제공하는 것이 우리의 목표입니다.
오늘 새로운 소식이 하나 더 있습니다. 구글의 공개 클라우드 서비스인 구글 클라우드 플랫폼 관련 소식입니다. 이제 누구나 구글의 머신러닝 기술을 쉽게 이용할 수 있는 머신러닝 API가 제공됩니다. 또한, 구글 클라우드 플랫폼에서는 어느 기업이나 구글 클라우드 번역 API를 통해 신경망 기계번역 시스템을 이용할 수 있습니다. 여기에서 자세한 사항을 확인하시기 바랍니다.
신경망 기계번역 기술의 적용으로 구글 번역은 매우 중요한 진전을 이룰 수 있게 되었습니다. 그러나 앞으로 해야 할 일은 여전히 남아있습니다. 우리는 계속해서 배워나가고자 합니다. 또한, 앞으로도 구글은 언어를 사랑하는 사용자들이 번역에 자발적으로 참여하고 리뷰를 주고받으며 언어를 공유하는 장인 번역 커뮤니티의 더 큰 활약을 기대합니다. 구글 번역으로 번역을 해보세요. 세상을 조금 더 잘 이해할 수 있을 것입니다.
작성자: 버락 투로프스키(Barak Turovsky), 구글 번역 프로덕트 매니지먼트 총괄