작성자: 이충식, 구글코리아 소프트웨어 엔지니어날짜: 2007년 11월 9 일 금요일
안녕하세요, 구글 코리아팀의 소프트웨어 엔지니어 이충식입니다. 오늘은 대부분의 사용자들은 아마도 전혀 눈치를 채지 못했을 정도로 조용히 시작된 서비스 – 그리고 당연히 몇몇 한국 엔지니어들이 그간 일해왔던 부분이기도 하지요 – 에 대한 소개를 하려고 합니다. 구글에서는 그동안 언어 번역 기능을 서비스해왔습니다. 번역이 지원되는 언어는 영어에서 아랍어, 러시아어, 중국어 간체/번체로의 번역과 그 역으로의 번역 및 한국어, 일본어 번역 등이 있었습니다. 아마 민감한 분은 눈치를 채셨을 지도 모르지만, 일부 언어간에는 'BETA'라는 꼬리표가 붙어 있었고 다른 언어에는 그런 표시가 없이 정식 서비스가 되고 있었습니다. 아랍어, 중국어 간체/번체, 러시아어의 3 개 (혹은 4개) 언어와 영어 간의 번역 서비스는 구글에서 개발한 엔진이었고, 한국어, 일본어 등 여타 'BETA' 서비스는 타 업체의 엔진으로 서비스 되고 있었습니다. 그러나!지난 10월 중순. 모든 번역 서비스를 구글에서 자체 개발한 엔진으로 교환했습니다. 아직 더 개선되어야 할 면이 있어서 또 다른 의미의 'BETA'라는 꼬리표들을 붙이기는 했지만 기존과는 완전히 다른 형태의 번역을 제공하고 있습니다. 현재 번역 서비스가 제공되고 있는 대상 언어들은 다음과 같습니다. * 영어 <-> 한글, 아랍어, 중국어 간체/번체, 프랑스어, 이탈리아어, 독일어, 스페인어, 포르투갈어, 일본어 * 프랑스어 <-> 독일어 조금 사용을 해 보시면 아시겠지만 아직까지 한글관련 번역의 품질은 더많은 향상이 요구됩니다. 그럼에도 불구하고 한글 사용자들이 본 번역 서비스를 유용하게 사용할 수 있지 않을까 하는 생각에 일단 서비스를 시작하기로 결정하게 되었습니다. 어떻게 동작을 하는지 궁금하신가요? 기술적인 내용의 큰 골격이 되는 부분들은 이미 몇년 전부터 학회 등을 통하여 공개되고 있습니다. 기계 번역을 실현하기 위한 몇 가지 접근 방법 중, 구글에서는 구글의 장점 중 하나인 거대한 계산 능력을 활용하기에 적합한 통계적 방법을 채택하고 있습니다.통계 기반 기계 번역을 실현하기 위해서는 거대한 분량의 양질의 학습 데이터가 필요합니다. 학습 데이터란, 만들고자 하는 언어간의 번역 데이터를 말합니다. 양질의 데이터가 많으면 많을 수록 제공되는 번역 서비스의 품질은 향상됩니다. 거대 분량의 학습 데이터로부터 단어간, 혹은 구절간 번역 후보를 자동으로 생성하고 이를 언어 모델에 근거하여 가장 자연스러운 형태의 결과물로 만들어냅니다.현재 제공되는 언어들 중 아랍어를 비롯 몇몇 언어는 상당한 수준의 결과를 보여주고 있습니다. 이는 이들 언어의 특성에도 비롯하지만, 양질의 데이터를 다수 확보하기에 용이하다는 점도 크게 작용하고 있습니다. 반면에 한국어의 경우 양질의 번역 데이터를 확보하기가 무척 어려운 언어 중의 하나이고, 이로 인하여 한국어 관련 번역 품질을 향상시키는데 많은 어려움을 겪고 있습니다.혹시 도움을 줄 수 있는 방법이 있냐구요? 그렇습니다. 번역 페이지에 가셔서 – http://translate.google.com/translate_t?langpair=ko|en 혹은http://translate.google.com/translate_t?langpair=en|ko – 원문 문장을 넣으시고 번역 버튼을 누르면 오른쪽에 번역 결과가 나타납니다. 오른쪽 번역 결과가 마음에 들지 않다구요? 그렇다면 결과물의 우측 하단을 보시면 "Suggest a better translation"을 누르시고 더 좋은 번역 결과를 추천해 주세요. 스팸성 추천을 막기 위한 몇 가지 자동 필터링을 거쳐서 추후 더 나은 서비스를 생성하는 데이터로 사용이 될 것입니다.또한 다른 방법으로 도움을 주실 수도 있습니다. 한국어와 타 언어간의 좋은 번역물을 다수 확보하고 계시는 분들께서는 연락해 주십시오. 그리고 공개된 번역 자료물이 많은 곳을 추천해 주시는 것도 아주 많은 도움이 됩니다. 또한, 사용자 인터페이스에 대한 조언은 언제나 환영하며, 이러한 기술을 활용하여 사용자들에게 더 좋은 서비스가 될 수 있는 아이디어를 가지신 분들은 언제든지 연락( rosetta_feedback@google.com) 주시기 바랍니다. 구글 코리아팀은 한국 사용자들에게 보다 나은 서비스를 제공하기 위해 언제나 노력하고 있습니다.자 지금 http://translate.google.com 을 방문하셔서 구글의 새로운 번역 서비스를 만나보세요!
Google
취재 문의 이메일 주소: skr-google@ketchum.com 미디어 취재 문의가 아닌 경우 응답해 드리지 않습니다. 다른 문의사항이 있는 경우 Google 도움말 센터를 방문하시기 바랍니다.