고품질 신경망 기계 번역이 더 많은 언어로 제공됩니다
2017년 3월 7일 화요일
지난해 11월 브라질, 터키, 일본, 한국의 사용자는 구글 번역에서 모국어의 번역 품질이 정확도 및 이해도 측면에서 눈에 띄게 개선되었음을 경험했습니다. 이러한 결과는 총 8개 언어에 대해 구글이 도입한 신경망 기계 번역(신경망 딥러닝 기술을 적용해 문장 단위로 이해하고 번역하는) 기술로 가능했습니다. 힌디어, 러시아어, 베트남어를 시작으로 향후 몇 주간에 걸쳐 이러한 개선이 훨씬 더 많은 언어를 대상으로 구글 번역에서 진행될 예정입니다.
신경망 기계 번역은 과거 구문 단위 번역 기술 대비 장점이 훨씬 많습니다. 한 번에 전체 문장을 번역하기 때문이죠. 물론 이는 신경망 기술의 특징 중 일부에 불과합니다. 더 자세한 정보는 이 연구 블로그를 참조하시기 바랍니다. 신경망 기술을 이용하면 번역의 정확도가 높아지고 실제 해당 언어를 사용하는 사람의 말처럼 자연스러워집니다. 이전 번역 기술과의 차이점을 잘 보여주는 예를 보여 드리겠습니다.
처음에는 많은 새로운 언어에 신경 번역을 이렇게 빨리 적용할 수 있다고 생각하지 않았습니다. 그러나 구글 번역 모델은 한 번에 다중 언어를 학습하는 데 강점을 보인다는 점을 알게 되었습니다. 다양한 언어 조합 간에 일정한 패턴을 발견하고 이를 사용하여, 사용할 수 있는 데이터가 적거나 없을 때도 경험에 근거해 추측을 할 수 있습니다. 구글 신경망 번역 모델은 드라비다어족에 속한 네 개 언어와 같이 관련성 있는 언어 그룹에서만 작동하는 것이 아니라 서로 관련성이 전혀 없는 언어 조합(예: 폴란드어, 태국어, 베트남어)에서도 한 모델로 잘 훈련 되었습니다.
향후 수주 간에 걸쳐 더 많은 언어에 신경망 기계 번역을 도입할 예정이니 더 자연스럽고 더 유창해진 구글 번역을 기대해 주시기 바랍니다.
신경망 기계 번역은 구글 번역에 있어 분명 큰 도약이지만 아직 가야 할 길은 많이 남아 있습니다. 자발적으로 번역에 참여하고 다른 사용자의 번역을 검토함으로써 자신의 언어를 다른 사용자들과 공유하는 번역 커뮤니티의 활발한 참여를 앞으로도 기대합니다.
*구글 블로그 원문 링크
작성자: 바락 트로프스키, 구글 번역 책임자(자랑스러운 러시아어 사용자!)