청각장애를 앓는 사람은 미국 내에만 수 백만 명에 달한다고 합니다. 최근 연구에 따르면 2015년까지 전세계에서 청각장애를 앓는 인구는 7억 명이 넘을 것으로 추정됩니다. 이러한 상황으로 방송업계는 1970년대 초부터 자막을 입힌 프로그램을 정기적으로 서비스하고 있습니다. 오늘날 자체 자막 처리된 비디오는 그 어느 때 보다 많아졌지만 자막을 만드는 작업은 시간이 많이 소요되는 힘든 과정이 아닐 수 없습니다.

유튜브에서 저희가 전념하고 있는 한가지는 동영상을 누구나 쉽게 이용할 수 있도록 만드는 것입니다. 이를 위한 첫 번째 개발 프로젝트가 2008년에 발표된 자막기능(caption feature)이었습니다. 저희는 지난 11월 소규모의 파트너 그룹을 대상으로 자동번역(Auto-captioning) 처리가 가능한 서비스를 도입했습니다. 자동번역기능은 구글 보이스 검색의 음성-문자 전환(speech-to-text) 알고리즘의 일부를 이용해 시청자의 요청에 따라 자동으로 동영상에 자막을 생성하는 기능입니다. 동영상 소유주는 자동으로 생성된 자막을 내려 받아 직접 수정한 뒤 새로운 버전으로 업로드 할 수 있습니다. 시청자는 자막을 50개 언어 중 자신이 원하는 언어로 자동 번역되도록 선택할 수 있습니다. 이러한 모든 기능이 클릭 두 세 번만으로 가능합니다.

유튜브는 오늘 이러한 자동번역기능을 모든 유튜브 사용자에게 공개합니다. 앞으로는 자막이 처리되지 않은 동영상에 대해 동영상 소유주가 자동번역 서비스를 신속히 요청할 수 있는 “요청 처리(request processing)” 버튼도 선보일 것입니다. 그러나 이러한 자동번역기능을 모든 동영상에 적용하기까지는 어느 정도의 시간이 소요될 것입니다. 이에 따라 현재의 이용 가능한 상황에 대해 몇 가지 참고 삼아 말씀 드리면 다음과 같습니다.

•앞으로 몇 달 동안 자동번역 기능은 더 많은 언어를 지원하겠지만 현재는 영어로 된 동영상에 한해 자동번역 기능이 제공되고 있습니다.
•다른 음성인식 소프트웨어와 마찬가지로 자동번역 시스템 또한 또렷한 음질이 전제가 되어야 합니다. 배경 소음이나 차단된 음성의 동영상은 자동자막 기능이 제대로 작동할 수 없습니다. 오바마 대통령의 최근 칠레 지진과 관련한 연설 동영상은 자동번역이 가능한 표준적인 음질 수준을 보여주는 좋은 예입니다.
•자동번역기능은 완벽하지 않으며 일반적인 녹취 시스템과 같습니다. 따라서 동영상 소유주가 자막의 내용이 정확한지 확인할 필요가 있습니다. 또한 오디오 파일 자체에 문제가 있어 자동번역 기능이 작동되지 않을 수 있습니다. 하지만 구글의 음성 인식 기술이 날로 발전하고 있기 때문에 조금의 인내심만으로도 가능합니다.
•자동번역기능은 누구나 사용할 수 있습니다. 또한 앞서 말한 조건을 충족시키는 모든 기존 동영상들도 자동번역이 가능하도록 연구 중에 있습니다. 자신의 동영상이 자동번역기능과 관련한 문제가 있을 경우 유튜브 도움말을 이용하시기 바랍니다.

단지 몇 번의 클릭만으로 전세계 사람들이 자신의 동영상을 보고 내용을 이해할 수 있다는 점 때문에, 자동번역기능의 위력은 컨텐츠 소유주에게 매우 큽니다. 또한 자막은 사용자가 유튜브에서 원하는 동영상을 더욱 쉽게 검색하는데도 도움을 줍니다.

유튜브에는 매 분마다 20시간 분량의 동영상이 업로드되고 있습니다. 이들 동영상을 청각장애가 있거나 언어가 다른 사람들이 이용할 수 있도록 하는 것은 정보의 민주화 측면에서 의미 있는 진보입니다. 또한 많은 사람들과 협력하고 이해를 높이는 데에도 크게 일조할 것입니다.

작성자: 프로덕트 매니저 히로토 도쿠세이(Hiroto Tokusei), 최근 시청한 동영상 "How to Eat Stick Candy Fast(막대사탕 빨리 먹는법)"