구글은 앞으로 펼쳐질 무한한 기회에 큰 기대를 가지고 있습니다. 모두에게 도움이 되는 AI를 만들기 위한 구글의 역량은 구글의 파운데이션 모델을 지속적으로 발전시켜 나가는 것에 달려있기 때문에 이에 대해 어떻게 접근하고 있는지를 여러분께 공유하고자 합니다.
작년에 발표된 PaLM을 통해 구글은 다양한 구글의 제품들을 개선할 수 있었습니다. 그리고 오늘, 구글의 기초 연구와 최신 인프라를 기반으로 개발된 가장 최신의 PaLM 모델인 PaLM 2를 발표합니다.
구글의 핵심 기본연구와 최신 인프라에 기반해 개발되는 PaLM 2는 다양한 업무 수행과 용이한 구축이 가능합니다. 오늘 PaLM 2가 적용되는 25개 이상의 제품과 기능들을 발표합니다.
이와 함께 PaLM 2 모델은 다양한 규모에 따라 뛰어난 기본 기능을 제공합니다. PaLM 2의 각 모델에는 Gecko, Otter, Bison, 그리고 Unicorn이라는 사랑스러운 이름을 붙였습니다. Gecko는 매우 가벼워서 오프라인은 물론 모바일 기기에서도 작업이 가능합니다. PaLM 2는 과학 및 수학 분야에 대해 폭 넓은 학습을 하고 있어 논리와 추론 능력이 뛰어납니다. 또한, PaLM 2는 100개 이상의 언어에 걸친 다국어 텍스트를 학습했습니다.
뛰어난 코딩 능력 덕분에 전 세계의 개발자들이 서로 협업할 수 있도록 돕기도 합니다. 예를 들어, 서울에 있는 동료와 작업 중에 코드를 디버깅해야 하는 경우, PaLM 2에게 버그를 수정해달라고 한 후 코드에 한국어로 코멘트를 남겨 동료를 도울 수도 있습니다. PaLM 2는 코드가 반복적인 것을 찾아내어 해결책을 제시할 것입니다. 해결책의 논리를 설명하고, 요청한대로 한국어로 코멘트를 남길 수도 있습니다.
PaLM 2는 뛰어난 기능을 갖추고 있지만, 분야별 지식을 세밀하게 조정할 때 그 진가를 발휘합니다. 최근에는 보안 관련 사례들을 학습시킨 Sec-PaLM을 출시했습니다. Sec-PaLM은 AI를 활용해 악성 스크립트를 추적하고, 보안 분석가들이 위협을 이해하고 해결할 수 있도록 도움을 줍니다.
또 다른 예시로는 의료 지식에 맞춰 미세 조정된 Med-PaLM 2가 있습니다. Med-PaLM 2는 PaLM 2 기본형에 비해 부정확한 추론이 9배 감소했는데, 이는 동일한 문제를 풀었던 전문 의료진들의 성과에 근접한 수준입니다. Med-PaLM 2는 의학 분야에서 가장 최첨단의 결과를 학습했으며, 의료면허시험 모의 테스트에서 ‘전문가’ 수준을 보인 최초의 언어 모델입니다.
구글은 Med-PaLM 2가 엑스레이 또는 유방 촬영(맘모그램) 등의 의료 영상 정보를 종합해 방사선사들이 이미지를 이해하고 그 결과를 환자들에게 잘 전달할 수 있도록 여러 기능을 추가하고 있습니다. 이처럼 PaLM 2는 여러 특화 분야에서 활용되고 있으며, 더욱 많은 영역에서 활용될 수 있기를 기대하고 있습니다. 때문에 오늘 PaLM 2의 프리뷰 버전을 발표하게 되어 더욱 기쁘게 생각합니다.
PaLM 2는 수많은 사람들이 AI를 책임감 있게 활용할 수 있도록 하기 위해 구글이 지난 10년 간 걸어온 여정 중에서 가장 최신의 단계입니다. 그리고 이 결과는 세계적인 연구팀인 브레인 팀(Brain Team)과 딥마인드(DeepMind)가 만들어 온 혁신을 기반으로 합니다.
지난 10년 동안 AI 분야에서 주목을 받은 순간들에 브레인 팀과 딥마인드가 상당한 공헌을 했다는 것을 알 수 있습니다. 알파고(AlphaGo)와 트랜스포머(Transformers), 그리고 시퀀스 투 시퀀스 모델(Sequence to sequence models)을 생각해보세요. 이들은 우리가 현재 마주하고 있는 변곡점을 만들어내는 데에 큰 도움이 되었습니다.
구글은 이 두 팀을 구글 딥마인드(Google DeepMind)라는 하나의 유닛으로 통합해 구글 컴퓨팅 리소스를 지원함으로써 이들이 더욱 뛰어난 성능의 시스템을 안전하고 책임감있게 구축하도록 할 계획입니다.
이 과정은 아직 학습 중인 차세대 기초 모델 제미니(Gemini)를 포함합니다. 처음부터 멀티모달로 제작되는 제미니는 툴 및 API와 통합하는 데에 효율적이며, 플래닝과 메모리 등 미래의 혁신이 가능하도록 설계되었습니다. 제미니는 아직 초기 단계이긴 하지만, 이미 이전 모델에서는 볼 수 없었던 멀티모달 기능을 선보이고 있습니다.
제미니는 미세 조정 및 안전성을 위한 테스트 과정을 거친 후 PaLM 2와 마찬가지로 여러 제품과 앱, 그리고 기기들에서 활용할 수 있도록 다양한 규모와 기능으로 제공될 예정입니다.
AI 활용에 대한 책임감: AI 생성 콘텐츠를 판별하는 도구들
다양한 기능을 수행하는 여러 모델들을 개발하며 구글은 AI 활용에 대한 책임감에도 주의를 기울이고 있습니다. 이용자들이 합성으로 만들어진 콘텐츠를 판별해낼 수 있는 도구들을 개발하는 것도 이러한 노력의 일환입니다.
두 가지 중요한 방법으로 워터마크와 메타데이터를 들 수 있습니다. 콘텐츠 내에 포함되어있는 워터마크는 이미지를 수정하더라도 계속 유지됩니다. 향후 구글은 생성 단계부터 워터마크가 포함되는 모델을 개발하고 있습니다. 한편 이용자들이 어떤 합성 이미지를 볼 때 너무나 진짜 같은 모습에 깜짝 놀랄 수 있습니다.
원본 파일에 대한 정보를 담고 있는 메타데이터는 콘텐츠 크리에이터들이해당 이미지를 보는 곳 어디서든 이미지에 대한 맥락을 확인할 수 있게 합니다. 구글은 앞으로 모든 AI로 생성된 이미지들에 이러한 메타데이터가 포함될 수 있도록 할 것입니다. 보다 자세한 내용은 이곳에서도 확인 가능합니다.
바드(Bard)와 워크스페이스 업데이트
AI모델들이 더욱 발전하고 기능을 추가함에 따라 가장 기대되는 점은 이용자들이 직접 제품 개발에 참여할 수 있게 된다는 것입니다.
지난 3월에 출시한 대화형 AI를 위한 구글의 실험인 바드는 바로 이러한 가능성과 기회를 잘 보여주고 있습니다. 구글은 바드를 빠르게 발전시키고 있고, 이제 폭넓은 프로그래밍 역량을 지원해 추론 역량과 고급 수학 프롬프트(명령어)를 더욱 영리하게 처리할 수 있습니다. 그리고 오늘 PaLM 2를 바드에 완전히 적용하였습니다. 바드의 최신 업데이트에 관한 자세한 내용은 이곳에서 확인 가능합니다.
또한 구글 워크스페이스에도 새로운 기능을 추가합니다.구글 닥스와 지메일의 'Help me write' 기능 외에도 구글 워크스페이스를 위한 듀엣 AI(Duet AI for Workspace)는 구글 슬라이드(Google Slide)와 구글 미트(Google Meet)에서 텍스트를 기반으로 이미지를 생성하고, 구글 시트(Google Sheets)에서 맞춤형 계획을 제안합니다. 보다 더 자세한 내용은 워크스페이스 업데이트를 참고하시기 바랍니다.
랩스(Labs)와 새로운 Search Generative Experience 소개
AI 기술이 급격하게 발전함에 따라 구글은 이용자들에게 유용한 기능을 제공하는 데 집중하고 있습니다. 오늘부터 워크스페이스를 비롯해 일부 제품에서 제공되는 몇몇 기능을 미리 체험할 수 있는 새로운 방법을 제공합니다. 바로 랩스(Labs)입니다. 새로운 방법이라고 설명드렸지만, 구글은 과거부터 랩스를 이용해 얼리 엑세스 제공 및 피드백을 수집해 왔습니다. 오늘부터 등록이 가능합니다.
앞서 소개한 워크스페이스의 기능 외에도 랩스에서 첫 번째로 체험할 수 있는 기능 중 하나는 바로 구글을 대표하는 구글 검색입니다. 구글이 몇 년 전부터 AI기술에 대한 막대한 투자를 시작한 이유는 검색을 더욱 개선할 수 있는 기회가 있다고 판단했기 때문입니다. 일련의 과정을 통해 구글 검색은 더욱 유용하면서도 직관적으로 도움이 되는 방향으로 발전했습니다.
또한 컴퓨터의 성능 개선으로 시각적 검색 방법을 구현할 수 있게 되었고 이를 여러분께 새롭게 소개해 드렸습니다. 이제 구글 렌즈(Google Lens)를 통해 이미지만으로 찾고자 하는 내용을 텍스트 없이 검색할 수 있습니다. 실제로, 구글 렌즈는 월 120억 건의 시각 콘텐츠 검색을 위해 이용되며, 이는 불과 2년 만에 4배나 증가했습니다. 멀티모달 구글 렌즈는 이미지와 텍스트를 모두 사용하여 검색하는 멀티서치를 구현해 내었습니다.
구글의 정보 이해 역량과 생성형 AI의 독특한 능력을 결합하면 구글 검색은 한 단계 더 변화할 수 있습니다. 이를 통해 완전히 새로운 질문에 대해서 정보와 답변을 제공하게 될 것이고, 웹 상의 다양한 콘텐츠와 연결되어 보다 유용한 경험을 이용자에게 제공할 수 있습니다.
물론, 생성형 AI를 검색에 적용하는 것은 아직 초기 단계에 있습니다. 구글은 세계 각지의 이용자들이 중요한 순간에 구글 검색을 이용하고 그 결과를 신뢰한다는 것을 압니다. 따라서 올바른 원칙에 따라 개발을 진행하고 이용자들의 믿음에 계속해서 부응하는 것이 무엇보다 중요하다고 생각합니다. 이는 구글의 일관된 지향점입니다.
따라서 구글은 책임감 있는 접근 방식을 취하며 검색의 높은 품질 기준을 충족하도록 해당 모델들을 학습시키고 있습니다. 이것이 바로 구글이 새로운 Search Generative Experience(SGE)를 랩스에서 우선 공개하는 이유입니다. 모두가 쉽게 혁신할 수 있도록 지원
지금까지 AI기술이 어떻게 인간의 창의성과 생산성, 그리고 지식의 확장에 도움을 줄 수 있는지 공유했습니다. 최근 혁신은 모든 기업과 조직의 핵심 과제로 자리 잡았습니다. 구글은 AI를 통해 모두가 보다 쉽게 대규모의 혁신을 이룰 수 있도록 지원하는 데 초점을 두고 있습니다. 구글은 이를 위해 최첨단 TPU와 GPU를 포함한 가장 진화된 컴퓨팅 인프라를 제공하고, 검증 과정을 거쳐 구글 제품에 통합된 최신 기반 모델을 더 많은 기업이 활용할 수 있도록 확장하고 있습니다. 또한 세계 최고 수준의 도구들을 제공해 구글의 기업 고객들이 엔터프라이즈급 안전, 보안, 개인정보 보호 기능 등을 갖춘 자체 모델을 훈련, 튜닝하고 운영할 수 있도록 지원하고 있습니다. 보다 자세한 내용은 토마스 쿠리안(Thomas Kurian) 구글 클라우드 CEO의 글을 확인해보세요.
새로운 발전을 선도하는 안드로이드
AI에 대한 구글의 대담하고 책임감 있는 접근 방식은 이용자들의 창의성과 잠재력을 이끌어내는 방향을 향하고 있습니다. 안드로이드와 같은 컴퓨팅 플랫폼을 통해 가능한 더 많은 이들과 함께 그 혜택을 공유하고자 합니다. 또한 매직 컴포즈(Magic Compose), 시네마틱 배경화면(Cinematic Wallpapers), 생성형 AI 배경화면(Generative AI Wallpaper) 등을 통해 AI 기술 발전이 여러분의 휴대폰을 어떻게 창의적으로 개인화할 수 있는지에 대해서도 설명했습니다.
개인과 스마트홈까지 다양하게 활용되는 새로운 픽셀 기기
구글은 픽셀 7A(Pixel 7a), 픽셀 폴드(Pixel Fold), 픽셀 태블릿(Pixel Tablet) 등을 선보이며 구글의 AI기반 기기 생태계를 완성했습니다. 픽셀 7a는 오늘부터 구매 가능하며 픽셀 폴드와 픽셀 태블릿에 대한 사전 예약도 지금 가능합니다.