구글 I/O 2023: 우리 모두에게 더 유용한 AI 만들기

2023년 5월 11일

읽는데 [[read-time]] 분 소요

순다 피차이(Sundar Pichai)

CEO of Google and Alphabet

순다 피차이 구글 CEO가 I/O 2023 행사에서 기조연설을 하고 있다.

AI-퍼스트(AI-first) 기업으로서의 여정을 시작한 지 7년이 지난 현재, 구글은 흥미진진한 변곡점에 서 있습니다. 구글은 사람과 비즈니스, 커뮤니티 그리고 모두를 위해 AI를 더욱 유용하게 만들 수 있는 기회를 갖게 되었다고 생각합니다.

구글은 이전부터 더욱 빠르게 유용한 서비스를 제공하고자 구글의 제품에 AI를 다양하게 적용해 왔습니다. 이제 구글은 생성형 AI를 기반으로 한 단계 더 나아가고자 합니다. 구글은 대담하지만 책임감 있는 방식으로 구글 검색을 비롯한 모든 핵심 제품을 재정의 해 나가고 있습니다.

구글 제품에서 만나는 AI
지메일(Gmail)에 적용되는 "Help me write" 기능

먼저 생성형 AI가 어떻게 구글의 제품을 진화시키고 있는지 몇 가지 예를 들어보겠습니다. 2017년 구글은 한 번의 클릭으로 짧은 답장을 선택해 보낼 수 있는 스마트 답장(Smart Reply) 기능을 선보였습니다. 그 다음에는 글자를 입력하면 문구를 제안하는 스마트 편지쓰기(Smart Compose) 기능을 선보였습니다. 스마트 편지쓰기는 AI를 기반으로 더욱 진화된 글쓰기 기능들로 발전해 지난 한 해에만 워크스페이스(Workspace)에서 1,800억 회 이상 사용되었습니다. 구글은 훨씬 더 강력한 생성형 모델을 적용한 ‘Help me write’ 기능을 선보이며 지메일을 더욱 개선해 나가고 있습니다.

우선 항공권이 취소되었다는 이메일을 받았다고 가정해 보겠습니다. 항공사는 바우처를 보냈지만, 이용자는 전액 환불을 원하고 있죠. 바로 이런 상황에서 답변을 작성할 때 ‘Help me write’ 기능을 사용할 수 있습니다.

‘전액 환불을 요청하는 이메일’과 같이 원하는 명령어를 간단하게 입력해 보세요. 그리고 작성 버튼을 누르면 초안이 나타납니다. 매우 편리하게 기존 메일에서 항공권 정보까지 가져와 작성해 줍니다. 실제로 이용자가 보내고자 하는 내용과 거의 유사하게 작성됩니다. 만약 이용자가 조금 더 구체적으로 작성하기를 원한다면 수정을 할 수도 있습니다. 이용자가 내용을 다듬어 보낸다면 환불받을 가능성도 더 높아질 수 있겠죠? 그럼 이제 메일을 보낼 준비가 된 것 같습니다. 지금 보신 ‘Help me write’ 기능은 워크스페이스 업데이트의 일환으로 제공될 예정입니다. 또한, 기존의 스마트 편지쓰기 기능이 그랬듯이, ‘Help me write’도 앞으로 더욱 발전하게 될 것입니다.

구글 지도(Google Maps)에서 사용 가능한 'Immersive View for routes'

스트리트 뷰 출시 후 초창기부터 AI는 수십억 개의 파노라마 이미지들을 모아 이용자들이 자신의 기기에서 전 세계를 탐험할 수 있도록 지원했습니다. 구글은 지난해 I/O에서 AI 기술을 바탕으로 특정 장소를 생동감 있게 구현해 이용자들이 직접 방문하기 전에 해당 장소를 경험해 볼 수 있도록 하는 ‘몰입형 뷰(Immersive View)’ 기능을 선보였습니다.

구글은 몰입형 뷰 기능을 더욱 확장해 이용자들이 어디든 가볼 수 있도록 구글 지도에 해당 기능을 업데이트합니다. 이번에 공개하는 ‘Immersive View for routes’ 를 통해 이용자들은 도보, 자전거, 자동차를 비롯해 어떤 교통수단을 활용 하든지 간에 여정을 미리 살펴볼 수 있습니다.

지금 뉴욕에서 자전거를 타고 이동하려는 상황이라고 가정하고 구글 지도를 켜보니 현재 제가 있는 곳에서 가까운 몇 가지 옵션을 제공해 줍니다. 저는 물가에 있는 장소가 좋으니 이쪽으로 가보겠습니다. 이곳의 경치가 좋아 보여 좀 더 자세히 살펴보고 싶을 때 ‘Immersive View for routes’를 클릭합니다. 이 기능을 통해 저의 여정을 완전히 새로운 방식으로 바라볼 수 있습니다. 화면을 확대해 이동 경로의 멋진 조감도도 볼 수 있습니다. 방향을 틀면 멋진 자전거 도로로 이어지는데요, 정말 아름다운 여행이 될 것 같네요.

또한 다른 정보들도 확인할 수 있습니다. 예를 들면, 오늘의 공기 질에 대한 정보도 알려주는데 확인해 보니 괜찮아 보입니다. 몇 시간 후 교통량이나 날씨가 어떻게 바뀔지도 볼 수 있습니다.

Immersive View for routes는 이번 여름을 시작으로 연말까지 런던, 뉴욕, 도쿄 그리고 샌프란시스코를 포함한 15개 도시에서 공개될 예정입니다.

구글 포토(Google Photos)에서의 새로운 매직 에디터(Magic Editor) 경험

구글 포토 또한 AI 기술을 통해 더욱 향상되었습니다. 지난 2015년 구글 I/O에서 처음 소개된 구글 포토는 구글에서 선보인 최초의 AI-네이티브 제품 중 하나입니다. 이후 머신 러닝 기술의 획기적인 발달로 구글 포토에서는 사람이나 일몰, 폭포 등 구체적인 대상을 검색할 수 있게 되었습니다.

이제 구글은 사진 검색에서 더 나아가 이용자들이 사진을 더욱 잘 편집할 수 있도록 업데이트합니다. 매달 약 17억 장의 이미지들이 구글 포토에서 편집되는데, AI 기술을 바탕으로 더욱 효과적인 이미지 편집이 가능해집니다. 예를 들면, 픽셀에서 먼저 출시된 Magic Eraser 기능은 AI 기반의 컴퓨터 사진 기술로 이미지 내 불필요한 요소를 삭제합니다. 또한, 올해 안에 구글에서 새롭게 선보이는 매직 에디터에서는 의미론적 이해(semantic understanding) 및 생성형 AI 기술을 조합해 더 다양한 기능을 활용할 수 있습니다.

사진 한 장을 살펴보겠습니다. 생일을 맞은 아이를 촬영한 사진인데 아이가 사진의 중앙에 위치하면 좋을 것 같아 가운데로 옮겨주었습니다. 원래 사진에는 배경에 있던 풍선이 잘린 채 나와 매직 에디터를 이용해 의자와 풍선을 자동으로 재생성 해주었습니다. 마지막으로 윗부분에 하늘도 만들어주었더니 전체적인 조명이 일관성 있게 나타납니다. 정말 마법 같은 효과입니다. 구글에서 올해 안에 공개할 구글 포토의 매직 에디터 기능을 기대해 주세요.

구글 포토의 매직 에디터 활용 GIF. 풍선을 들고 벤치에 앉아있는 어린아이의 이미지를 매직 에디터를 활용해 하늘 색상을 바꾸고, 벤치의 위치를 이동했다.

우리 모두에게 더 유용한 AI 만들기

앞서 소개드린 지메일, 구글 포토, 구글 지도 등 몇 가지 예시만으로도 AI가 필요한 순간에 어떻게 도움을 줄 수 있는지 알 수 있습니다. 구글은 이용자들에게 사랑받는 구글 제품들을 통해 AI 기술의 잠재력을 최대치로 실현할 수 있는 방법을 지속적으로 연구하고 있습니다.

현재, 구글의 15개 제품은 각각 5억 명 이상의 이용자와 기업들에게 서비스를 제공하고 있으며, 6개의 제품은 각각 20억 명 이상의 이용자에게 서비스를 제공하고 있습니다. 이는 구글의 사명인 ' 전 세계의 정보를 체계화하여 누구나 편리하게 이용할 수 있도록 하는 것'을 실현하는 기회이기도 합니다.

시간이 흘러갈 수록 앞서 설명한 사명은 더욱 중요해지고 있습니다. 앞으로 모든 사람들이 도움을 받을 수 있는 AI 기술을 구현하는 것이 구글이 지향하는 사명을 이끌어 나갈 가장 근본적인 방법이기 때문입니다. 이를 위해 구글은 다음과 같은 4가지 중요한 기준에 따라 AI기술을 개발하고 있습니다:

첫째, 이용자의 지식을 증대시키고 학습을 개선하며, 세상을 더 깊이 이해할 수 있도록 돕습니다.
둘째, 창의성과 생산성을 높여, 이용자가 능동적으로 업무를 처리할 수 있도록 돕습니다.
셋째, 개발자와 기업이 혁신적인 제품과 서비스를 스스로 구축할 수 있도록 돕습니다.
마지막으로 모든 이용자가 동등하게 혜택을 누릴 수 있도록 책임 있는 방식으로 AI 기술을 적용합니다.

PaLM 2 및 제미니(Gemini)

구글은 앞으로 펼쳐질 무한한 기회에 큰 기대를 가지고 있습니다. 모두에게 도움이 되는 AI를 만들기 위한 구글의 역량은 구글의 파운데이션 모델을 지속적으로 발전시켜 나가는 것에 달려있기 때문에 이에 대해 어떻게 접근하고 있는지를 여러분께 공유하고자 합니다.

작년에 발표된 PaLM을 통해 구글은 다양한 구글의 제품들을 개선할 수 있었습니다. 그리고 오늘, 구글의 기초 연구와 최신 인프라를 기반으로 개발된 가장 최신의 PaLM 모델인 PaLM 2를 발표합니다.

구글의 핵심 기본연구와 최신 인프라에 기반해 개발되는 PaLM 2는 다양한 업무 수행과 용이한 구축이 가능합니다. 오늘 PaLM 2가 적용되는 25개 이상의 제품과 기능들을 발표합니다.

이와 함께 PaLM 2 모델은 다양한 규모에 따라 뛰어난 기본 기능을 제공합니다. PaLM 2의 각 모델에는 Gecko, Otter, Bison, 그리고 Unicorn이라는 사랑스러운 이름을 붙였습니다. Gecko는 매우 가벼워서 오프라인은 물론 모바일 기기에서도 작업이 가능합니다. PaLM 2는 과학 및 수학 분야에 대해 폭 넓은 학습을 하고 있어 논리와 추론 능력이 뛰어납니다. 또한, PaLM 2는 100개 이상의 언어에 걸친 다국어 텍스트를 학습했습니다.

뛰어난 코딩 능력 덕분에 전 세계의 개발자들이 서로 협업할 수 있도록 돕기도 합니다. 예를 들어, 서울에 있는 동료와 작업 중에 코드를 디버깅해야 하는 경우, PaLM 2에게 버그를 수정해달라고 한 후 코드에 한국어로 코멘트를 남겨 동료를 도울 수도 있습니다. PaLM 2는 코드가 반복적인 것을 찾아내어 해결책을 제시할 것입니다. 해결책의 논리를 설명하고, 요청한대로 한국어로 코멘트를 남길 수도 있습니다.

PaLM 2는 뛰어난 기능을 갖추고 있지만, 분야별 지식을 세밀하게 조정할 때 그 진가를 발휘합니다. 최근에는 보안 관련 사례들을 학습시킨 Sec-PaLM을 출시했습니다. Sec-PaLM은 AI를 활용해 악성 스크립트를 추적하고, 보안 분석가들이 위협을 이해하고 해결할 수 있도록 도움을 줍니다.

또 다른 예시로는 의료 지식에 맞춰 미세 조정된 Med-PaLM 2가 있습니다. Med-PaLM 2는 PaLM 2 기본형에 비해 부정확한 추론이 9배 감소했는데, 이는 동일한 문제를 풀었던 전문 의료진들의 성과에 근접한 수준입니다. Med-PaLM 2는 의학 분야에서 가장 최첨단의 결과를 학습했으며, 의료면허시험 모의 테스트에서 ‘전문가’ 수준을 보인 최초의 언어 모델입니다.

구글은 Med-PaLM 2가 엑스레이 또는 유방 촬영(맘모그램) 등의 의료 영상 정보를 종합해 방사선사들이 이미지를 이해하고 그 결과를 환자들에게 잘 전달할 수 있도록 여러 기능을 추가하고 있습니다. 이처럼 PaLM 2는 여러 특화 분야에서 활용되고 있으며, 더욱 많은 영역에서 활용될 수 있기를 기대하고 있습니다. 때문에 오늘 PaLM 2의 프리뷰 버전을 발표하게 되어 더욱 기쁘게 생각합니다.

PaLM 2는 수많은 사람들이 AI를 책임감 있게 활용할 수 있도록 하기 위해 구글이 지난 10년 간 걸어온 여정 중에서 가장 최신의 단계입니다. 그리고 이 결과는 세계적인 연구팀인 브레인 팀(Brain Team)과 딥마인드(DeepMind)가 만들어 온 혁신을 기반으로 합니다.

지난 10년 동안 AI 분야에서 주목을 받은 순간들에 브레인 팀과 딥마인드가 상당한 공헌을 했다는 것을 알 수 있습니다. 알파고(AlphaGo)와 트랜스포머(Transformers), 그리고 시퀀스 투 시퀀스 모델(Sequence to sequence models)을 생각해보세요. 이들은 우리가 현재 마주하고 있는 변곡점을 만들어내는 데에 큰 도움이 되었습니다.

구글은 이 두 팀을 구글 딥마인드(Google DeepMind)라는 하나의 유닛으로 통합해 구글 컴퓨팅 리소스를 지원함으로써 이들이 더욱 뛰어난 성능의 시스템을 안전하고 책임감있게 구축하도록 할 계획입니다.

이 과정은 아직 학습 중인 차세대 기초 모델 제미니(Gemini)를 포함합니다. 처음부터 멀티모달로 제작되는 제미니는 툴 및 API와 통합하는 데에 효율적이며, 플래닝과 메모리 등 미래의 혁신이 가능하도록 설계되었습니다. 제미니는 아직 초기 단계이긴 하지만, 이미 이전 모델에서는 볼 수 없었던 멀티모달 기능을 선보이고 있습니다.

제미니는 미세 조정 및 안전성을 위한 테스트 과정을 거친 후 PaLM 2와 마찬가지로 여러 제품과 앱, 그리고 기기들에서 활용할 수 있도록 다양한 규모와 기능으로 제공될 예정입니다.

AI 활용에 대한 책임감: AI 생성 콘텐츠를 판별하는 도구들

다양한 기능을 수행하는 여러 모델들을 개발하며 구글은 AI 활용에 대한 책임감에도 주의를 기울이고 있습니다. 이용자들이 합성으로 만들어진 콘텐츠를 판별해낼 수 있는 도구들을 개발하는 것도 이러한 노력의 일환입니다.
두 가지 중요한 방법으로 워터마크와 메타데이터를 들 수 있습니다. 콘텐츠 내에 포함되어있는 워터마크는 이미지를 수정하더라도 계속 유지됩니다. 향후 구글은 생성 단계부터 워터마크가 포함되는 모델을 개발하고 있습니다. 한편 이용자들이 어떤 합성 이미지를 볼 때 너무나 진짜 같은 모습에 깜짝 놀랄 수 있습니다.

원본 파일에 대한 정보를 담고 있는 메타데이터는 콘텐츠 크리에이터들이해당 이미지를 보는 곳 어디서든 이미지에 대한 맥락을 확인할 수 있게 합니다. 구글은 앞으로 모든 AI로 생성된 이미지들에 이러한 메타데이터가 포함될 수 있도록 할 것입니다. 보다 자세한 내용은 이곳에서도 확인 가능합니다.

바드(Bard)와 워크스페이스 업데이트

AI모델들이 더욱 발전하고 기능을 추가함에 따라 가장 기대되는 점은 이용자들이 직접 제품 개발에 참여할 수 있게 된다는 것입니다.

지난 3월에 출시한 대화형 AI를 위한 구글의 실험인 바드는 바로 이러한 가능성과 기회를 잘 보여주고 있습니다. 구글은 바드를 빠르게 발전시키고 있고, 이제 폭넓은 프로그래밍 역량을 지원해 추론 역량과 고급 수학 프롬프트(명령어)를 더욱 영리하게 처리할 수 있습니다. 그리고 오늘 PaLM 2를 바드에 완전히 적용하였습니다. 바드의 최신 업데이트에 관한 자세한 내용은 이곳에서 확인 가능합니다.

또한 구글 워크스페이스에도 새로운 기능을 추가합니다.구글 닥스와 지메일의 'Help me write' 기능 외에도 구글 워크스페이스를 위한 듀엣 AI(Duet AI for Workspace)는 구글 슬라이드(Google Slide)와 구글 미트(Google Meet)에서 텍스트를 기반으로 이미지를 생성하고, 구글 시트(Google Sheets)에서 맞춤형 계획을 제안합니다. 보다 더 자세한 내용은 워크스페이스 업데이트를 참고하시기 바랍니다.

랩스(Labs)와 새로운 Search Generative Experience 소개

AI 기술이 급격하게 발전함에 따라 구글은 이용자들에게 유용한 기능을 제공하는 데 집중하고 있습니다. 오늘부터 워크스페이스를 비롯해 일부 제품에서 제공되는 몇몇 기능을 미리 체험할 수 있는 새로운 방법을 제공합니다. 바로 랩스(Labs)입니다. 새로운 방법이라고 설명드렸지만, 구글은 과거부터 랩스를 이용해 얼리 엑세스 제공 및 피드백을 수집해 왔습니다. 오늘부터 등록이 가능합니다.

앞서 소개한 워크스페이스의 기능 외에도 랩스에서 첫 번째로 체험할 수 있는 기능 중 하나는 바로 구글을 대표하는 구글 검색입니다. 구글이 몇 년 전부터 AI기술에 대한 막대한 투자를 시작한 이유는 검색을 더욱 개선할 수 있는 기회가 있다고 판단했기 때문입니다. 일련의 과정을 통해 구글 검색은 더욱 유용하면서도 직관적으로 도움이 되는 방향으로 발전했습니다.

또한 컴퓨터의 성능 개선으로 시각적 검색 방법을 구현할 수 있게 되었고 이를 여러분께 새롭게 소개해 드렸습니다. 이제 구글 렌즈(Google Lens)를 통해 이미지만으로 찾고자 하는 내용을 텍스트 없이 검색할 수 있습니다. 실제로, 구글 렌즈는 월 120억 건의 시각 콘텐츠 검색을 위해 이용되며, 이는 불과 2년 만에 4배나 증가했습니다. 멀티모달 구글 렌즈는 이미지와 텍스트를 모두 사용하여 검색하는 멀티서치를 구현해 내었습니다.

구글의 정보 이해 역량과 생성형 AI의 독특한 능력을 결합하면 구글 검색은 한 단계 더 변화할 수 있습니다. 이를 통해 완전히 새로운 질문에 대해서 정보와 답변을 제공하게 될 것이고, 웹 상의 다양한 콘텐츠와 연결되어 보다 유용한 경험을 이용자에게 제공할 수 있습니다.

물론, 생성형 AI를 검색에 적용하는 것은 아직 초기 단계에 있습니다. 구글은 세계 각지의 이용자들이 중요한 순간에 구글 검색을 이용하고 그 결과를 신뢰한다는 것을 압니다. 따라서 올바른 원칙에 따라 개발을 진행하고 이용자들의 믿음에 계속해서 부응하는 것이 무엇보다 중요하다고 생각합니다. 이는 구글의 일관된 지향점입니다.

따라서 구글은 책임감 있는 접근 방식을 취하며 검색의 높은 품질 기준을 충족하도록 해당 모델들을 학습시키고 있습니다. 이것이 바로 구글이 새로운 Search Generative Experience(SGE)를 랩스에서 우선 공개하는 이유입니다.

모두가 쉽게 혁신할 수 있도록 지원

지금까지 AI기술이 어떻게 인간의 창의성과 생산성, 그리고 지식의 확장에 도움을 줄 수 있는지 공유했습니다. 최근 혁신은 모든 기업과 조직의 핵심 과제로 자리 잡았습니다. 구글은 AI를 통해 모두가 보다 쉽게 대규모의 혁신을 이룰 수 있도록 지원하는 데 초점을 두고 있습니다.

구글은 이를 위해 최첨단 TPU와 GPU를 포함한 가장 진화된 컴퓨팅 인프라를 제공하고, 검증 과정을 거쳐 구글 제품에 통합된 최신 기반 모델을 더 많은 기업이 활용할 수 있도록 확장하고 있습니다. 또한 세계 최고 수준의 도구들을 제공해 구글의 기업 고객들이 엔터프라이즈급 안전, 보안, 개인정보 보호 기능 등을 갖춘 자체 모델을 훈련, 튜닝하고 운영할 수 있도록 지원하고 있습니다. 보다 자세한 내용은 토마스 쿠리안(Thomas Kurian) 구글 클라우드 CEO의 글을 확인해보세요.

새로운 발전을 선도하는 안드로이드

AI에 대한 구글의 대담하고 책임감 있는 접근 방식은 이용자들의 창의성과 잠재력을 이끌어내는 방향을 향하고 있습니다. 안드로이드와 같은 컴퓨팅 플랫폼을 통해 가능한 더 많은 이들과 함께 그 혜택을 공유하고자 합니다. 또한 매직 컴포즈(Magic Compose), 시네마틱 배경화면(Cinematic Wallpapers), 생성형 AI 배경화면(Generative AI Wallpaper) 등을 통해 AI 기술 발전이 여러분의 휴대폰을 어떻게 창의적으로 개인화할 수 있는지에 대해서도 설명했습니다.

개인과 스마트홈까지 다양하게 활용되는 새로운 픽셀 기기

구글은 픽셀 7A(Pixel 7a), 픽셀 폴드(Pixel Fold), 픽셀 태블릿(Pixel Tablet) 등을 선보이며 구글의 AI기반 기기 생태계를 완성했습니다. 픽셀 7a는 오늘부터 구매 가능하며 픽셀 폴드와 픽셀 태블릿에 대한 사전 예약도 지금 가능합니다.

함께 만들어가는 미래

저는 우리 모두가 함께 경험하고 있는 거대한 기술 변화에 대해 생각해 보았습니다. AI 기술이 우리 모두에게 불러올 변화는 너무나 클 것이기 때문에 모두에게 도움이 되는 AI를 만드는 것은 그 무엇보다도 중요한 과제입니다.

구글은 매우 과감하게 AI 영역을 개척하는 동시에 AI를 올바른 방향으로 발전시켜야 한다는 사명감을 가지고 있습니다.

하지만 어느 회사도 이를 혼자서 달성할 수는 없습니다. 앞으로 AI가 가진 엄청난 잠재력을 긍정적인 방향으로 이끌어내는 일에 개발자 커뮤니티가 핵심적인 역할을 할 것이라고 믿습니다. 앞으로도 개발자 여러분과 협력하며 함께 긍정적인 생태계를 만들어 갈 수 있기를 소망합니다.

구글 I/O 2023: 우리 모두에게 더 유용한 AI 만들기

관련 게시글

AI 시대 서막을 알렸던 이세돌 vs 알파고, 그 후 이야기

다시 만난 이세돌, 3월 19일 인터뷰가 공개됩니다

구글의 최첨단 오픈 모델 ‘젬마(Gemma)’를 공개합니다

AI의 위험과 기회에 대응하기 위해 뮌헨안보회의에서 논의한 협력 방안

AI 발전을 위해 구글이 업계, 정부, 시민 사회와 협력하는 방법

구글의 차세대 모델: 제미나이 1.5