모든 사람들에게 더욱 유용한 AI를 만듭니다
이 블로그는 구글 The Keyword 블로그(영문)에서도 확인하실 수 있습니다.
순다 피차이(Sundar Pichai) 구글 및 알파벳 CEO
기술의 변화는 과학의 발전, 인류의 진보, 삶의 질 향상을 위한 기회를 제공합니다. 현재 우리가 목격하고 있는 인공지능(AI)의 변화는 모바일이나 웹의 등장보다 훨씬 더 획기적이며, 우리 세대에 가장 큰 영향을 미칠 것이라고 생각됩니다. AI는 일상생활은 물론, 그 이상으로까지 전 세계 사람들에게 새로운 기회를 보여줄 수 있는 할 잠재력을 가지고 있습니다. 이는 이전에는 볼 수 없었던 규모의 혁신과 경제 발전, 지식, 학습, 창의성, 생산성의 새로운 물결을 가져올 것입니다.
이 중에서도 가장 흥미로운 부분은 바로 AI가 전 세계 모든 사람들에게 도움이 될 수 있는 기회를 만들 수 있다는 것입니다.
구글이 AI 퍼스트(AI First) 기업으로의 도약을 선포한 지 약 8년이 지난 지금, AI의 발전 속도는 더욱 빨라지고 있습니다. 수백만 명의 이용자들은 이제 구글 제품에서 생성형 AI를 사용하여 1년 전만 해도 불가능했던 일들을 하고 있습니다. 보다 복잡한 질문에 대한 답변을 찾는 것부터 다른 이들과 협업하고 창작활동을 위한 새로운 도구를 사용하는 것까지 그 범위는 아주 폭넓습니다. 또한 개발자들은 구글의 AI 모델과 인프라를 사용하여 새로운 생성형 AI 애플리케이션을 구축하고 있으며, 전 세계의 스타트업과 기업들은 구글의 AI 도구를 사용하여 성장하고 있습니다.
이는 매우 놀라운 성과이지만, 아직 시작에 불과합니다.
구글은 AI 개발에 있어 대담하고 책임감 있는 접근 방식을 취하고 있습니다. 연구 분야에서는 인류와 사회에 엄청난 혜택을 가져다줄 수 있는 AI의 역량을 목표하고 있으며, AI가 더 많은 능력을 갖추게 됨에 따라 각 정부 및 전문가와 협력하여 각종 안전 장치를 구축하고 있습니다. 또한 구글은 AI 원칙에 기반한 최고의 도구와 기초 모델 및 인프라에 지속 투자하고 있으며, 이를 구글의 제품에 적용하는 것은 물론 다른이들에게도 제공하고 있습니다.
앞으로 구글은 제미나이와 함께 새로운 도약을 시작합니다. 제미나이는 가장 뛰어난 최첨단 성능을 자랑하는 범용적인 AI 모델로 다양한 벤치마크에서 탁월한 성능을 보여주고 있습니다. 첫 번째 버전인 제미나이 1.0(Gemini 1.0)은 울트라(Ultra), 프로(Pro), 나노(Nano) 등 다양한 규모에 맞게 최적화되었습니다. 이는 제미나이 시대의 첫 번째 모델이자, 올해 초 구글 딥마인드를 설립하며 구글이 품었던 비전이 처음으로 실현된 것과도 같습니다. 제미나이로 펼쳐지는 앞으로의 시대는 구글이 한 기업으로서 진행했던 가장 큰 과학적 및 기술적 노력 중 하나입니다. 앞으로 다가올 변화와 제미나이가 전 세계 사람들에게 제공할 기회들이 진심으로 기대됩니다.
데미스 하사비스(Demis Hassabis) 구글 딥마인드 CEO
인공지능(AI)은 제가 평생을 바쳐온 연구 분야이며, 이것은 함께 연구하는 구글의 동료들에게도 마찬가지입니다. 어릴 적부터 컴퓨터 게임을 위한 AI를 프로그래밍하기 시작했고, 신경과학 연구원으로 일하며 뇌의 작동 방식을 이해하려고 노력했습니다. 그 과정에서 저는 더 똑똑한 기계를 만들 수 있다면 인류에게 놀라운 혜택을 줄 수 있을 것이라는 믿음을 가지게 되었습니다.
책임감 있는 AI를 통해 더 발전된 세상을 만들겠다는 약속은 구글 딥마인드(Google DeepMind) 연구의 원동력입니다. 구글은 사람이 세상을 이해하고 상호 작용하는 방식에서 영감을 받은 새로운 세대의 AI 모델을 만들고자 오랫동안 노력해 왔습니다. AI는 똑똑한 소프트웨어라기보다는 더욱 유용하고 직관적이며 전문적인 협력자 또는 조수처럼 느껴질 것이라고 생각했기 때문입니다.
바로 오늘, 지금까지 구축한 모델 중 가장 가장 유능하고 범용적인 모델인 제미나이(Gemini)를 소개하면서 이러한 같은 구글의 비전에 한 걸음 더 다가섭니다.
제미나이는 구글 리서치(Google Research) 등 구글 전반에 걸친 대규모 팀 협업의 결과이며, 처음부터 멀티모달로 설계되었습니다. 즉, 텍스트, 이미지, 오디오, 동영상, 코드 등 다양한 유형의 정보를 일반화하고, 원활하게 이해하며, 여러 정보를 동시에 조합하여 활용할 수 있다는 뜻입니다.
또한, 제미나이는 구글이 지금까지 만든 모델 중 가장 유연한 모델입니다. 제미나이는 데이터센터부터 모바일 기기까지 모든 환경에서 효율적으로 활용될 수 있습니다. 이같이 가장 앞선 기능을 통해 개발자와 기업은 AI를 활용해 구축하고 확장하는 방식을 크게 개선할 수 있을 것입니다.
첫 번째 버전인 제미나이 1.0은 세 가지 크기로 최적화했습니다.
제미나이 울트라(Gemini Ultra): 매우 복잡한 작업에 적합한 가장 유용하고 규모가 큰 모델
제미나이 프로(Gemini Pro): 다양한 작업에서 확장하기에 가장 적합한 모델
제미나이 나노(Gemini Nano): 온 디바이스 작업에 가장 효율적인 모델
최첨단 성능
구글은 다양한 작업에서 제미나이 모델을 철저하게 테스트하고 성능을 평가해 왔습니다.
자연스러운 이미지와 음성, 영상의 이해부터 수학적 추론까지 제미나이 울트라의 성능은 업계에서 대형 언어 모델(LLM) 연구개발 평가에서 주로 사용되는 32개의 벤치마크 중 30개에서 기존의 최신 기술을 뛰어넘는 결과를 보여주었습니다.
수학, 물리학, 역사, 법률, 의학, 윤리 등 총 57개의 주제를 복합적으로 활용해 세계 지식과 문제 해결 능력을 평가하는 MMLU(massive multitask language understanding; 대규모 멀티태스크 언어 이해) 테스트에서 90.04%의 점수를 기록한 제미나이 울트라는 전문가 인력보다 높은 결과를 기록한 최초의 모델입니다.
또한, 제미나이 울트라는 고도의 추론 능력이 요구되는 다양한 영역에 걸친 멀티모달 작업으로 구성된 새로운 MMMU 벤치마크에서 59.4%의 최상위 점수를 획득했습니다.
이미지 벤치마크 테스트에서 제미나이 울트라는 객체 문자 인식(OCR; object character recognition) 시스템의 도움 없이도 이전의 최신 모델보다 뛰어난 성능을 보였습니다. 이러한 벤치마크 결과는 제미나이의 기본적인 멀티모달 기반을 강조하는 동시에 제미나이가 더 복잡한 멀티모달 추론 능력이 있다는 가능성을 보여줍니다.
자세한 내용은 제미나이 기술 보고서에서 확인하세요.
제미나이는 다양한 멀티모달 벤치마크에서 최첨단 성능을 능가하는 성능을 발휘합니다.
차세대 기능
지금까지 멀티모달 인공지능 모델을 만드는 표준 접근 방식은 서로 다른 모달리티에 대해 별도의 구성 요소를 학습시킨 다음, 이를 서로 연결하여 일부 기능을 비슷하게 모방하는 것이었습니다. 이와 같은 모델은 이미지 설명과 같은 일부 작업은 잘 수행할 수 있지만 보다 개념적이거나 복잡한 추론에는 어려움을 겪을 수 있었습니다.
구글은 제미나이를 개발 단계 초기부터 다양한 모달리티에 대한 사전 학습을 통해 기본적으로 멀티모달이 되도록 설계했습니다. 이후 추가적인 멀티모달 데이터로 미세 조정하여 그 효과를 더욱 개선했습니다. 그 결과 제미나이는 처음부터 텍스트, 오디오, 이미지, 영상 등 모든 종류의 입력값을 원활하게 이해하고 추론할 수 있으며, 기존 멀티모달 모델보다 훨씬 뛰어나며 거의 모든 영역에서 가장 앞선 기능을 제공합니다.
제미나이의 기능에 대해 자세히 알아보고 작동 방식을 확인해 보세요.
텍스트, 이미지, 오디오에 대한 이해
제미나이 1.0은 텍스트, 이미지, 오디오 등을 동시에 인식하고 이해하도록 훈련되어 미세한 차이의 정보도 잘 이해하고 복잡한 주제와 관련된 질문에도 답변할 수 있습니다.
특히 수학과 물리학의 추론에 대한 설명에 탁월합니다.
정교한 추론
제미나이 1.0의 정교한 멀티모달 추론 기능은 복잡한 형태의 텍스트 및 시각적 정보를 이해하는 데 도움이 됩니다. 따라서 방대한 양의 데이터 속에서 식별하기 어려운 지식을 발견하는 데 뛰어난 능력을 발휘합니다.
정보를 읽고, 필터링하고, 이해하여 수십만 개의 문서에서 인사이트를 추출하는 이 엄청난 능력은 과학에서 금융에 이르기까지 다양한 분야에서 새로운 혁신을 놀라운 속도로 이끌어내는 데 도움이 될 것입니다.
강화된 코딩
제미나이 1.0은 파이썬, 자바, C++, Go 등 세계에서 가장 인기 있는 프로그래밍 언어로 작성된 고품질 코드를 이해하고, 설명하고, 생성할 수 있습니다. 다양한 언어를 다루고 복잡한 정보를 추론할 수 있는 능력으로 제미나이는 세계 최고 수준의 코딩 기반 모델 중 하나로 자리 잡았습니다.
제미나이 울트라는 코딩 작업을 위한 업계 표준 벤치마크인 HumanEval와 구글의 자체 데이터셋 코딩 벤치마크인 네추럴투코드(Natural2Code)를 비롯한 여러 코딩 벤치마크에서 우수한 성적을 거두고 있습니다.
제미나이는 더욱 발전된 코딩 시스템 엔진으로도 사용될 수 있습니다. 2년 전, 구글은 프로그래밍 대회에서 경쟁력 있는 성능 수준에 도달한 최초의 AI 코드 생성 시스템인 알파코드(AlphaCode)를 발표했습니다.
이어서 구글은 특화된 버전의 제미나이를 활용하여 단순한 코딩을 넘어 복잡한 수학과 이론적 컴퓨터 과학을 포함하는 경쟁 프로그래밍 문제 해결에 뛰어난 알파코드 2(AlphaCode 2)를 개발했습니다.
알파코드 2는 기존 알파코드와 동일한 플랫폼에서 비교했을 때 2배 이상 많은 문제를 해결하여 비약적인 개선을 이뤄냈습니다. 또한 경쟁 제품의 85% 보다 더 뛰어난 성능을 발휘할 것으로 추정됩니다(기존 알파코드 대비 50% 증가). 프로그래머가 알파코드 2와 협업하여 따라야 할 코드 샘플의 특정 속성을 정의하면 성능이 더욱 향상될 수 있습니다.
구글은 프로그래머들이 문제 해결, 코드 설계 제안, 앱 구현 지원 등을 통해 앱 출시 및 서비스 설계를 더욱 빠르게 진행할 수 있도록 도와주는 뛰어난 AI 모델을 협업 도구로 적극 활용하기를 기대합니다.
더 자세한 내용은 알파코드 2 기술 보고서에서 참고하실 수 있습니다.
제미나이1.0: 안정성, 확장성, 효율성 향상
구글은 자체 설계한 텐서 프로세싱 유닛 (Tensor Processing Unit: TPU) v4 및 v5e를 사용하여 AI 최적화 인프라에서 대규모로 제미나이 학습을 진행했습니다. 제미나이는 학습 단계부터 가장 안정적이고 확장성이 뛰어나며, 가장 효율적인 모델로 설계되었습니다.
제미나이는TPU에서 이전의 크기가 작고 기능이 제한적이던 모델보다 훨씬 빠르게 실행됩니다. 이러한 맞춤형 AI 액셀러레이터는 구글 검색, 유튜브, 지메일, 구글 지도, 구글플레이, 안드로이드 등 수십억 명의 이용자에게 서비스를 제공하는 구글의 AI 적용 제품의 핵심입니다. 또한 전 세계 기업이 대규모 AI 모델을 비용 효율적으로 학습할 수 있도록 지원했습니다.
구글은 오늘 최첨단 AI 모델을 학습시키기 위해 설계된 TPU 시스템인 Cloud TPU v5p도 발표합니다.
이 차세대 TPU는 제미나이의 향후 개발을 가속화하고, 개발자와 기업 고객이 대규모 생성형 AI 모델을 더 빠르게 학습시킬 수 있도록 지원함으로써, 새로운 제품과 기능이 고객에게 더 빨리 제공될 수 있도록 할 것입니다.
구글 데이터센터 내 위치한 클라우드 TPU v5p AI 액셀러레이터의 모습
책임과 안전을 최우선으로 한 제미나이
구글은 모든 분야에서 대담하고 책임감 있게 AI를 개발하기 위해 노력하고 있습니다. 구글의 AI 원칙과 제품 전반에 걸친 강력한 안전 정책을 바탕으로 제미나이의 멀티모달 기능을 고려하여 새로운 보호 기능을 추가하고 있습니다. 제미나이 개발의 각 단계에서 잠재적 위험을 감안하여 테스트 및 위험 완화를 위해 노력하고 있습니다.
제미나이는 편향, 독극물, 사이버 공격, 설득, 자율성 등 다양한 측면을 고려하여 구글의 AI 모델 중 가장 포괄적인 안전성 평가를 거쳤습니다. 또한, 제미나이의 배포 이전에 중요한 안전 문제를 식별하기 위해 구글 리서치의 최첨단 적대적 테스트 기법을 적용했습니다.
내부 평가 접근 방식의 사각지대를 식별하기 위해 다양한 분야의 외부 전문가 및 파트너와 협력하여 광범위한 문제에 대해 모델의 스트레스 테스트를 수행하고 있습니다.
제미나이는 트레이닝 단계에서 콘텐츠 안전 문제를 진단하고, 결과가 정책을 준수하는지 확인하기 위해 Real Toxicity Prompts와 같은 벤치마크를 사용합니다. 이 벤치마크는 알렌인공지능연구소(Allen Institute of AI)의 전문가들이 개발한 것으로 웹에서 가져온 다양한 독성(toxicity) 수준의 프롬프트 10만개 세트로 구성되어 있습니다.
또한 유해성을 최소화하기 위해 구글은 폭력이나 부정적인 고정관념과 같은 유해한 콘텐츠를 식별하고 차단하는 안전 분류 시스템을 구축했습니다. 강력한 필터와 결합된 이러한 다층적 접근 방식은 모두를 위한 더욱 안전하고 포용적인 제미나이를 만들기 위해 고안되었습니다. 또한 모델에 대한 알려진 사실성, 근거, 출처, 확증과 같은 문제들을 해결하기 위해 지속적으로 노력하고 있습니다.
책임감 있고 안전한 모델 개발과 배포는 구글의 핵심 가치입니다. 이것은 협력적 노력을 통해 달성해야 할 장기적인 목표이기도 합니다. 구글은 Secure AI Framework (SAIF)를 포함한 MLCommons, Frontier Model Forum, AI Safety Fund와 같은 조직들과 협력하여 안전 및 보안 벤치마크 설정 및 모범 사례를 개발하고 있습니다. SAIF는 공공 및 민간 부문 AI 시스템의 특정 보안 위험을 줄이기 위해 개발된 프레임워크입니다. 구글은 제미나이의 향후 개발 과정에서도 전 세계 연구자, 정부, 시민 사회 단체와의 협력을 지속할 것입니다.
전 세계 누구나 이용 가능한 제미나이
제미나이 1.0은 구글의 다양한 제품과 플랫폼을 통해 순차적으로 출시될 예정입니다.
제미나이 프로를 탑재한 구글 제품
구글의 제품을 통해 수십억 명의 이용자들에게 제미나이를 소개합니다.
오늘부터 이용자들은 추론과 계획, 이해 등과 같은 작업을 보다 잘 수행할 수 있는 파인튜닝된 제미나이 프로가 적용된 바드를 이용할 수 있습니다. 이것은 바드 출시 이후 가장 큰 규모의 성능 개선으로 이번 업데이트를 통해 제미나이 프로가 적용된 바드는 업계에서 가장 뛰어난 기능을 갖춘 모델이 되었습니다.
제미나이 프로가 적용된 바드는 170개 이상의 국가 및 지역에서 영어로 제공되며, 구글은 향후 몇 달 내에 다양한 모달리티로 서비스를 확장하고 새로운 지역과 언어를 지원할 계획입니다.
구글 픽셀(Pixel)에도 제미나이가 탑재될 예정입니다. 픽셀 8 프로는 제미나이 나노를 실행하도록 설계된 최초의 스마트폰입니다. 제미나이 나노는 녹음 앱 상의 요약하기와 같은 새로운 기능을 지원하며, 오늘 왓츠앱(WhatsApp)을 시작으로 내년에는 더 많은 메시징 앱과 함께 지보드(Gboard)의 스마트 답장에 적용될 예정입니다. 자세한 내용은 픽셀 블로그에서 확인해 보세요.
앞으로 몇 달 안에 구글 검색, 광고, 크롬, 듀엣 AI 등 더 많은 구글 제품 및 서비스에서 제미나이를 활용할 수 있게 될 예정입니다.
제미나이를 활용한 앱 개발
오는 12월 13일부터 개발자와 기업 고객은 Google AI Studio 또는 Vertex AI의 제미나이 API를 통해 제미나이 프로를 이용할 수 있습니다.
Google AI Studio는 API 키로 앱을 빠르게 프로토타이핑하고 출시할 수 있도록 도와주는 무료 웹 기반 개발자 도구입니다. 완전 관리형 AI 플랫폼이 필요한 경우, Vertex AI를 사용해 데이터를 완벽하게 제어할 수 있는 제미나이를 맞춤 설정하고 기업 보안, 안전, 개인정보 보호, 데이터 거버넌스 및 규정 준수를 위해 구글 클라우드(Google Cloud)가 추가 제공하는 이점을 활용할 수 있습니다.
또한 안드로이드 개발자는 AICore를 통해 온 디바이스 작업에 가장 효율적인 모델인 제미나이 나노로 앱을 개발할 수 있습니다. AICore는 픽셀 8 프로 기기부터 안드로이드 14(Android 14)에서 사용할 수 있는 새로운 시스템 기능이며, 사전 체험 신청을 통해 이용해 볼 수 있습니다.
제미나이 울트라 출시 예정
현재 제미나이 울트라는 출시를 앞두고 신뢰할 수 있는 외부 기관 소속 레드팀의 리뷰 등 광범위한 신뢰성 및 안전 점검을 완료한 후, 미세 조정과 사람의 피드백을 통한 강화 학습(Reinforcement Learning from Human Feedback: RLHF)을 거쳐 모델을 더욱 개선하는 작업을 진행 중입니다.
이 과정의 일환으로 구글은 일부 고객, 개발자, 파트너, 안전 및 책임 전문가에게 제미나이 울트라를 공개해 초기 실험을 진행하고 피드백을 받은 후 내년 초에 개발자와 기업 고객을 대상으로 광범위하게 제공할 예정입니다.
또한, 가장 뛰어난 성능의 최대 규모 모델인 제미나이 울트라를 적용해 새롭고 최첨단의 AI경험을 제공하게 될 바드 어드밴스드(Bard Advanced)를 내년 초에 선보일 예정입니다.
제미나이의 시대: 혁신의 미래를 열다
이번 제미나이 업데이트는 AI 개발의 중요한 이정표이자, 구글이 AI 모델의 기능을 빠르게 혁신하고 책임감 있게 발전시켜 나가는 새로운 시대의 시작을 의미합니다.
지금까지 제미나이는 놀라운 발전을 거듭해 왔습니다. 그리고 이제 구글은 플래닝과 메모리를 개선하고 더 많은 정보를 처리할 수 있는 컨텍스트 윈도우(context window)를 늘리는 등 더욱 확장된 기능을 갖춘 제미나이의 다음 버전을 학습을 진행하고 있습니다.
창의력 향상, 지식 확장, 과학 발전, 그리고 전 세계 수십억 명의 생활과 업무 방식에 혁신은 이미 시작되었습니다. AI의 미래가 불러올 놀라운 가능성에 큰 기대를 품습니다.