A IA tem sido o foco do trabalho da minha vida, assim como para muitos dos meus colegas de pesquisa. Desde a programação de IA para jogos de computador na adolescência, e ao longo dos meus anos como pesquisador de neurociência tentando entender o funcionamento do cérebro, sempre acreditei que, se pudéssemos construir máquinas mais inteligentes, poderíamos aproveitá-las para beneficiar a humanidade de maneiras incríveis. Essa promessa de um mundo empoderado de forma responsável pela IA continua a impulsionar nosso trabalho no Google DeepMind. Por muito tempo, queríamos construir uma nova geração de modelos de IA, inspirados na maneira como as pessoas entendem e interagem com o mundo. IA que parece menos um software inteligente e mais como algo útil e intuitivo – um ajudante ou assistente especializado. Hoje, estamos um passo mais perto dessa visão ao apresentarmos o Gemini, o modelo mais capaz e geral que já construímos.
Demis Hassabis
Essas são as palavras do CEO e co-fundador da Google DeepMind para introduzir o modelo Gemini da Google no dia 6 de dezembro passado.
O que é o Gemini?

Gemini é um modelo de inteligência artificial projetado para ser multimodal. Segundo a Google, ele pode compreender, processar e combinar vários tipos de informações, como textos, códigos, áudios, imagens e vídeos. Ele foi criado como multimodal do zero para garantir operações perfeitas e abrangentes nesses diferentes tipos de dados.
Por ser um sistema multimodal, o Gemini é descrito como capaz de completar tarefas complexas em matemática, física e outras áreas, bem como entender e gerar códigos de alta qualidade em várias linguagens de programação.
Gemini - o melhor modelo de inteligência artificial da atualidade?
O novo modelo Gemini da Google está sendo liberado em três diferentes tamanhos (Nano, Pro e Ultra) para poder ser integrado com alta escalabilidade. O modelo Ultra, pelo que tem sido divulgado, deve ser o maior modelo de inteligência artificial multimodal disponível na atualidade. Ele será integrado ao Google Bard no início do próximo ano.
Mas não é apenas em tamanho que o Gemini se destaca. Em comparação com outros modelos populares de inteligência artificial como o ChatGPT, o Gemini se destaca por sua característica multimodal nativa. Ou seja, enquanto outros modelos, como o GPT-4, dependem de plugins e integrações para serem multimodais, o Gemini é verdadeiramente multimodal.