Aplicamos estas técnicas para criar avanços na computação quântica, da matemática, das ciências da vida e da descoberta de algoritmos. E continuamos a redobrar a amplitude e a profundidade da nossa investigação fundamental, trabalhando para inventar os próximos grandes avanços necessários para a inteligência artificial geral (IAG).
É por isso que estamos a tornar o nosso melhor modelo de base multimodal, o Gemini 2.5 Pro, num “modelo universal” capaz de planear e imaginar novas experiências ao compreender e simular determinados elementos do mundo, tal como um cérebro.
Há já algum tempo que temos vindo a dar passos nesta direção, desde o nosso trabalho pioneiro na formação de agentes para dominar jogos complexos, como o Go e StarCraft, ao desenvolvimento do Genie 2, que gera ambientes simulados em 3D com os quais, os utilizadores, podem interagir a partir de um único prompt de imagem.
Actualmente vemos provas destas capacidades, por exemplo, na capacidade do Gemini usar o conhecimento do mundo e o raciocínio para representar e simular ambientes naturais, na compreensão da física intuitiva do Veo e no modo como o Gemini Robotics ensina os robôs a compreender, a seguir instruções e a fazer ajustes em tempo real.
Tornar o Gemini um modelo universal é um passo fundamental para o desenvolvimento de um novo tipo de IA, mais geral e útil: um assistente de IA universal. Isto é uma IA inteligente, que compreende o contexto em que se encontra e que pode planear e agir em seu nome em qualquer dispositivo.
Integrámos as capacidades do Project Astra nos nossos produtos
A nossa visão final é transformar a app Gemini num assistente de IA universal que vai realizar tarefas diárias para nós, que vai cuidar das nossas tarefas administrativas de rotina e apresentar novas recomendações interessantes - tornando-nos mais produtivos e enriquecendo as nossas vidas.
Isto começa com as capacidades que explorámos pela primeira vez no ano passado no nosso protótipo de investigação, o Project Astra, como a compreensão de vídeo, partilha de ecrã e a memória.
Neste último ano, temos vindo a integrar funcionalidades como essas no Gemini Live, de forma que mais pessoas possam experimentá-las. Continuamos a melhorar implacavelmente e a explorar novas inovações de vanguarda. Por exemplo, melhorámos a saída de voz para ser mais natural com a saída de áudio nativa, optimizámos a memória e adicionamos um controlo por computador.
Estamos agora a recolher feedback destas capacidades de testadores fidedignos e estamos a trabalhar para trazê-las para o Gemini Live e para novas experiências como a Pesquisa, a API Live para programadores e novos formatos, como óculos.
Em cada etapa deste processo, a segurança e a responsabilidade são centrais para o nosso trabalho. Recentemente, conduzimos um grande projeto de investigação onde explorámos questões éticas relacionadas com os assistentes avançados de IA e este trabalho continua a contribuir para a nossa investigação, desenvolvimento e implantação.
Criámos uma IA que pode fazer várias tarefas por si
Também estamos a estudar como as capacidades dos agentes ajudam as pessoas a realizar várias tarefas em simultâneo, com o Project Mariner. Este protótipo de investigação explora o futuro da interação homem-agente, começando pelos navegadores de internet (browsers).
Desde o lançamento do Project Mariner no passado mês de dezembro, temos trabalhado em conjunto com um grupo de testadores fidedignos para recolher feedback e melhorar as suas capacidades experimentais.
O Project Mariner inclui agora um sistema de agentes que podem fazer até dez tarefas diferentes ao mesmo tempo. Estes agentes podem ajudar a procurar informação, fazer reservas, comprar artigos, desenvolver projetos de investigação e muito mais - tudo ao mesmo tempo.
A versão atualizada do Project Mariner está disponível para os subscritores do Google AI Ultra nos EUA. Estamos a trazer os seus recursos de utilização do computador para a API Gemini e estamos a planear trazer algumas das suas funcionalidades para outros produtos da Google este ano.
Saiba mais sobre as nossas capacidades dos agentes na Pesquisa e na aplicação do Gemini.
Com estes avanços e todo o nosso trabalho inovador, estamos a criar uma IA mais pessoal, proativa e potente, que melhora as nossas vidas, impulsiona o progresso científico e dá início a uma nova era dourada de descobertas e maravilhas.