Hoje partilhamos como as eleições para o Parlamento Europeu deste ano apareceram no YouTube e o que fazemos nestes momentos para ajudar a garantir que o conteúdo eleitoral de alta qualidade prospera na nossa plataforma. Espectadores de toda a União Europeia acederam ao YouTube para ouvir diretamente os candidatos, aprofundar os problemas da campanha e manter-se informados sobre as últimas atualizações. Veja como aconteceu.
Ligar os eleitores a conteúdo eleitoral confiável
O acesso à informação fidedigna é uma parte importante do envolvimento democrático. É por isso que desenvolvemos recursos que facilitam a localização de conteúdo eleitoral proveniente de fontes fidedignas, nos resultados de pesquisa, notícias importantes destacadas e no painel “ver a seguir”. Este é o sistema de recomendação do YouTube em funcionamento. Até ao dia 9 de junho e desde então, este sistema ajudou os espectadores de toda a Europa a encontrar conteúdos eleitorais oficiais em várias línguas da UE.
Os painéis de informação eleitoral facilitaram também o registo das pessoas para votar, saber como votar, saber mais sobre os candidatos e aceder aos resultados eleitorais. No total, estas funcionalidades eleitorais dedicadas apareceram aos espectadores do YouTube em toda a UE mais de 1,1 mil milhões de vezes.
Remover conteúdo prejudicial antes de ser amplamente visualizado
A nossa equipa de Confiança e Segurança passou anos a criar um manual para proteger a comunidade do YouTube e a responder rapidamente a ameaças emergentes - implementaram-no em inúmeras eleições em todo o mundo, incluindo, este ano, em toda a UE. Isto inclui a remoção de vídeos que possam, por exemplo, enganar os eleitores sobre como votar, incitar à violência ou promover certos tipos de desinformação eleitoral. Aplicamos as nossas políticas em todos os idiomas, independentemente do perfil público ou político do interveniente.
Até 9 de junho, encerrámos mais de 1.000 canais e removemos mais de 140 vídeos relacionados com as eleições na UE por violarem as nossas Diretrizes da Comunidade, incluindo as nossas políticas sobre conteúdo manipulado e vídeos e imagens enganadores.
O YouTube tem também mais de 100 moderadores de denúncias prioritárias em toda a UE, que possuem ferramentas adicionais para sinalizar conteúdo potencialmente violador para revisão. Estas ONG e agências governamentais abrangem uma vasta gama de conhecimentos, incluindo discurso de ódio e desinformação, complementando os esforços dos 20.000 revisores de conteúdos globais da Google e dos nossos sistemas automatizados.
Combater as campanhas de desinformação
As nossas equipas dedicadas também trabalharam ininterruptamente durante vários meses para identificar operações de influência coordenadas que tentassem interferir nestas eleições. Por exemplo, em maio, ao trabalhar com o Grupo de Análise de Ameaças da Google, encerrámos 21 canais do YouTube no âmbito da nossa investigação em curso sobre campanhas de desinformação ligadas à Rússia. Os canais partilharam conteúdos em várias línguas da UE com narrativas críticas sobre as condições internas nos países da UE e sobre a ajuda financeira dos EUA/UE para a guerra na Ucrânia.
Quando a votação foi encerrada, e como parte da nossa cobertura proactiva destas eleições, tínhamos encerrado 240 canais por fazerem parte de operações de influência coordenadas dirigidas à UE.
Aumentar a transparência em torno do conteúdo gerado por IA
Antes das eleições, introduzimos novas atualizações para ajudar os espectadores a compreender quando estão a ver um vídeo que contém conteúdo realista, alterado ou sintético. Os criadores são obrigados a divulgar quando carregam este tipo de conteúdo e depois adicionamos um rótulo de transparência para que os espectadores tenham este contexto importante.
Na primeira quinzena de junho, o rótulo de conteúdo alterado ou sintético foi exibido mais de 40 milhões de vezes em vídeos na UE. Também aplicámos as nossas políticas de longa data que proíbem a desinformação prejudicial.
Proteger a comunidade do YouTube continua a ser a nossa prioridade número um, tanto em época de eleições como durante todo o ano. Continuaremos a trabalhar nestes esforços em conjunto com os governos, a indústria e as ONG em toda a União Europeia e não só. E as nossas equipas dedicadas aplicarão estas ideias e lições ao nosso trabalho contínuo de apoio à integridade eleitoral em todo o mundo.
Publicado por The YouTube Team
Todos os dias, aprendemos como as pessoas estão a utilizar o Gemini para serem mais produtivas, criativas e curiosas. E com a atualização de hoje, o Gemini está a ficar ainda melhor a ajudá-lo a realizar estas tarefas das formas que melhor funcionam para si.
Agora, pode aceder ao Flash 1.5 na versão gratuita do Gemini para obter respostas mais rápidas e úteis. Além disso, estamos a introduzir uma nova funcionalidade para responder melhor a alucinações e a expandir a nossa experiência Gemini for Teens e a aplicação móvel a mais locais.
Respostas mais rápidas e inteligentes com o 1.5 Flash
Ouvimos dizer que uma das principais razões para as pessoas gostarem de utilizar o Gemini é porque poupa tempo. Quer esteja a utilizar o Gemini para escrever um e-mail apelativo ou a depurar um código complicado é importante obter respostas rápidas e de alta qualidade.
Hoje estamos a atualizar a nossa experiência gratuita para o Gemini 1.5 Flash para respostas mais rápidas e úteis. Com o Gemini 1.5 Flash, o utilizador vai notar melhorias generalizadas na qualidade e na latência, com avanços especialmente notórios no raciocínio e na compreensão de imagem. E tal como expandimos bastante a janela de contexto do Gemini Advanced, estamos a quadruplicar o Gemini para 32 mil tokens. Isto significa que pode ter conversas mais longas e fazer perguntas mais complexas ao Gemini - tudo, de forma gratuita.
Para tirar o máximo partido da janela de contexto expandida, vamos, em breve, acrescentar a capacidade de carregar ficheiros através do Google Drive ou diretamente a partir do seu dispositivo, o que já estava disponível no Gemini Advanced. Isto significa que poderá fazer coisas como carregar o seu manual de economia e pedir ao Gemini para criar questões práticas. Em breve, o Gemini também vai poder analisar ficheiros de dados para si, permitindo-lhe descobrir insights e visualizá-los através de tabelas e gráficos.
O Gemini 1.5 Flash está agora disponível para todos os utilizadores do Gemini na versão web e para dispositivos móveis, em 40 idiomas e em mais de 230 países e territórios.
Conteúdo relacionado nas respostas do Gemini
Também ouvimos dizer que as pessoas gostam de explorar novos temas tendo o Gemini como o seu parceiro de investigação. Por isso, estamos agora a exibir links para conteúdo relacionado para prompts de verificação de factos no Gemini – continuando o nosso trabalho para reduzir as alucinações e facilitar a exploração de websites que ajudam o utilizador a aprender mais.
A partir de hoje, para prompts em inglês em determinados países, o utilizador pode aceder a estas informações adicionais sobre os temas diretamente nas respostas do Gemini. Basta clicar no ícone no final de um parágrafo para ver os websites onde pode saber mais sobre um determinado assunto. Isto não se limita aos websites: se a resposta do Gemini fizer referência a informações encontradas utilizando a extensão do Gmail, o utilizador também vai ver links incorporados para e-mails relevantes.
Gemini presente em mais locais
No início deste ano, introduzimos a capacidade de conversar com o Gemini diretamente na app Mensagens Google nos dispositivos Android selecionados. A partir de hoje, estamos a implementar gradualmente o Gemini nas Mensagens Google no Espaço Económico Europeu (EEE), no Reino Unido e na Suíça, com a capacidade de conversar em idiomas adicionados recentemente, tais como o francês, o polaco e o espanhol. Clique no botão "Iniciar chat" em Mensagens e selecione Gemini para começar a debater ideias, planear viagens e muito mais - tudo sem sair da aplicação Mensagens Google.
Estamos também a lançar a aplicação móvel Gemini em mais países, para que mais pessoas em todo o mundo possam obter ajuda do Gemini onde quer que se encontrem.
Acesso alargado ao Gemini para adolescentes (Gemini for teens)
Na próxima semana, vamos alargar o acesso do Gemini aos adolescentes de forma global em mais de 40 idiomas. Os adolescentes que cumpram o requisito de idade mínima para gerir a sua própria Conta Google vão poder aceder ao Gemini para fazer coisas como compreender melhor as matérias da escola, preparar-se para a universidade ou obter ajuda para projetos criativos.
Queremos criar oportunidades para os adolescentes beneficiarem de tudo o que a IA generativa tem para oferecer e prepará-los para um futuro onde a IA vai desempenhar um papel ainda mais central – ao mesmo tempo que damos prioridade à segurança e satisfazemos as suas necessidades de desenvolvimento. Para os ajudar a navegar no Gemini com confiança e segurança, implementámos políticas e salvaguardas adicionais, introduzimos um processo de integração específico para adolescentes e incluímos um guia de literacia em IA para ajudar os adolescentes a navegar na IA de forma responsável. Estabelecemos também parcerias com especialistas em segurança e desenvolvimento infantil, incluindo a MediaSmarts (CA), a Miúdos Seguros na Net (PT) e a Fad Juventud (ES), que continuam a disponibilizar um conhecimento especializado para satisfazer as necessidades únicas dos adolescentes e famílias.
Como desenvolvemos o Gemini de forma responsável
O desenvolvimento do Gemini sempre foi pautado pelo compromisso com a responsabilidade e a segurança dos utilizadores. À medida que continua a evoluir, partilhamos mais sobre como desenvolvemos o Gemini e como pretendemos que responda. Pode, agora, ler sobre a nossa abordagem ao Gemini, saber mais detalhes sobre as nossas directrizes para compreender melhor como estamos a navegar em tópicos complexos e delicados, incluindo respostas a tópicos relacionados com questões de interesse público e crenças políticas, questões religiosas ou morais. Estas directrizes, baseadas nos nossos Princípios de IA, refletem o nosso compromisso contínuo em desenvolver esta tecnologia de forma responsável e transparente.
Fique atento a mais novidades do Gemini no Made by Google. Entretanto, comece, hoje mesmo, a conversar com o Gemini para experimentar estas atualizações.
Publicado por Amar Subramanya, VP of Engineering, Gemini
Desenvolvemos o Privacy Sandbox com o objetivo de encontrar soluções inovadoras que melhorem significativamente a privacidade online ao mesmo tempo que preservam uma Internet baseada em anúncios que sustenta um ecossistema vibrante de publishers, liga empresas aos clientes clientes e que oferece, a todos nós, acesso gratuito a uma ampla gama de conteúdo.
Ao longo deste processo, recebemos feedback de uma ampla variedade de stakeholders, incluindo, reguladores, tais como a Autoridade de Concorrência e Mercados (CMA) do Reino Unido e o Information Commissioner's Office (ICO), publishers, programadores web e grupos padrão, sociedade civil e participantes da indústria publicitária. Este feedback ajudou-nos a criar soluções que visam apoiar um mercado competitivo e próspero que funcione para publishers e anunciantes e incentive a adoção de tecnologias que melhoram a privacidade.
Os primeiros testes realizados por empresas de tecnologia Adtech, incluindo a Google, indicaram que as APIs da Privacy Sandbox têm um grande potencial para alcançar estes resultados. E esperamos que o desempenho geral ao utilizar as APIs de Privacy Sandbox melhore com o tempo, à medida que aumenta a adoção por parte da indústria. Ao mesmo tempo, reconhecemos que esta transição exige um trabalho significativo por parte de muitos participantes e terá um impacto nos publishers, nos anunciantes e em todos os envolvidos na publicidade online.
Tendo em conta esta situação, propomos uma abordagem atualizada que permite aos utilizadores escolherem. Em vez de descontinuar os cookies de terceiros, vamos introduzir uma nova experiência no Chrome que vai permitir às pessoas fazer uma escolha informada que se aplique à sua navegação na web, sendo que poderão ajustar estas mesmas escolhas a qualquer momento. Estamos a discutir este novo caminho com os reguladores e vamos envolver a indústria à medida que for sendo disponibilizado.
À medida que isso avança, continua a ser importante que programadores tenham alternativas que preservam a privacidade. Continuaremos a disponibilizar as APIs do Privacy Sandbox e a investir nelas para melhorar ainda mais a privacidade e a utilidade. Também pretendemos oferecer controlos de privacidade adicionais, por isso planeamos introduzir a Proteção de IP no modo de navegação anónima do Chrome.
Estamos gratos a todas as organizações e indivíduos que trabalharam connosco nos últimos quatro anos para desenvolver, testar e adotar o Privacy Sandbox. E à medida que finalizarmos esta abordagem, continuaremos a consultar a CMA, a ICO e outros reguladores a nível mundial. Esperamos continuar a colaboração com o ecossistema na próxima fase da jornada para uma web mais privada.
Publicado por Anthony Chavez, VP Privacy Sandbox
Passou um ano desde o nosso último Lisbon Cloud Day e o panorama da IA Generativa evoluiu de forma notável. O que antes era potencial é agora uma força motriz da economia portuguesa, transformando empresas e organizações públicas.
Hoje, no Lisbon Cloud Day '24, estamos muito empolgados por anunciar avanços significativos nas nossas ofertas de IA generativa para empresas portuguesas e entidades do setor público. Estas iniciativas incluem programas alargados de formação em IA, a disponibilização de funcionalidades de IA em Português e uma parceria estratégica com a associação de startups AI HUB.
Capacitar as Organizações Portuguesas com IA Generativa
Acreditamos que a IA generativa pode ajudar a transformar organizações de todas as dimensões e de todos os setores e queremos tornar mais simples às empresas portuguesas a inovação com esta tecnologia, ao mesmo tempo que satisfazem as suas necessidades. Eis como estamos a fazê-lo:
Acelerar a adoção de IA generativa entre as empresas portuguesas
Estas iniciativas baseiam-se na nossa dinâmica significativa de IA generativa em Portugal, onde empresas líderes escolheram a infraestrutura da Google Cloud e as nossas soluções de IA para impulsionar a inovação e a eficiência. Por exemplo, o evento, o Diretor Executivo do Banco BPI, Ricardo Chaves, irá partilhar como a tecnologia de IA da Google tem sido fundamental na sua transformação:
“No Google Cloud Day iremos falar sobre a transformação do BPI e como a inteligência artificial nos permite ser melhores, personalizando a nossa relação com os nossos clientes, com os produtos certos, no canal preferido, na hora certa, gerindo melhor os riscos, utilizando o reforço das capacidades de Machine Learning, automatizando a gestão documental e tornando eficiente e imediato o que antes era lento e burocrático. Utilizando a nova geração de modelos generativos para hiperpersonalizar o apoio ao cliente e evoluir a forma de funcionamento do banco, reduzindo o trabalho administrativo e democratizando o conhecimento entre todos. Vamos falar sobre como começar com uma grande ambição, traçar uma visão realista, pensar em equipa com o negócio e a gestão da mudança, unir forças com a tecnologia para criar uma infraestrutura escalável, construir, orientar e motivar uma equipa com o tamanho e talento necessários para uma missão.”, Ricardo Chaves, Diretor Executivo do Banco BPI.
Impulsionando a próxima onda de inovação
No Google Cloud Next '24 e no Google I/O, revelámos um conjunto de tecnologias inovadoras que capacitam as empresas portuguesas para desbloquear todo o potencial da IA generativa:
Estas inovações disponibilizam uma plataforma abrangente para as organizações portuguesas construírem e implementarem aplicações de IA Generativas de ponta.
O Futuro da IA Generativa em Portugal
Estamos extremamente entusiasmados com o futuro da IA generativa em Portugal e esperamos estabelecer parcerias com empresas e organizações para impulsionar a inovação, o crescimento e o impacto positivo.
Vamos moldar o futuro juntos!
Publicado por Sofia Marta, Country Lead da Google Cloud em Portugal
O Google Tradutor quebra as barreiras linguísticas para ajudar as pessoas a conectarem-se e a compreenderem melhor o mundo à sua volta. Estamos sempre a aplicar as tecnologias mais recentes para que mais pessoas possam aceder a esta ferramenta: em 2022, adicionámos 24 novos idiomas usando a Tradução Automática Zero-Shot, onde um modelo de aprendizagem de máquina aprende a traduzir para outro idioma sem nunca ver um exemplo. E anunciámos a Iniciativa 1.000 Línguas, um compromisso para construir modelos de IA que vão oferecer suporte aos 1.000 idiomas mais falados no mundo.
Agora, estamos a usar a IA para expandir a variedade de idiomas suportados. Graças ao nosso grande modelo de linguagem PaLM 2, estamos a começar a implementar 110 novos idiomas no Google Tradutor, a nossa maior expansão de todos os tempos, incluindo o Português de Portugal.
Apoio à tradução para mais de 500.000.000 pessoas
Do cantonês ao Q'eqchi', estas novas línguas representam mais de 614 milhões de falantes, permitindo traduções para cerca de 8% da população mundial. Algumas são línguas importantes do mundo, com mais de 100 milhões de falantes. Outros são falados por pequenas comunidades de povos indígenas e alguns quase não têm falantes nativos mas esforços ativos de revitalização. Cerca de um quarto das novas línguas são de África e representam a nossa maior expansão de línguas africanas até à data, incluindo Fon, Kikongo, Luo, Ga, Swati, Venda e Wolof.
Eis alguns dos idiomas agora suportados no Google Tradutor:
Como escolhemos a variedade de idiomas
Há muito a considerar quando adicionamos novos idiomas ao Tradutor: tudo, desde as variedades que oferecemos até as grafias específicas que usamos.
As línguas têm uma imensa variação: variedades regionais, dialetos, diferentes padrões ortográficos. Na verdade, muitos idiomas não possuem um formato padrão, por isso é impossível escolher a variedade “certa”. A nossa abordagem tem sido priorizar as variedades mais usadas comumente em cada idioma. Por exemplo, o Romani é uma língua que possui muitos dialetos na Europa. Os nossos modelos produzem texto mais próximo do Southern Vlax Romani, uma variedade usada comumente online. Mas também mistura elementos de outros, como Northern Vlax e Balkan Romani.
O PaLM 2 foi uma peça-chave neste puzzle, ajudando o Tradutor a aprender com mais eficiência idiomas intimamente relacionados entre si, incluindo idiomas próximos do hindi, como Awadhi e Marwadi, e os crioulos franceses, como o crioulo das Seicheles e o crioulo das Maurícias. À medida que a tecnologia avança e continuamos a fazer parcerias com linguistas especializados e falantes nativos, apoiaremos, ao longo do tempo, ainda mais variedades linguísticas e convenções ortográficas.
Visite o nosso Centro de Ajuda para saber mais sobre os novos idiomas suportados. E comece a traduzir em tradutor.google.com ou na aplicação Google Tradutor para Android e iOS.
Publicado por Isaac Caswell, Software Engineer, Google Translate
Chegou o nosso Feature Drop mais recente que vem com novas funcionalidades incríveis para o seu dispositivo, incluindo o Gemini Nano que chega ao Pixel 8 e Pixel 8a como uma opção para programadores, a detecção de acidentes para Pixel Watch 2, e muito mais. Estas funcionalidades começam a ser disponibilizadas nos dispositivos a partir de hoje num processo que irá prolongar-se ao longo das próximas semanas.
Para os telefones Pixel
Gemini Nano expande-se para Pixel 8 e Pixel 8aGemini Nano é o modelo de IA mais eficiente da Google desenvolvido para tarefas no dispositivo[1] e, a partir de hoje, poderá usar o Pixel 8 e o Pixel 8a para aceder ao Gemini Nano como opção para programadores. Poderá ativar as opções de programador nas configurações do Pixel.
Leve o seu entretenimento para o grande ecrãPixel 8a, Pixel 8 e Pixel 8 Pro podem agora exibir conteúdos num ecrã maior[5], como o monitor do computador, quando os conecta via USB-C proporcionando mais espaço para usufruir dos filmes, programas e apresentações[6].
Localize o telefone, mesmo quando a bateria acabouA funcionalidade Localizar o meu Dispositivo está a receber uma atualização útil que permite localizar o telefone mesmo quando está desligado ou sem bateria[7], ao mesmo tempo que mantém os seus dados de localização privados e encriptados para a Google.
Mostre o melhor rostoA câmara Pixel pode agora identificar automaticamente o melhor momento para a sua foto em HDR+ com apenas um toque no obturador tornando mais fácil tirar uma foto em que o seu rosto está focado e a sorrir[8].
Procure rapidamente um número de telefone misteriosoNão reconhece um número de telefone? Com apenas alguns toques, passa a poder fazer uma pesquisa reversa do número de telefone diretamente a partir do registo de chamadas[9].
Melhorias adicionais no telefoneA câmara do Pixel permite agora que escolha manualmente qual a lente que deseja usar quando tira fotos, proporcionando maior controlo sobre a captura da foto perfeita[10].
Para os relógios Pixel
Tranquilidade extra quando está em movimentoA Detecção de Acidentes de Carro[11] está a ser lançada como nova funcionalidade de segurança no Pixel Watch 2 e oferece mais maneiras para se manter seguro e obter ajuda quando mais precisar, mesmo quando não estiver com o seu smartphone Pixel. Se sofrer um acidente grave de carro, o relógio poderá agora verificar se está bem. Se precisar de ajuda ou não responder, ligará automaticamente para os serviços de emergência.
A Detecção de Acidentes de Carro integra a Partilha de Emergência no seu relógio[12] de modo a que os contatos de emergência sejam notificados e obtenham a localização em tempo real no caso de um acidente. Também melhorámos a Detecção de Quedas para detectar melhor quedas de bicicletas[13].
Torne a vida mais fácil com experiências de aplicação melhoradas
A aplicação Google Home está a ser reformulada e, a partir de agora, pode aceder aos seus dispositivos de casa inteligente de uma maneira mais rápida e fácil diretamente a partir do relógio[15][16]:
Para Pixel Tablet
Veja quem está do outro ladoAlguém está a tocar à campainha? O seu Pixel Tablet passa a ter notificações de campainha[17] mais ricas quando colocado no modo hub proporcionando uma imagem instantânea de quem está à sua porta. Poderá conversar com eles através de uma conversa bidirecional ou enviar uma resposta rápida.
Favoritos de casa inteligenteO novo widget Favoritos Google Home[18] proporciona acesso ainda mais rápido aos seus dispositivos domésticos inteligentes compatíveis. Poderá aqui obter controlos de casa inteligente rápidos e personalizáveis no ecrã inicial do seu telefone e tablet para que possa aceder ao seu termostato ou acender as luzes com apenas um toque rápido.
Todas estas funcionalidades unem-se para tornar os seus dispositivos Pixel ainda melhores. Quer esteja em casa ou a viajar, os seus dispositivos Pixel são essenciais para este verão.
Publicado por Mikaela Kraft, Product Marketing Manager
Notas:
[1] Disponível apenas no Pixel 8 Pro e nas opções de programador no Pixel 8 and Pixel 8a.
[2] Comparado com a versão anterior da aplicação Gravador.
[3] Disponível apenas no Pixel 8 Pro e nas opções de programador no Pixel 8 and Pixel 8a em inglês.
[4] Etiquetas de oradores disponíveis apenas no Pixel 6 e telefones mais recentes e em Inglês (US).
[5] Requer conexão com um cabo USB-C e ecrãs compatíveis (ambos vendidos separadamente). Disponível apenas no Pixel 8, Pixel 8 Pro, e Pixel 8a. USB-C® é uma marca registada do USB Implementers Forum.
[6] Subscrições podem ser exigidas para certos conteúdos
[7] A aplicação pode localizar o dispositivo sem energia por pelo menos 23 horas. A rede Encontrar o Meu Dispositivo requer que os serviços de localização e Bluetooth estejam ativos. Requer serviço de telefone ou conexão de internet. Disponível no Pixel 8, Pixel 8 Pro ou Pixel 8a e em alguns países para utilizadores com idades elegíveis.
[8] Disponível no Pixel Tablet, Pixel Fold, Pixel 6 e telefones posteriores.
[9] Disponível no Pixel Fold, Pixel 6 e posteriores.
[10] Disponível no Pixel Fold, Pixel 6 Pro, Pixel 7 Pro e Pixel 8 Pro.
[11] A Detecção de Acidentes de Carro não está disponível em todos os idiomas ou países. Para saber a disponibilidade nos países e idiomas e obter mais informações, consulte support.google.com/googlepixelwatch?p=ccd. A Detecção de Acidentes de Carro pode não detectar todos os acidentes. Atividades de alto impacto podem também desencadear a Detecção de Acidentes de Carro. Esta funcionalidade depende da conectividade da rede e de outros fatores e pode não ser confiável para comunicações de emergência ou estar disponível em todas as áreas.
[12] Taxas de dados podem ser aplicadas. A Partilha de Emergência requer localização ativada e serviço 4G LTE ou uma conexão com Internet. A Partilha de Emergência depende da conectividade da rede e de outros fatores e pode não ser confiável para comunicações de emergência ou estar disponível em todos os países ou idiomas. Consulte g.co/pixelwatch/personalsafety para obter mais detalhes.
[13] Disponível no Pixel Watch e Pixel Watch 2. A Detecção de Quedas não está disponível em todos os países e depende da conectividade de rede e de outros fatores. O seu relógio pode não ser confiável para comunicações de emergência. A Detecção de Quedas pode não detectar todas as quedas. Para ligar para os serviços de emergência num Google Pixel Watch sem 4G LTE, o seu telefone emparelhado deverá estar próximo. Os utilizadores deverão conceder permissão de localização para que a Detecção de Quedas partilhe a localização externamente. Taxas de dados podem ser aplicadas. Consulte g.co/pixelwatch/personalsafety para obter mais detalhes.
[14] Requer uma conta PayPal. Disponível apenas nos Estados Unidos e Alemanha.
[15] Requer um smartwatch com Wear OS 3 ou posterior, uma Conta Google, a versão mais recente da aplicação Google Home no relógio e no telefone, além de Internet e Wi-Fi a funcionar.
[16] Requer dispositivos inteligentes compatíveis
[17] Requer Nest Doorbell (com fios, 1ª e 2ª geração) ou Nest Doorbell (bateria). O Pixel Tablet deverá estar travado e encaixado na base de carregamento com altifalante para ter uma visualização em direto no ecrã inteiro.
[18] Disponível globalmente em telefones e tablets com Android 12+. Algumas funcionalidades, incluindo notificações de telemóvel e navegador de internet, controlo remoto, streaming e gravação de vídeo, exigem Internet e Wi-Fi a funcionar.
Novas funcionalidades
No verão passado, apresentámos o NotebookLM, um assistente de análise e escrita. Hoje estamos entusiasmados em partilhar que estamos a trazer uma versão atualizada do NotebookLM — agora a usar o Gemini 1.5 Pro — para mais de 200 países e territórios em todo o mundo.
Desde o início, o nosso objetivo com o NotebookLM foi criar uma ferramenta para o ajudar a compreender e a explorar materiais complexos, fazer novas conexões a partir da informação e chegar a um primeiro rascunho com maior rapidez. Poderá carregar vários tipos de fontes – notas de investigação, transcrições de entrevistas, documentos corporativos – e o NotebookLM torna-se instantaneamente num especialista no material que é mais importante para si. A atualização de hoje apresenta várias novas funcionalidades:
Graças aos recursos multimodais nativos do Gemini 1.5 Pro, poderá agora fazer perguntas sobre imagens, gráficos e diagramas nas suas fontes. O NotebookLM irá até incluir citações em imagens como evidência de apoio, sempre que tal for relevante.
Estudos de caso de utilizadores reais
Ficámos impressionados com a variedade de usos que as pessoas estão a encontrar para o NotebookLM. Como o produto foi desenvolvido em estreita parceria com autores, estudantes e educadores, temos visto muitos dos primeiros utilizadores a integrarem o produto em fluxos de trabalho de investigação e escrita. O autor de best-sellers Walter Isaacson tem trabalhado com NotebookLM para analisar os diários de Marie Curie no âmbito da investigação para o seu próximo livro. Vimos um entusiasmo semelhante da parte de produtores de documentários e podcasts que precisam de pesquisar arquivos complexos para a geração de roteiros ou ideias para histórias. Mas a combinação das capacidades de raciocínio avançadas do Gemini 1.5 Pro e da arquitetura das fontes do NotebookLM permite toda uma série de outras aplicações potenciais:
Também encontrámos alguns casos divertidos e menos óbvios com a ajuda dos nossos 14.000 membros da nossa comunidade Discord, incluindo romancistas e autores de fan-fiction para gerir histórias complexas usando o NotebookLM e o nosso favorito: os entusiastas de jogos RPG usam o NotebookLM para gerir as descrições detalhadas dos mundos da fantasia em jogos como o Dungeons and Dragons.
Como iniciar
Se é novo no NotebookLM, começar é fácil: ao aceder ao NotebookLM pela primeira vez, irá criar um notebook e carregar os documentos para um projeto ou ação específica. Nesse momento, poderá ler, tirar notas, fazer perguntas, organizar as suas ideias ou pedir ao NotebookLM para criar resumos automáticos de todas as suas fontes - um guia de estudo, por exemplo, ou um índice analítico. E com o NotebookLM, as fontes que você carrega não são usadas para treinar o modelo.
Quer esteja a ser usado para construir mundos imaginários, escrever biografias best-sellers ou a ajudar vendedores a encontrar novos clientes, o NotebookLM tem vindo a proporcionar aos utilizadores nos EUA ferramentas poderosas para fazer conexões e gerar insights a partir de grandes coleções de documentos. Mal podemos esperar para ver o que o resto do mundo fará com isto.
Publicado por Steven Johnson, Editorial Director, Google Labs & Raiza Martin, Product Manager, Google Labs
A aplicação móvel Gemini está a chegar a mais países na Europa e ao Reino Unido, permitindo aos utilizadores aumentar a sua criatividade e produtividade com a nossa aplicação móvel alimentada por IA.
Aplicação Gemini em mais idiomas e países
Hoje, estamos a lançar a aplicação móvel Gemini em mais países e territórios para que possa obter ajuda do Gemini em qualquer lugar. Com a aplicação Gemini no seu telefone, poderá escrever, falar ou adicionar uma imagem para todos os tipos de ajuda: pode tirar uma foto de um pneu furado e pedir instruções sobre como trocá-lo ou obter ajuda para escrever uma nota de agradecimento. É um primeiro passo importante na construção de um verdadeiro assistente de IA – que seja conversacional, multimodal e útil.
Para aceder ao Gemini no Android, descarregue a aplicação Gemini ou faça login através do Google Assistente e poderá usar o Gemini deslizando o dedo para o canto, pressionando o botão ligar/desligar em alguns telefones ou através das palavras “Ok Google”. Isto irá permitir uma nova experiência de sobreposição que oferece acesso fácil ao Gemini, bem como ajuda contextual diretamente no ecrã. Muitas das funcionalidades de voz de que gosta no Google Assistente estarão disponíveis na aplicação Gemini – incluindo configuração de temporizadores, realização de chamadas e configuração de lembretes – e estamos a trabalhar para oferecer mais suporte no futuro.
No iOS, iremos disponibilizar o acesso ao Gemini diretamente a partir da aplicação Google nas próximas semanas. Basta tocar no botão Gemini e conversar com o Gemini para potenciar a sua criatividade, obter ajuda para escrever posts nas suas redes sociais e até mesmo planear uma saída à noite.
Continuamos empenhados em disponibilizar o Gemini ao maior número de pessoas possível. Ao expandir o suporte linguístico e chegar a novos países, garantimos que mais pessoas possam potenciar as suas ideias com o Gemini. Experimente as funcionalidades mais recentes em: https://gemini.google.com/
Publicado por Jules Walter, Group Product Manager, Gemini Experiences
Uma evolução da atenção está em curso. As pessoas têm maneiras, aparentemente infinitas, de fazer compras, comunicar e divertir-se online. Para que a publicidade se destaque, ela precisa ser relevante e útil – na verdade, isso é mais importante do que nunca. As empresas precisam de estar em todas as superfícies com recursos criativos que captem a atenção das pessoas.
Até agora, parecia impossível fazer isto em escala, mas isto está a mudar com a IA generativa. Esta tecnologia está a ajudar-nos a responder melhor às necessidades dos anunciantes e a desbloquear novas possibilidades em todo o processo de marketing, desde novas experiências de anúncios imersivos até recursos criativos de alto desempenho. À medida que construímos juntos esta nova era de marketing, partilhamos os controlos mais recentes de geração de recursos criativos, experiências de anúncios imersivos, recursos de narrativa visual e muito mais no Google Marketing Live (GML).
Dimensionar a produção criativa de acordo com os padrões da marca
Temos trabalhado para tornar mais fácil e rápida a produção de recursos criativos excelentes para anúncios em canais de marketing. A variedade de recursos criativos é crucial para anúncios fortes, e conseguir isso tornou-se mais fácil para mais anunciantes através da IA generativa no Performance Max. Descobrimos que os anunciantes que melhoram a qualidade do anúncio Performance Max para Excelente obtêm, em média, 6% mais conversões[1] .O Event Tickets Center foi um dos primeiros testadores beta para geração de recursos no Performance Max, tendo ajudado a equipa a acelerar cinco vezes a produção criativa, com menos tempo e esforço.
Ainda assim, o desempenho não é a única consideração para os recursos criativos. Os recursos precisam também estar alinhados com os padrões da marca. Em breve, os anunciantes poderão partilhar as suas diretrizes de fontes e cores no Performance Max, bem como fornecer pontos de referência de imagens úteis para a geração de novas variações de recursos.
Também estamos a introduzir novos recursos de edição de imagens para que os anunciantes possam tentar adicionar novos objetos, estender planos de fundo e recortar imagens para adaptá-las a qualquer formato, tamanho e orientação. Além disso, os retalhistas poderão destacar os seus produtos nos feeds do Google Merchant Center e aproveitar estes recursos de edição. À medida que os anunciantes exploram ideias criativas, a IA do Google irá gerar mais recomendações, mostrando produtos em diferentes contextos e cenários, para que os anunciantes possam simplesmente selecionar os ativos de que gostam e usá-los nos seus canais de marketing.
Dar vida aos recursos criativos com novas experiências de anúncios envolventes
Mesmo com recursos ótimos de imagem e texto em anúncios, pode ser difícil aos consumidores sentirem-se confiantes para tomar decisões de compra on-line sem verem um produto pessoalmente ou experimentá-lo. No entanto, a nossa investigação mostra que este tipo de confiança é fundamental para as marcas. A IA generativa pode ajudar as empresas a transmitir melhor as ofertas e inspirar confiança entre os consumidores a partir do anúncio. Em breve, os anunciantes poderão melhorar os seus anúncios do Shopping com recursos visuais imersivos, incluindo teste virtual e geração de anúncios rotativos 3D. Também estamos a introduzir um recurso que permite aos compradores mergulhar mais fundo num anúncio para ver vídeos de produtos, resumos e produtos semelhantes disponibilizados pelo anunciante.
Neste momento, estamos também a testar uma nova experiência de anúncios na Pesquisa para ajudar a orientar as pessoas em decisões de compra complexas. Imaginemos que amigos estão em renovações e a procurar espaços de “armazenamento de curto prazo”. Clicar num anúncio de um espaço de armazenamento pode conduzir a uma experiência dinâmica em que a IA os ajuda a descobrir o que precisam. Com alguns detalhes, como fotos dos móveis e o seu orçamento, a IA da Google poderá recomendar o tamanho do espaço de armazenamento e os materiais de embalagem com um link para compra no website.
Impulsionar a procura e as conversões através de narrativa visual
Além de anúncios visualmente envolventes, há oportunidades de se conectar com os consumidores nos nossos canais mais envolventes visualmente: YouTube, Discover e Gmail. Lançámos o Demand Gen no ano passado para ajudar os anunciantes a alcançar mais de 3 mil milhões de utilizadores nestas plataformas. Estas campanhas ajudam os anunciantes a impulsionar a procura e as conversões, e, em breve, iremos disponibilizá-las a ainda mais anunciantes no Display & Video 360 e no Search Ads 360.
O YouTube Shorts tem mais de 2 mil milhões de utilizadores logados todos os meses[2], que descobrem novos favoritos através de vídeos curtos. Estamos a introduzir novos formatos e recursos para ajudar as empresas a interagir com estes espectadores. Isto inclui novos formatos de anúncios verticais, ad stickers para impulsionar a ação e novos anúncios gráficos animados que são criados automaticamente a partir de imagens das contas dos anunciantes e nos feeds de produtos Demand Gen.
Criar novas oportunidades para ajudar os consumidores na sua jornada de informação
Os anúncios sempre foram uma parte importante da jornada de informação dos consumidores. No Google I/O, anunciamos que os Resumos de IA na Pesquisa serão lançados para todos nos EUA, com mais países a chegar, em breve. Os Resumos de IA irão aparecer nos resultados da pesquisa quando forem particularmente úteis além do que a Pesquisa disponibiliza hoje. Com os Resumos de IA, as pessoas visitam uma diversidade maior de websites em busca de ajuda com questões mais complexas; também vemos que os links incluídos nos Resumos de IA obtêm mais cliques do que se a página tivesse aparecido numa listagem da web tradicional para aquela consulta. Na verdade, descobrimos que as pessoas que usam os Resumos de IA usam mais a Pesquisa e ficam mais satisfeitas com os resultados. E quando as pessoas clicam em links dos Resumos de IA, estes cliques são de qualidade superior, onde os utilizadores têm maior probabilidade de passar mais tempo no website. À medida que continuamos a testar e a evoluir a experiência da Pesquisa, continuaremos focados em enviar tráfego valioso para publishers e criadores.
Nos primeiros testes, verificámos que as pessoas consideram úteis os anúncios exibidos acima e abaixo do resumo gerado por IA. Em breve, iremos começar a testar anúncios de Pesquisa e Shopping nos Resumos de IA para utilizadores nos EUA. Eles terão a oportunidade de aparecer no Resumo de IA numa seção claramente identificada como "patrocinada" quando estes forem relevantes simultaneamente para a consulta e para a informação dos Resumos de IA. Não é necessária nenhuma ação por parte dos anunciantes: os anúncios de campanhas existentes na Pesquisa, Performance Max e padrão do Shopping têm a oportunidade de aparecer nos Resumos de IA. À medida que avançamos, continuaremos a testar e a aprender sobre novos formatos, obtendo feedback dos anunciantes e da indústria.
Melhorar os resultados com uma base sólida de medição
Embora todas estas atualizações sejam úteis para as empresas, a IA é tão boa quanto as informações fornecidas. Para aproveitar ao máximo a IA, as empresas precisam de uma estratégia de medição forte baseada em dados próprios (first-party data). Muitas empresas possuem dados de diferentes fontes, desde dados de conversão até listas de e-mail e estudos. Até agora, obter uma visão completa tem sido muito complexo, especialmente para as pequenas empresas. Agora, estamos a tornar isto muito mais simples para os anunciantes com Gestor de Dados que agora está disponível para todos. Isto permite que os anunciantes reúnam facilmente fontes de dados próprios num só local para usar, analisar e ativar – o que antes poderia levar semanas ou meses, agora demora minutos.
Colocar a IA da Google para trabalhar para as empresas
Guiadas pelos nossos princípios de IA e pelo feedback dos clientes, estas inovações mais recentes em IA irão ajudar os profissionais de marketing a pensar maior, a criar de forma mais ousada e a gerar resultados mais rapidamente. A IA da Google existe para ajudar, não para substituir: a criatividade humana, a visão estratégica e a experiência sempre serão uma vantagem para o profissional de marketing. Também reconhecemos que, por mais entusiasmantes que sejam estes avanços, a mudança para a IA é muito difícil de gerir para muitas empresas. Estamos a pensar na evolução dos nossos produtos. Com isso em mente, aguardamos seu feedback ao longo do caminho.
Na GML, também iremos apresentar novas formas de como os retalhistas podem usar IA generativa para se conectarem mais profundamente com os clientes e comercializarem as suas marcas e produtos de forma mais eficiente. Mais informações sobre as nossas inovações para retalhistas e anúncios disponíveis no nosso Centro de Ajuda.
Assista ao Keynote e ao pós-evento digital para mais novidades e junte-se à conversa em #GML2024.
Publicado por Vidhya Srinivasan, Vice President / General Manager, Ads
[1] Fonte: Dados internos Google, Global, Grupos de Recursos Performance Max antes e após alterações na qualidade do anúncio,, Q1-Q3 2023.
[2] Fonte: Dados internos Google/YouTube, Global, Maio 2023.
Nota do editor: abaixo encontra-se uma transcrição editada dos comentários de Sundar Pichai no I/O 2024, adaptada para incluir mais detalhes das informações anunciadas em palco. Veja todos os anúncios da nossa coleção.
A Google está totalmente comprometida com a era Gemini.
Antes de falarmos disso, quero refletir sobre o momento presente. Temos estado a investir em IA há mais de uma década e a inovar em todas as áreas: pesquisa, produto, infraestrutura. Hoje vamos falar sobre tudo isto.
Ainda assim, ainda estamos a dar os primeiros passos no terreno da plataforma de IA. Há muitas oportunidades no futuro, tanto para criadores como para programadores e startups. Há oportunidades para todos. Contribuir para impulsionar essas oportunidades é o objetivo da era Gemini. Vamos começar.
A era Gemini
Há um ano, no palco do I/O, partilhámos pela primeira vez os nossos planos para o Gemini: um modelo inovador construído para ser nativamente multimodal desde o início, que poderia raciocinar através de texto, imagens, vídeo, código e muito mais. Trata-se de um grande passo no processo de transformação de qualquer informação de entrada (input) num resultado (output): um “I/O” para uma nova geração.
Desde então, introduzimos os primeiros modelos Gemini, os mais capazes até agora. Estes modelos demonstraram desempenho de última geração em todas as referências multimodais. Dois meses depois, apresentámos o Gemini 1.5 Pro, que representa um grande avanço em contextos amplos, já que pode executar 1 milhão de tokens em produção, de forma consistente; mais do que qualquer outro modelo básico de grande escala até agora.
Queremos que todos beneficiem do Gemini. Por isso, temos trabalhado sem parar para poder partilhar estes avanços com todos vocês. Hoje, mais de 1,5 milhão de programadores usam modelos Gemini nas nossas ferramentas. Vocês estão a usá-lo para depurar código, obter novas informações e construir a próxima geração de aplicações de IA.
Também temos introduzido os recursos inovadores do Gemini nos nossos produtos de forma inovadora. Mais tarde, vamos ver exemplos na Pesquisa, Fotos, Workspace, Android e muito mais.
Progresso do produto
Hoje em dia, o Gemini está totalmente presente nos nossos produtos com 2 mil milhões de utilizadores.
E também introduzimos novas experiências, inclusive para dispositivos móveis, para que as pessoas possam interagir com o Gemini diretamente através da aplicação, agora disponível para Android e iOS. E através do Gemini Advanced, que fornece acesso aos nossos modelos mais capazes. Em apenas três meses, já houve mais de um milhão de inscrições para experimentar o Gemini, que continua a mostrar um forte impulso.
Expansão dos Resumos de IA na Pesquisa
Uma das transformações mais incríveis do Gemini ocorreu na Pesquisa Google.
No âmbito da nossa experiência de Pesquisa Generativa, no ano passado, respondemos a milhares de milhões de perguntas. As pessoas estão a usar o Gemini para pesquisar de maneira totalmente inédita e fazer novos tipos de perguntas e consultas mais longas e complexas, e até para pesquisar com fotos, recolhendo, assim, o melhor que a Web tem para oferecer.
Esta experiência está a ser testada fora do Labs. E estamos muito animados por ver não apenas um crescimento no uso da Pesquisa, mas também um aumento da satisfação do utilizador.
Tenho o prazer de anunciar que vamos começar a lançar esta experiência totalmente renovada, os Resumos de IA, para todos os utilizadores nos EUA esta semana, que brevemente vai chegar a mais países.
Há muita inovação a ocorrer na Pesquisa. Graças ao Gemini, podemos criar experiências de pesquisa muito mais poderosas, inclusive dentro dos nossos produtos.
Introdução ao “Perguntar ao Fotos”
Um bom exemplo a ter em conta é o Google Fotos, que lançámos há quase nove anos. Desde então, as pessoas usam-no para organizar as memórias mais importantes. Hoje, isso equivale a mais de 6 mil milhões de fotos e vídeos carregados todos os dias.
Os utilizadores adoram usar o Fotos para pesquisar aspetos das suas vidas. Com Gemini estamos a tornar esse processo ainda mais fácil.
Imaginemos que está num parque de estacionamento e no momento de pagar não se lembra da matrícula. Anteriormente, podia pesquisar palavras-chave no Fotos e percorrer anos de imagens à procura de matrículas de carros. Agora, pode simplesmente pedir ajuda ao Fotos, que conhece os carros que aparecem com frequência e consegue distinguir o seu e reconhecer a sua matrícula.
O “Perguntar ao Fotos” pode ajudá-lo a pesquisar as suas memórias de uma forma mais profunda. Por exemplo, vamos imaginar que está a recordar as conquistas da sua filha. Agora já pode perguntar ao Fotos: “Quando a Lúcia aprendeu a nadar?”
E pode continuar com um pedido ainda mais complexo: “Mostra-me como a natação de Lúcia progrediu”.
Aqui, Gemini vai além de uma simples pesquisa, reconhecendo diferentes contextos, desde fazer várias piscinas, até mergulhar no oceano, passando pelo texto e datas dos certificados de natação dela. E o Fotos reúne todos esses elementos num resumo, permitindo-lhe a si absorver tudo e reviver memórias incríveis novamente. O “Perguntar ao Fotos” vai ser lançado neste verão, juntamente com mais recursos.
Desbloquear conhecimento em vários formatos é o motivo pelo qual construímos o Gemini para ser multimodal desde o início. Trata-se de um único modelo, mas com todas as modalidades integradas. Isto significa que o Gemini não só é capaz de interpretar cada tipo de entrada como também pode encontrar relações entre elas.
A multimodalidade expande radicalmente as perguntas que podemos fazer e as respostas que recebemos.
O contexto amplo vai ainda mais além, permitindo-nos lidar com ainda mais informações: centenas de páginas de texto, horas de áudio ou uma hora de vídeo, repositórios completos de código ou, se quiser, cerca de 96 menus do Cheesecake Factory.
Para tantos menus, seria necessária uma janela de contexto de um milhão de tokens, o que agora é possível com o Gemini 1.5 Pro. Os programadores têm usado este contexto amplo de maneira super interessante.
Nos últimos meses, temos vindo a lançar uma pré-visualização do Gemini 1.5 Pro com contexto longo. Fizemos uma série de melhorias de qualidade na tradução, codificação e raciocínio. Vocês vão poder ver essas atualizações refletidas no modelo a partir de hoje.
Tenho agora o prazer de anunciar que estamos a lançar esta versão aprimorada do Gemini 1.5 Pro para todos os programadores em todo o mundo. Além disso, hoje o Gemini 1.5 Pro com contexto longo de 1 milhão de tokens está disponível diretamente para os consumidores no Gemini Advanced e pode ser usado em 35 idiomas.
Expansão para 2 milhões de tokens na pré-visualização privada
Um milhão de tokens abre possibilidades inteiramente novas. É incrível, mas acho que podemos nos esforçar ainda mais.
Por isso, atualmente já estamos a expandir a janela de contexto para 2 milhões de tokens e disponibiliza-la a programadores em pré-visualização privada.
É incrível olhar para trás e ver quanto progresso fizemos em alguns meses. E isto é só o próximo passo no nosso trajeto em direção ao objetivo final, que é o do contexto infinito.
Integração do Gemini 1.5 Pro no Workspace
Até agora falamos de dois avanços técnicos: multimodalidade e contexto longo. Cada um é poderoso por si só, mas juntos desbloqueiam capacidades mais avançadas e mais inteligência.
Isto ganha vida com o Google Workspace.
As pessoas estão sempre à procura dos seus emails no Gmail. Estamos a trabalhar para torná-lo muito mais poderoso com o Gemini. Por exemplo, imaginemos que, na qualidade de pai, quer manter-se informado sobre tudo o que acontece na escola do seu filho. O Gemini pode ajudá-lo a fazer esse acompanhamento.
Já podemos pedir ao Gemini para resumir todos os emails recentes da escola. Em segundo plano, o Gemini identifica emails relevantes e até analisa anexos, como PDFs. Assim, pode obter um resumo dos pontos principais e itens de ação relacionados com a escola do seu filho. Imagine que está a viajar essa semana e não pode comparecer à reunião da Associação de Pais. A gravação da reunião dura uma hora. Se for organizada no Google Meet, é possível pedir ao Gemini para lhe dar os destaques. Há um grupo de pais à procura de voluntários e você está livre naquele dia. E claro, o Gemini pode redigir uma resposta.
Existem inúmeros outros exemplos de como isto pode facilitar a vida. O Gemini 1.5 Pro está disponível hoje no Workspace Labs. Aparna partilha mais.
Resultados de áudio em NotebookLM
Acabamos de ver um exemplo com resultados de texto. Mas com um modelo multimodal podemos fazer muito mais.
Estamos a progredir, e há muito mais por vir. Os Resumos de Áudio no NotebookLM mostram o progresso. Esta funcionalidade usa o Gemini para gerar uma conversa de áudio personalizada e interativa a partir dos seus materiais originais.
Esta é a oportunidade da multimodalidade. Em breve, poderá misturar e combinar entradas (input) e resultados (output). É disso que se trata quando nos referimos a I/O para uma nova geração. E se pudéssemos ir ainda mais longe?
Ir mais longe com os Agentes da IA
Ir ainda mais longe é uma das oportunidades que vemos com os Agentes da IA. Penso neles como sistemas inteligentes que mostram raciocínio, planeamento e memória, são capazes de “pensar” antecipando vários passos e podem trabalhar em software e sistemas, tudo para concluir tarefas por si e, mais importante, com a sua supervisão.
Ainda estamos no começo, mas deixem-me mostrar os exemplos de utilização que estamos a resolver com trabalho árduo.
Vamos começar com as compras. É muito divertido comprar sapatos e muito menos divertido devolvê-los quando não servem.
Imagine se Gemini pudesse fazer concluir todas estas etapas por si:
Procurar o recibo na sua caixa de entrada…Localizar o número do pedido no seu email…Preencher um formulário de devolução…Agendar uma recolha UPS.
Procurar o recibo na sua caixa de entrada…
Localizar o número do pedido no seu email…
Preencher um formulário de devolução…
Agendar uma recolha UPS.
Seria mais fácil, certo?
Vejamos outro exemplo um pouco mais complexo.
Digamos que acabou de se mudar para Chicago. Pode imaginar o Gemini e o Chrome a trabalharem em conjunto com o objetivo de o ajudar a fazer uma série de coisas para se preparar: organizar, raciocinar e sintetizar em seu nome.
Por exemplo, é possível que queria explorar a cidade e encontrar serviços próximos, desde lavandarias a passeadores de cães. Além disso, vai ser preciso atualizar a sua nova morada em dezenas de websites.
O Gemini pode trabalhar nessas tarefas e vai pedir-lhe mais informações quando necessário para que tenha sempre o poder de decisão.
Essa parte é muito importante: à medida que criamos protótipos dessas experiências, pensamos muito sobre como fazê-lo de forma privada, segura e que funcione para todos.
Estes são exemplos de utilização simples, mas dão-nos uma boa ideia dos tipos de problemas que queremos resolver através de sistemas inteligentes que pensam antecipadamente, raciocinam e planificam, tudo em seu nome.
O que isto significa para a nossa missão
Com a multimodalidade, o contexto longo e os agentes, o poder do Gemini aproxima-nos do nosso objetivo final: tornar a IA útil para todos.
É aqui que reside o nosso maior progresso em relação à nossa missão: organizar as informações sobre o mundo em cada entrada, tornando-as acessíveis através de qualquer resultado e combinando as informações do mundo com as informações do SEU mundo, de uma forma que seja realmente útil para si.
Abrir novos caminhos
Para concretizar todo o potencial da IA, é preciso abrir novos caminhos. A equipa da Google DeepMind tem trabalhado arduamente neste campo.
Vimos muito entusiasmo em torno do 1.5 Pro e da sua janela de contexto longo. Mas também recebemos o feedback dos programadores dando conta de que queriam uma solução mais rápida e com melhor relação qualidade-preço. Por isso, amanhã vamos apresentar o Gemini 1.5 Flash, um modelo mais leve construído para escala. Está otimizado para tarefas cujo custo e baixa latência são mais importantes. O Flash 1.5 vai estar disponível no AI Studio e Vertex AI na terça-feira.
Olhando mais adiante, sempre quisemos construir um agente universal que fosse útil no dia a dia. O Projeto Astra mostra compreensão multimodal e capacidades de conversação em tempo real.
Também avançámos na geração de vídeos e imagens com Veo e Imagen 3 e apresentámos o Gemma 2.0, a nossa próxima geração de modelos abertos para inovação responsável em IA. Leia mais de Demis Hassabis.
Infraestrutura para a era da IA: introdução ao Trillium
A formação de modelos de última geração requer muito poder de computação. A procura da indústria por computação de ML cresceu um fator de 1 milhão nos últimos seis anos. E a cada ano aumenta dez vezes.
A Google foi criada para isto. Durante 25 anos, investimos em infraestrutura técnica de classe mundial, desde o hardware de última geração que alimenta a Pesquisa até às nossas unidades de processamento de tensores personalizados que impulsionam os nossos avanços na área da IA.
O Gemini foi treinado e alimentado inteiramente nas nossas TPUs de quarta e quinta geração. E outras empresas líderes de IA, incluindo a Anthropic, também treinaram os seus modelos em TPUs.
Hoje, temos o prazer de anunciar a nossa 6ª geração de TPUs, a Trillium. Trata-se da nossa TPU com melhor desempenho e eficiência até ao momento, com uma melhoria de 4,7x no desempenho de computação por chip em relação à geração anterior, TPU v5e.
Vamos disponibilizar o Trillium aos clientes do Cloud no final de 2024.
Juntamente com as nossas TPUs, temos orgulho de disponibilizar CPUs e GPUs para suportar qualquer carga de trabalho. Isto inclui os novos processadores Axion que anunciámos no mês passado, a nossa primeira CPU personalizada baseada em Arm que oferece desempenho e eficiência energética líderes do setor.
Também temos orgulho de ser um dos primeiros fornecedores de Cloud a oferecer as GPUs Blackwell de última geração da Nvidia, disponíveis no início de 2025. Temos a sorte de ter uma parceria de longa data com a NVIDIA e estamos entusiasmados em trazer os recursos inovadores da Blackwell aos nossos clientes.
Os chips são uma parte fundamental do nosso sistema integrado de ponto a ponto, desde hardware com desempenho otimizado e software aberto até modelos de consumo flexíveis. Tudo isso se junta no nosso Hipercomputador de IA, uma arquitetura inovadora de supercomputador.
Empresas e programadores estão a usá-lo para enfrentar desafios mais complexos, com mais do dobro da eficiência em relação à compra apenas de hardware e chips brutos. Os avanços do nosso Hipercomputador de IA são possíveis em parte devido à nossa abordagem à refrigeração líquida nos nossos centros de dados.
Fazemos isso há quase uma década, muito antes de esta abordagem se tornar a mais avançada na indústria. E hoje a capacidade total do grupo implantado para sistemas de refrigeração líquida é de quase 1 Giga Watt e continua a crescer, tendo quase 70 vezes a capacidade de qualquer outro grupo.
Vamos continuar a fazer os investimentos necessários para promover a inovação em IA e fornecer capacidades de última geração.
A história mais emocionante da Pesquisa até agora
Uma das nossas maiores áreas de investimento e inovação está no nosso produto fundador, a Pesquisa. Há 25 anos, criámos a Pesquisa para ajudar as pessoas a entenderem os movimentos de informação que circulam online.
A cada mudança da plataforma, oferecemos inovações para ajudar a responder melhor às suas perguntas.
Nos dispositivos móveis, desbloqueámos novos tipos de perguntas e respostas, usando melhor contexto, reconhecimento de localização e informações em tempo real. Com os avanços na compreensão da linguagem natural e na visão computacional, possibilitámos novas maneiras de pesquisar, com voz ou cantarolando, para encontrar sua nova música favorita; ou com a imagem daquela flor que viu no seu passeio. E agora pode até circundar para pesquisar aqueles fantásticos sapatos novos e que quer comprar. Não hesite, pode sempre devolvê-los!
É claro que a Pesquisa na era Gemini representa um nível completamente novo, combinando os nossos pontos fortes de infraestrutura, os mais recentes recursos de IA, o nosso alto padrão de qualidade de informações e décadas de experiência a conectá-lo a si à riqueza da Web. O resultado é um produto que faz o trabalho por si.
A Pesquisa Google consiste numa IA generativa à escala da curiosidade humana. E é a nossa história mais emocionante da Pesquisa até agora. Leia mais sobre a era Gemini da Pesquisa com Liz Reid.
Experiências Gemini mais inteligentes
O Gemini é mais do que um chatbot; foi concebido para ser o seu assistente pessoal, que pode ajudá-lo a realizar tarefas complexas e concluir ações por si.
Interagir com o Gemini deve ser conversacional e intuitivo. Por isso, estamos a anunciar uma nova experiência Gemini que nos aproxima dessa visão, que se chama Live, e lhe permite ter uma conversa profunda com Gemini usando a sua própria voz. Também vamos introduzir 2 milhões de tokens no Gemini Advanced ainda este ano, possibilitando o carregamento e a análise de arquivos muito densos, como vídeo e código longo. Sissie Hsiao partilha mais.
Gemini para Android
Com milhares de milhões de utilizadores do Android em todo o mundo, é com entusiasmo que apresentamos uma experiência Gemini ainda mais integrada no nível do sistema operativo. Como seu novo assistente de IA, o Gemini está aqui para ajudá-lo a qualquer hora e em qualquer lugar. E incorporámos modelos Gemini no Android, incluindo o nosso mais recente modelo no dispositivo: Gemini Nano com Multimodalidade, que processa texto, imagens, áudio e fala para desbloquear novas experiências enquanto mantém as informações privadas no seu dispositivo. Todas as novidades do Android aqui.
A nossa abordagem responsável à IA
Continuamos a abordar a oportunidade da IA com ousadia e entusiasmo. Também nos queremos certificar de que tudo é feito com responsabilidade. Estamos a desenvolver uma técnica de ponta, que chamamos de red teaming assistida por IA, que se baseia nas inovações em jogos do Google DeepMind, como o AlphaGo. Além disso, expandimos as nossas inovações técnicas de marca de água, como SynthID, em duas novas modalidades de texto e vídeo, para que o conteúdo gerado por IA seja mais fácil de identificar. James Manyika compartilha mais.
Construir o futuro juntos
Tudo isto mostra o importante progresso à medida que adotamos uma abordagem ousada e responsável para tornar a IA útil para todos.
Antes de encerrarmos, tenho a sensação de que alguém pode estar a contar quantas vezes mencionámos a IA hoje. E presumo que vamos ter de adicionar mais algumas antes de terminarmos.
Esta contagem é mais do que apenas uma brincadeira. Reflete algo muito mais profundo. Há muito tempo que pusemos a IA em primeiro lugar na nossa abordagem. A nossa liderança de décadas de liderança em pesquisa foi pioneira em muitas das inovações modernas que impulsionam o progresso da IA, para nós e para a indústria. Além disso, temos:
Este progresso só é possível devido à nossa incrível comunidade de programadores. Vocês estão a tornar isto real através das experiências e aplicações que criam todos os dias. Por isso, para todos aqui em Shoreline e para os milhões de pessoas em todo o mundo que nos estão a ver, um brinde às possibilidades que temos pela frente e ao facto de as podermos criar juntos.
Publicado por Sundar Pichai, CEO of Google and Alphabet