Uma evolução da atenção está em curso. As pessoas têm maneiras, aparentemente infinitas, de fazer compras, comunicar e divertir-se online. Para que a publicidade se destaque, ela precisa ser relevante e útil – na verdade, isso é mais importante do que nunca. As empresas precisam de estar em todas as superfícies com recursos criativos que captem a atenção das pessoas.
Até agora, parecia impossível fazer isto em escala, mas isto está a mudar com a IA generativa. Esta tecnologia está a ajudar-nos a responder melhor às necessidades dos anunciantes e a desbloquear novas possibilidades em todo o processo de marketing, desde novas experiências de anúncios imersivos até recursos criativos de alto desempenho. À medida que construímos juntos esta nova era de marketing, partilhamos os controlos mais recentes de geração de recursos criativos, experiências de anúncios imersivos, recursos de narrativa visual e muito mais no Google Marketing Live (GML).
Dimensionar a produção criativa de acordo com os padrões da marca
Temos trabalhado para tornar mais fácil e rápida a produção de recursos criativos excelentes para anúncios em canais de marketing. A variedade de recursos criativos é crucial para anúncios fortes, e conseguir isso tornou-se mais fácil para mais anunciantes através da IA generativa no Performance Max. Descobrimos que os anunciantes que melhoram a qualidade do anúncio Performance Max para Excelente obtêm, em média, 6% mais conversões[1] .O Event Tickets Center foi um dos primeiros testadores beta para geração de recursos no Performance Max, tendo ajudado a equipa a acelerar cinco vezes a produção criativa, com menos tempo e esforço.
Ainda assim, o desempenho não é a única consideração para os recursos criativos. Os recursos precisam também estar alinhados com os padrões da marca. Em breve, os anunciantes poderão partilhar as suas diretrizes de fontes e cores no Performance Max, bem como fornecer pontos de referência de imagens úteis para a geração de novas variações de recursos.
Também estamos a introduzir novos recursos de edição de imagens para que os anunciantes possam tentar adicionar novos objetos, estender planos de fundo e recortar imagens para adaptá-las a qualquer formato, tamanho e orientação. Além disso, os retalhistas poderão destacar os seus produtos nos feeds do Google Merchant Center e aproveitar estes recursos de edição. À medida que os anunciantes exploram ideias criativas, a IA do Google irá gerar mais recomendações, mostrando produtos em diferentes contextos e cenários, para que os anunciantes possam simplesmente selecionar os ativos de que gostam e usá-los nos seus canais de marketing.
Dar vida aos recursos criativos com novas experiências de anúncios envolventes
Mesmo com recursos ótimos de imagem e texto em anúncios, pode ser difícil aos consumidores sentirem-se confiantes para tomar decisões de compra on-line sem verem um produto pessoalmente ou experimentá-lo. No entanto, a nossa investigação mostra que este tipo de confiança é fundamental para as marcas. A IA generativa pode ajudar as empresas a transmitir melhor as ofertas e inspirar confiança entre os consumidores a partir do anúncio. Em breve, os anunciantes poderão melhorar os seus anúncios do Shopping com recursos visuais imersivos, incluindo teste virtual e geração de anúncios rotativos 3D. Também estamos a introduzir um recurso que permite aos compradores mergulhar mais fundo num anúncio para ver vídeos de produtos, resumos e produtos semelhantes disponibilizados pelo anunciante.
Neste momento, estamos também a testar uma nova experiência de anúncios na Pesquisa para ajudar a orientar as pessoas em decisões de compra complexas. Imaginemos que amigos estão em renovações e a procurar espaços de “armazenamento de curto prazo”. Clicar num anúncio de um espaço de armazenamento pode conduzir a uma experiência dinâmica em que a IA os ajuda a descobrir o que precisam. Com alguns detalhes, como fotos dos móveis e o seu orçamento, a IA da Google poderá recomendar o tamanho do espaço de armazenamento e os materiais de embalagem com um link para compra no website.
Impulsionar a procura e as conversões através de narrativa visual
Além de anúncios visualmente envolventes, há oportunidades de se conectar com os consumidores nos nossos canais mais envolventes visualmente: YouTube, Discover e Gmail. Lançámos o Demand Gen no ano passado para ajudar os anunciantes a alcançar mais de 3 mil milhões de utilizadores nestas plataformas. Estas campanhas ajudam os anunciantes a impulsionar a procura e as conversões, e, em breve, iremos disponibilizá-las a ainda mais anunciantes no Display & Video 360 e no Search Ads 360.
O YouTube Shorts tem mais de 2 mil milhões de utilizadores logados todos os meses[2], que descobrem novos favoritos através de vídeos curtos. Estamos a introduzir novos formatos e recursos para ajudar as empresas a interagir com estes espectadores. Isto inclui novos formatos de anúncios verticais, ad stickers para impulsionar a ação e novos anúncios gráficos animados que são criados automaticamente a partir de imagens das contas dos anunciantes e nos feeds de produtos Demand Gen.
Criar novas oportunidades para ajudar os consumidores na sua jornada de informação
Os anúncios sempre foram uma parte importante da jornada de informação dos consumidores. No Google I/O, anunciamos que os Resumos de IA na Pesquisa serão lançados para todos nos EUA, com mais países a chegar, em breve. Os Resumos de IA irão aparecer nos resultados da pesquisa quando forem particularmente úteis além do que a Pesquisa disponibiliza hoje. Com os Resumos de IA, as pessoas visitam uma diversidade maior de websites em busca de ajuda com questões mais complexas; também vemos que os links incluídos nos Resumos de IA obtêm mais cliques do que se a página tivesse aparecido numa listagem da web tradicional para aquela consulta. Na verdade, descobrimos que as pessoas que usam os Resumos de IA usam mais a Pesquisa e ficam mais satisfeitas com os resultados. E quando as pessoas clicam em links dos Resumos de IA, estes cliques são de qualidade superior, onde os utilizadores têm maior probabilidade de passar mais tempo no website. À medida que continuamos a testar e a evoluir a experiência da Pesquisa, continuaremos focados em enviar tráfego valioso para publishers e criadores.
Nos primeiros testes, verificámos que as pessoas consideram úteis os anúncios exibidos acima e abaixo do resumo gerado por IA. Em breve, iremos começar a testar anúncios de Pesquisa e Shopping nos Resumos de IA para utilizadores nos EUA. Eles terão a oportunidade de aparecer no Resumo de IA numa seção claramente identificada como "patrocinada" quando estes forem relevantes simultaneamente para a consulta e para a informação dos Resumos de IA. Não é necessária nenhuma ação por parte dos anunciantes: os anúncios de campanhas existentes na Pesquisa, Performance Max e padrão do Shopping têm a oportunidade de aparecer nos Resumos de IA. À medida que avançamos, continuaremos a testar e a aprender sobre novos formatos, obtendo feedback dos anunciantes e da indústria.
Melhorar os resultados com uma base sólida de medição
Embora todas estas atualizações sejam úteis para as empresas, a IA é tão boa quanto as informações fornecidas. Para aproveitar ao máximo a IA, as empresas precisam de uma estratégia de medição forte baseada em dados próprios (first-party data). Muitas empresas possuem dados de diferentes fontes, desde dados de conversão até listas de e-mail e estudos. Até agora, obter uma visão completa tem sido muito complexo, especialmente para as pequenas empresas. Agora, estamos a tornar isto muito mais simples para os anunciantes com Gestor de Dados que agora está disponível para todos. Isto permite que os anunciantes reúnam facilmente fontes de dados próprios num só local para usar, analisar e ativar – o que antes poderia levar semanas ou meses, agora demora minutos.
Colocar a IA da Google para trabalhar para as empresas
Guiadas pelos nossos princípios de IA e pelo feedback dos clientes, estas inovações mais recentes em IA irão ajudar os profissionais de marketing a pensar maior, a criar de forma mais ousada e a gerar resultados mais rapidamente. A IA da Google existe para ajudar, não para substituir: a criatividade humana, a visão estratégica e a experiência sempre serão uma vantagem para o profissional de marketing. Também reconhecemos que, por mais entusiasmantes que sejam estes avanços, a mudança para a IA é muito difícil de gerir para muitas empresas. Estamos a pensar na evolução dos nossos produtos. Com isso em mente, aguardamos seu feedback ao longo do caminho.
Na GML, também iremos apresentar novas formas de como os retalhistas podem usar IA generativa para se conectarem mais profundamente com os clientes e comercializarem as suas marcas e produtos de forma mais eficiente. Mais informações sobre as nossas inovações para retalhistas e anúncios disponíveis no nosso Centro de Ajuda.
Assista ao Keynote e ao pós-evento digital para mais novidades e junte-se à conversa em #GML2024.
Publicado por Vidhya Srinivasan, Vice President / General Manager, Ads
Notas:
[1] Fonte: Dados internos Google, Global, Grupos de Recursos Performance Max antes e após alterações na qualidade do anúncio,, Q1-Q3 2023.
[2] Fonte: Dados internos Google/YouTube, Global, Maio 2023.
Nota do editor: abaixo encontra-se uma transcrição editada dos comentários de Sundar Pichai no I/O 2024, adaptada para incluir mais detalhes das informações anunciadas em palco. Veja todos os anúncios da nossa coleção.
A Google está totalmente comprometida com a era Gemini.
Antes de falarmos disso, quero refletir sobre o momento presente. Temos estado a investir em IA há mais de uma década e a inovar em todas as áreas: pesquisa, produto, infraestrutura. Hoje vamos falar sobre tudo isto.
Ainda assim, ainda estamos a dar os primeiros passos no terreno da plataforma de IA. Há muitas oportunidades no futuro, tanto para criadores como para programadores e startups. Há oportunidades para todos. Contribuir para impulsionar essas oportunidades é o objetivo da era Gemini. Vamos começar.
A era Gemini
Há um ano, no palco do I/O, partilhámos pela primeira vez os nossos planos para o Gemini: um modelo inovador construído para ser nativamente multimodal desde o início, que poderia raciocinar através de texto, imagens, vídeo, código e muito mais. Trata-se de um grande passo no processo de transformação de qualquer informação de entrada (input) num resultado (output): um “I/O” para uma nova geração.
Desde então, introduzimos os primeiros modelos Gemini, os mais capazes até agora. Estes modelos demonstraram desempenho de última geração em todas as referências multimodais. Dois meses depois, apresentámos o Gemini 1.5 Pro, que representa um grande avanço em contextos amplos, já que pode executar 1 milhão de tokens em produção, de forma consistente; mais do que qualquer outro modelo básico de grande escala até agora.
Queremos que todos beneficiem do Gemini. Por isso, temos trabalhado sem parar para poder partilhar estes avanços com todos vocês. Hoje, mais de 1,5 milhão de programadores usam modelos Gemini nas nossas ferramentas. Vocês estão a usá-lo para depurar código, obter novas informações e construir a próxima geração de aplicações de IA.
Também temos introduzido os recursos inovadores do Gemini nos nossos produtos de forma inovadora. Mais tarde, vamos ver exemplos na Pesquisa, Fotos, Workspace, Android e muito mais.
Progresso do produto
Hoje em dia, o Gemini está totalmente presente nos nossos produtos com 2 mil milhões de utilizadores.
E também introduzimos novas experiências, inclusive para dispositivos móveis, para que as pessoas possam interagir com o Gemini diretamente através da aplicação, agora disponível para Android e iOS. E através do Gemini Advanced, que fornece acesso aos nossos modelos mais capazes. Em apenas três meses, já houve mais de um milhão de inscrições para experimentar o Gemini, que continua a mostrar um forte impulso.
Expansão dos Resumos de IA na Pesquisa
Uma das transformações mais incríveis do Gemini ocorreu na Pesquisa Google.
No âmbito da nossa experiência de Pesquisa Generativa, no ano passado, respondemos a milhares de milhões de perguntas. As pessoas estão a usar o Gemini para pesquisar de maneira totalmente inédita e fazer novos tipos de perguntas e consultas mais longas e complexas, e até para pesquisar com fotos, recolhendo, assim, o melhor que a Web tem para oferecer.
Esta experiência está a ser testada fora do Labs. E estamos muito animados por ver não apenas um crescimento no uso da Pesquisa, mas também um aumento da satisfação do utilizador.
Tenho o prazer de anunciar que vamos começar a lançar esta experiência totalmente renovada, os Resumos de IA, para todos os utilizadores nos EUA esta semana, que brevemente vai chegar a mais países.
Há muita inovação a ocorrer na Pesquisa. Graças ao Gemini, podemos criar experiências de pesquisa muito mais poderosas, inclusive dentro dos nossos produtos.
Introdução ao “Perguntar ao Fotos”
Um bom exemplo a ter em conta é o Google Fotos, que lançámos há quase nove anos. Desde então, as pessoas usam-no para organizar as memórias mais importantes. Hoje, isso equivale a mais de 6 mil milhões de fotos e vídeos carregados todos os dias.
Os utilizadores adoram usar o Fotos para pesquisar aspetos das suas vidas. Com Gemini estamos a tornar esse processo ainda mais fácil.
Imaginemos que está num parque de estacionamento e no momento de pagar não se lembra da matrícula. Anteriormente, podia pesquisar palavras-chave no Fotos e percorrer anos de imagens à procura de matrículas de carros. Agora, pode simplesmente pedir ajuda ao Fotos, que conhece os carros que aparecem com frequência e consegue distinguir o seu e reconhecer a sua matrícula.
O “Perguntar ao Fotos” pode ajudá-lo a pesquisar as suas memórias de uma forma mais profunda. Por exemplo, vamos imaginar que está a recordar as conquistas da sua filha. Agora já pode perguntar ao Fotos: “Quando a Lúcia aprendeu a nadar?”
E pode continuar com um pedido ainda mais complexo: “Mostra-me como a natação de Lúcia progrediu”.
Aqui, Gemini vai além de uma simples pesquisa, reconhecendo diferentes contextos, desde fazer várias piscinas, até mergulhar no oceano, passando pelo texto e datas dos certificados de natação dela. E o Fotos reúne todos esses elementos num resumo, permitindo-lhe a si absorver tudo e reviver memórias incríveis novamente. O “Perguntar ao Fotos” vai ser lançado neste verão, juntamente com mais recursos.
Desbloquear conhecimento em vários formatos é o motivo pelo qual construímos o Gemini para ser multimodal desde o início. Trata-se de um único modelo, mas com todas as modalidades integradas. Isto significa que o Gemini não só é capaz de interpretar cada tipo de entrada como também pode encontrar relações entre elas.
A multimodalidade expande radicalmente as perguntas que podemos fazer e as respostas que recebemos.
O contexto amplo vai ainda mais além, permitindo-nos lidar com ainda mais informações: centenas de páginas de texto, horas de áudio ou uma hora de vídeo, repositórios completos de código ou, se quiser, cerca de 96 menus do Cheesecake Factory.
Para tantos menus, seria necessária uma janela de contexto de um milhão de tokens, o que agora é possível com o Gemini 1.5 Pro. Os programadores têm usado este contexto amplo de maneira super interessante.
Nos últimos meses, temos vindo a lançar uma pré-visualização do Gemini 1.5 Pro com contexto longo. Fizemos uma série de melhorias de qualidade na tradução, codificação e raciocínio. Vocês vão poder ver essas atualizações refletidas no modelo a partir de hoje.
Tenho agora o prazer de anunciar que estamos a lançar esta versão aprimorada do Gemini 1.5 Pro para todos os programadores em todo o mundo. Além disso, hoje o Gemini 1.5 Pro com contexto longo de 1 milhão de tokens está disponível diretamente para os consumidores no Gemini Advanced e pode ser usado em 35 idiomas.
Expansão para 2 milhões de tokens na pré-visualização privada
Um milhão de tokens abre possibilidades inteiramente novas. É incrível, mas acho que podemos nos esforçar ainda mais.
Por isso, atualmente já estamos a expandir a janela de contexto para 2 milhões de tokens e disponibiliza-la a programadores em pré-visualização privada.
É incrível olhar para trás e ver quanto progresso fizemos em alguns meses. E isto é só o próximo passo no nosso trajeto em direção ao objetivo final, que é o do contexto infinito.
Integração do Gemini 1.5 Pro no Workspace
Até agora falamos de dois avanços técnicos: multimodalidade e contexto longo. Cada um é poderoso por si só, mas juntos desbloqueiam capacidades mais avançadas e mais inteligência.
Isto ganha vida com o Google Workspace.
As pessoas estão sempre à procura dos seus emails no Gmail. Estamos a trabalhar para torná-lo muito mais poderoso com o Gemini. Por exemplo, imaginemos que, na qualidade de pai, quer manter-se informado sobre tudo o que acontece na escola do seu filho. O Gemini pode ajudá-lo a fazer esse acompanhamento.
Já podemos pedir ao Gemini para resumir todos os emails recentes da escola. Em segundo plano, o Gemini identifica emails relevantes e até analisa anexos, como PDFs. Assim, pode obter um resumo dos pontos principais e itens de ação relacionados com a escola do seu filho. Imagine que está a viajar essa semana e não pode comparecer à reunião da Associação de Pais. A gravação da reunião dura uma hora. Se for organizada no Google Meet, é possível pedir ao Gemini para lhe dar os destaques. Há um grupo de pais à procura de voluntários e você está livre naquele dia. E claro, o Gemini pode redigir uma resposta.
Existem inúmeros outros exemplos de como isto pode facilitar a vida. O Gemini 1.5 Pro está disponível hoje no Workspace Labs. Aparna partilha mais.
Resultados de áudio em NotebookLM
Acabamos de ver um exemplo com resultados de texto. Mas com um modelo multimodal podemos fazer muito mais.
Estamos a progredir, e há muito mais por vir. Os Resumos de Áudio no NotebookLM mostram o progresso. Esta funcionalidade usa o Gemini para gerar uma conversa de áudio personalizada e interativa a partir dos seus materiais originais.
Esta é a oportunidade da multimodalidade. Em breve, poderá misturar e combinar entradas (input) e resultados (output). É disso que se trata quando nos referimos a I/O para uma nova geração. E se pudéssemos ir ainda mais longe?
Ir mais longe com os Agentes da IA
Ir ainda mais longe é uma das oportunidades que vemos com os Agentes da IA. Penso neles como sistemas inteligentes que mostram raciocínio, planeamento e memória, são capazes de “pensar” antecipando vários passos e podem trabalhar em software e sistemas, tudo para concluir tarefas por si e, mais importante, com a sua supervisão.
Ainda estamos no começo, mas deixem-me mostrar os exemplos de utilização que estamos a resolver com trabalho árduo.
Vamos começar com as compras. É muito divertido comprar sapatos e muito menos divertido devolvê-los quando não servem.
Imagine se Gemini pudesse fazer concluir todas estas etapas por si:
Procurar o recibo na sua caixa de entrada…Localizar o número do pedido no seu email…Preencher um formulário de devolução…Agendar uma recolha UPS.
Procurar o recibo na sua caixa de entrada…
Localizar o número do pedido no seu email…
Preencher um formulário de devolução…
Agendar uma recolha UPS.
Seria mais fácil, certo?
Vejamos outro exemplo um pouco mais complexo.
Digamos que acabou de se mudar para Chicago. Pode imaginar o Gemini e o Chrome a trabalharem em conjunto com o objetivo de o ajudar a fazer uma série de coisas para se preparar: organizar, raciocinar e sintetizar em seu nome.
Por exemplo, é possível que queria explorar a cidade e encontrar serviços próximos, desde lavandarias a passeadores de cães. Além disso, vai ser preciso atualizar a sua nova morada em dezenas de websites.
O Gemini pode trabalhar nessas tarefas e vai pedir-lhe mais informações quando necessário para que tenha sempre o poder de decisão.
Essa parte é muito importante: à medida que criamos protótipos dessas experiências, pensamos muito sobre como fazê-lo de forma privada, segura e que funcione para todos.
Estes são exemplos de utilização simples, mas dão-nos uma boa ideia dos tipos de problemas que queremos resolver através de sistemas inteligentes que pensam antecipadamente, raciocinam e planificam, tudo em seu nome.
O que isto significa para a nossa missão
Com a multimodalidade, o contexto longo e os agentes, o poder do Gemini aproxima-nos do nosso objetivo final: tornar a IA útil para todos.
É aqui que reside o nosso maior progresso em relação à nossa missão: organizar as informações sobre o mundo em cada entrada, tornando-as acessíveis através de qualquer resultado e combinando as informações do mundo com as informações do SEU mundo, de uma forma que seja realmente útil para si.
Abrir novos caminhos
Para concretizar todo o potencial da IA, é preciso abrir novos caminhos. A equipa da Google DeepMind tem trabalhado arduamente neste campo.
Vimos muito entusiasmo em torno do 1.5 Pro e da sua janela de contexto longo. Mas também recebemos o feedback dos programadores dando conta de que queriam uma solução mais rápida e com melhor relação qualidade-preço. Por isso, amanhã vamos apresentar o Gemini 1.5 Flash, um modelo mais leve construído para escala. Está otimizado para tarefas cujo custo e baixa latência são mais importantes. O Flash 1.5 vai estar disponível no AI Studio e Vertex AI na terça-feira.
Olhando mais adiante, sempre quisemos construir um agente universal que fosse útil no dia a dia. O Projeto Astra mostra compreensão multimodal e capacidades de conversação em tempo real.
Também avançámos na geração de vídeos e imagens com Veo e Imagen 3 e apresentámos o Gemma 2.0, a nossa próxima geração de modelos abertos para inovação responsável em IA. Leia mais de Demis Hassabis.
Infraestrutura para a era da IA: introdução ao Trillium
A formação de modelos de última geração requer muito poder de computação. A procura da indústria por computação de ML cresceu um fator de 1 milhão nos últimos seis anos. E a cada ano aumenta dez vezes.
A Google foi criada para isto. Durante 25 anos, investimos em infraestrutura técnica de classe mundial, desde o hardware de última geração que alimenta a Pesquisa até às nossas unidades de processamento de tensores personalizados que impulsionam os nossos avanços na área da IA.
O Gemini foi treinado e alimentado inteiramente nas nossas TPUs de quarta e quinta geração. E outras empresas líderes de IA, incluindo a Anthropic, também treinaram os seus modelos em TPUs.
Hoje, temos o prazer de anunciar a nossa 6ª geração de TPUs, a Trillium. Trata-se da nossa TPU com melhor desempenho e eficiência até ao momento, com uma melhoria de 4,7x no desempenho de computação por chip em relação à geração anterior, TPU v5e.
Vamos disponibilizar o Trillium aos clientes do Cloud no final de 2024.
Juntamente com as nossas TPUs, temos orgulho de disponibilizar CPUs e GPUs para suportar qualquer carga de trabalho. Isto inclui os novos processadores Axion que anunciámos no mês passado, a nossa primeira CPU personalizada baseada em Arm que oferece desempenho e eficiência energética líderes do setor.
Também temos orgulho de ser um dos primeiros fornecedores de Cloud a oferecer as GPUs Blackwell de última geração da Nvidia, disponíveis no início de 2025. Temos a sorte de ter uma parceria de longa data com a NVIDIA e estamos entusiasmados em trazer os recursos inovadores da Blackwell aos nossos clientes.
Os chips são uma parte fundamental do nosso sistema integrado de ponto a ponto, desde hardware com desempenho otimizado e software aberto até modelos de consumo flexíveis. Tudo isso se junta no nosso Hipercomputador de IA, uma arquitetura inovadora de supercomputador.
Empresas e programadores estão a usá-lo para enfrentar desafios mais complexos, com mais do dobro da eficiência em relação à compra apenas de hardware e chips brutos. Os avanços do nosso Hipercomputador de IA são possíveis em parte devido à nossa abordagem à refrigeração líquida nos nossos centros de dados.
Fazemos isso há quase uma década, muito antes de esta abordagem se tornar a mais avançada na indústria. E hoje a capacidade total do grupo implantado para sistemas de refrigeração líquida é de quase 1 Giga Watt e continua a crescer, tendo quase 70 vezes a capacidade de qualquer outro grupo.
Vamos continuar a fazer os investimentos necessários para promover a inovação em IA e fornecer capacidades de última geração.
A história mais emocionante da Pesquisa até agora
Uma das nossas maiores áreas de investimento e inovação está no nosso produto fundador, a Pesquisa. Há 25 anos, criámos a Pesquisa para ajudar as pessoas a entenderem os movimentos de informação que circulam online.
A cada mudança da plataforma, oferecemos inovações para ajudar a responder melhor às suas perguntas.
Nos dispositivos móveis, desbloqueámos novos tipos de perguntas e respostas, usando melhor contexto, reconhecimento de localização e informações em tempo real. Com os avanços na compreensão da linguagem natural e na visão computacional, possibilitámos novas maneiras de pesquisar, com voz ou cantarolando, para encontrar sua nova música favorita; ou com a imagem daquela flor que viu no seu passeio. E agora pode até circundar para pesquisar aqueles fantásticos sapatos novos e que quer comprar. Não hesite, pode sempre devolvê-los!
É claro que a Pesquisa na era Gemini representa um nível completamente novo, combinando os nossos pontos fortes de infraestrutura, os mais recentes recursos de IA, o nosso alto padrão de qualidade de informações e décadas de experiência a conectá-lo a si à riqueza da Web. O resultado é um produto que faz o trabalho por si.
A Pesquisa Google consiste numa IA generativa à escala da curiosidade humana. E é a nossa história mais emocionante da Pesquisa até agora. Leia mais sobre a era Gemini da Pesquisa com Liz Reid.
Experiências Gemini mais inteligentes
O Gemini é mais do que um chatbot; foi concebido para ser o seu assistente pessoal, que pode ajudá-lo a realizar tarefas complexas e concluir ações por si.
Interagir com o Gemini deve ser conversacional e intuitivo. Por isso, estamos a anunciar uma nova experiência Gemini que nos aproxima dessa visão, que se chama Live, e lhe permite ter uma conversa profunda com Gemini usando a sua própria voz. Também vamos introduzir 2 milhões de tokens no Gemini Advanced ainda este ano, possibilitando o carregamento e a análise de arquivos muito densos, como vídeo e código longo. Sissie Hsiao partilha mais.
Gemini para Android
Com milhares de milhões de utilizadores do Android em todo o mundo, é com entusiasmo que apresentamos uma experiência Gemini ainda mais integrada no nível do sistema operativo. Como seu novo assistente de IA, o Gemini está aqui para ajudá-lo a qualquer hora e em qualquer lugar. E incorporámos modelos Gemini no Android, incluindo o nosso mais recente modelo no dispositivo: Gemini Nano com Multimodalidade, que processa texto, imagens, áudio e fala para desbloquear novas experiências enquanto mantém as informações privadas no seu dispositivo. Todas as novidades do Android aqui.
A nossa abordagem responsável à IA
Continuamos a abordar a oportunidade da IA com ousadia e entusiasmo. Também nos queremos certificar de que tudo é feito com responsabilidade. Estamos a desenvolver uma técnica de ponta, que chamamos de red teaming assistida por IA, que se baseia nas inovações em jogos do Google DeepMind, como o AlphaGo. Além disso, expandimos as nossas inovações técnicas de marca de água, como SynthID, em duas novas modalidades de texto e vídeo, para que o conteúdo gerado por IA seja mais fácil de identificar. James Manyika compartilha mais.
Construir o futuro juntos
Tudo isto mostra o importante progresso à medida que adotamos uma abordagem ousada e responsável para tornar a IA útil para todos.
Antes de encerrarmos, tenho a sensação de que alguém pode estar a contar quantas vezes mencionámos a IA hoje. E presumo que vamos ter de adicionar mais algumas antes de terminarmos.
Esta contagem é mais do que apenas uma brincadeira. Reflete algo muito mais profundo. Há muito tempo que pusemos a IA em primeiro lugar na nossa abordagem. A nossa liderança de décadas de liderança em pesquisa foi pioneira em muitas das inovações modernas que impulsionam o progresso da IA, para nós e para a indústria. Além disso, temos:
Este progresso só é possível devido à nossa incrível comunidade de programadores. Vocês estão a tornar isto real através das experiências e aplicações que criam todos os dias. Por isso, para todos aqui em Shoreline e para os milhões de pessoas em todo o mundo que nos estão a ver, um brinde às possibilidades que temos pela frente e ao facto de as podermos criar juntos.
Publicado por Sundar Pichai, CEO of Google and Alphabet
O Gemini foi concebido para ser o seu assistente de IA pessoal - para ser conversacional, intuitivo e prestável. Quer o utilize através da aplicação ou da experiência Web, o Gemini pode ajudá-lo na realização de tarefas complexas, podendo inclusivamente agir por si.
Atualmente estamos a fazer várias atualizações - incluindo uma janela de contexto mais longa, novas capacidades de análise de dados, associação com outras aplicações Google e opções mais personalizáveis - para que possa colaborar com o Gemini mais personalizado e inteligente de sempre.
Analise documentos com a janela de contexto mais longa do mundo
Hoje, estamos a disponibilizar o Gemini 1.5 Pro, o nosso modelo de última geração, para os subscritores do Gemini Advanced. O Gemini 1.5 Pro traz-lhe os nossos últimos avanços técnicos, incluindo uma janela de contexto amplamente expandida a começar no 1 milhão de tokens - o chatbot de consumo mais longo e amplamente disponível do mundo. Uma janela de contexto desta dimensão significa que o Gemini Advanced é capaz de lidar com múltiplos documentos em massa, até 1500 páginas ou resumir 100 emails. Em breve, vai ser possível lidar com conteúdo de vídeo de uma hora ou com bases de código com mais de 30.000 linhas.
Para tirar partido desta janela de contexto longo, estamos a acrescentar a possibilidade de carregamento de ficheiros através do Drive ou diretamente a partir do telefone para o Gemini Advanced. Agora, pode obter, rapidamente, respostas e informações sobre documentos muito densos, tais como perceber os detalhes da política de animais de estimação do seu contrato de arrendamento ou comparar os principais argumentos de dois artigos científicos. E, em breve, o Gemini Advanced vai poder agir como um analista de dados, descobrindo informações e a criar visualizações e gráficos personalizados a partir de ficheiros de dados carregados, tais como folhas de cálculo, por exemplo.
O Gemini assegura a privacidade dos seus ficheiros e não são usados para treinar os nossos modelos.
O Gemini é nativamente multimodal, e a versão 1.5 Pro traz grandes melhorias no campo da interpretação de imagens. Por exemplo, pode tirar uma foto a um prato no seu restaurante preferido e pedir a receita, ou usar uma imagem de um problema de matemática para que o Gemini lhe envie as instruções de resolução passo a passo - tudo isto a partir de uma simples imagem.
O Gemini 1.5 Pro vai estar disponível para os subscritores do Gemini Advanced em mais de 150 países e em cerca de 35 idiomas.
Tenha conversas mais naturais através do Gemini Live
E, nas próximas semanas, vamos implementar o Gemini Live para os subscritores do Gemini Advanced, uma nova experiência conversacional para dispositivos móveis que usa a nossa tecnologia de conversação mais inovadora para tornar a interação com o Gemini mais intuitiva. Com o Gemini Live, pode falar com o Gemini e selecionar entre uma variedade de vozes naturais para ouvir as respostas. Pode inclusivamente falar no seu próprio ritmo ou interromper as respostas com perguntas de esclarecimento, semelhante ao que acontece numa conversa natural.
Vamos imaginar que se está a preparar para uma entrevista de emprego ou a ensaiar um discurso importante: basta aceder ao Live e pedir ao Gemini para o ajudar a preparar-se. O Gemini vai sugerir as competências que pode destacar ao conversar com o seu potencial empregador ou poderá sugerir dicas para falar em público para acalmar os seus nervos antes de subir ao palco. Ainda este ano, vai poder usar a câmara quando aceder ao Live e dar início a conversas sobre o que está a ver à sua volta.
Descomplique o planeamento, como os itinerários de viagens
Às vezes, passa mais tempo a pesquisar e a organizar uma viagem do que a desfrutar da mesma. A nova experiência de planeamento do Gemini Advanced não se limita apenas a sugerir uma lista de atividades, como também elabora um itinerário personalizado só para si.
Suponha que pede ao Gemini o seguinte: “A minha família e eu vamos a Miami no Dia do Trabalhador. O meu filho gosta muito de arte e o meu marido adora peixe. Podes ver as informações do meu voo e do hotel no Gmail e ajudar-me a planear o fim de semana?”
Este comando exige que o Gemini faça muito mais do que simplesmente compilar informação que está disponível publicamente, como outros chatbots. O Gemini tem em conta os horários do voo, as preferências gastronómicas e a informação acerca dos museus locais, para além de saber onde se localiza cada paragem e a duração das deslocações entre as várias atividades. O Gemini usa a informação do voo que está disponível no Gmail, recorre ao Google Maps para recomendar restaurantes e museus perto do seu hotel e utiliza a Pesquisa para sugerir outras atividades, como um passeio ao Design District ou uma ida à praia para preencher o resto do dia. Sintetiza toda a informação e cria um itinerário único e pessoal que vai de encontro às suas necessidades. E se forem feitas mais alterações ou adicionados mais detalhes, o itinerário é atualizado automaticamente.
Esta nova experiência dinâmica de planeamento vai estar disponível no Gemini Advanced nos próximos meses.
Personalize o Gemini com Gems
Para uma experiência ainda mais pessoal, os subscritores do Gemini Advanced vão poder criar Gems - versões personalizadas do Gemini. Pode criar a Gem que quiser: um colega de ginásio, subchefe de cozinha, um colega de programação ou um guia de escrita criativa. As Gems são também fáceis de configurar. Basta descrever o que quer que a sua Gem faça e pretende que lhe responda - como “és a minha treinadora de atletismo, dá-me um plano diário de corrida e sê positiva, otimista e motivadora”, por exemplo. O Gemini recebe estas instruções e, com apenas um clique, aperfeiçoa-as para criar a Gem que corresponde às suas necessidades específicas.
Ligue-se a mais aplicações Google
No ano passado, integrámos as Extensões diretamente no Gemini, o que lhe permite concluir mais tarefas com as apps e serviços da Google que já usa. Continuamos a incluir as aplicações da Google no Gemini, como a Extensão do YouTube Music, que já está a ser implementada. Com o Gemini, o utilizador pode pesquisar a sua música favorita mesmo que não saiba o título da música, mencionando um verso favorito ou o artista.
Em breve, vamos associar ainda mais ferramentas Google ao Gemini, incluindo o Calendário Google, o Tasks e o Keep. Assim, o utilizador pode fazer inúmeras coisas, tais como carregar uma imagem da agenda escolar do seu filho e pedir ao Gemini que crie entradas no calendário para todos os trabalhos ou até tirar uma fotografia a uma determinada receita e adicioná-la ao Keep como uma lista de compras.
Com estas atualizações, sendo que muitas vão também estar disponíveis para os nossos clientes empresariais, vai poder aceder à experiência Gemini mais pessoal e útil de sempre - tudo a partir de um só comando.
Não perca, em breve, as novas funcionalidades e comece a conversar com o Gemini hoje mesmo.
Publicado por Sissie Hsiao, VP/GM, Gemini Experiences and Google Assistant
Em dezembro passado, lançámos o nosso primeiro modelo multimodal nativo Gemini 1.0 em três tamanhos: Ultra, Pro e Nano. Meses mais tarde, lançámos o 1.5 Pro, com desempenho melhorado e a janela de contexto longa pioneira de 1 milhão de tokens.
Programadores e clientes empresariais usaram o 1.5 Pro de formas incríveis e consideram a sua janela de contexto longa, as suas capacidades de raciocínio multimodal e o seu impressionante desempenho global incrivelmente útil.
Sabemos, com base no feedback dos utilizadores, que algumas aplicações necessitam de uma latência mais baixa e de um custo mais baixo para cumprir. Isto inspirou-nos a continuar a inovar e estamos a introduzir o Gemini 1.5 Flash, um modelo que é mais leve do que o 1.5 Pro e que foi desenhado para ser rápido e eficiente, para servir em escala.
O 1.5 Pro e o 1.5 Flash estão disponíveis em public preview com uma janela de contexto de 1 milhão de tokens no Google AI Studio e Vertex AI. Uma janela de contexto de 2 milhões de tokens está disponível para programadores que usem a API e Clientes Google Cloud através de lista de espera.
Estamos também a anunciar atualizações na nossa família de modelos Gemini e a anunciar a nossa nova geração de modelos abertos, Gemma 2, e a partilhar o progresso no futuro dos assistentes de IA com o Project Astra.
Notícias da família de modelos Gemini
Novo 1.5 Flash, otimizado para velocidade e eficiência
O 1.5 Flash é a mais recente adição à família de modelos Gemini e o modelo Gemini mais rápido servido na API. Está otimizado para tarefas de alto volume e alta frequência em escala, tem uma melhor relação preço/eficiência para cumprir e apresenta a nossa janela de contexto pioneira.
Apesar de ser um modelo mais leve do que o 1.5 Pro, é altamente capaz em raciocínio multimodal em vastas quantidades de informação e oferece uma qualidade impressionante para o seu tamanho.
O 1.5 Flash é excelente em resumos, aplicações de mensagens, legendas de imagens e vídeos, extração de dados de documentos e tabelas longas e muito mais. Isto ocorre porque ele foi treinado pelo 1.5 Pro através de um processo chamado “destilação”, onde o conhecimento e competências essenciais de um modelo maior são transferidos para um modelo menor e mais eficiente.
Mais informações sobre o 1.5 Flash no nosso relatório técnico atualizado do Gemini 1.5 e na página de tecnologia do Gemini e saiba mais sobre a disponibilidade e os preços do 1.5 Flash. Vamos partilhar, em breve, mais detalhes numa atualização do relatório técnico do Gemini 1.5.
Melhoras significativas no 1.5 Pro
Nos últimos meses, melhorámos significativamente o 1.5 Pro, o nosso melhor modelo para escala numa vasta série de tarefas. Para além de alargar a sua janela de contexto para dois milhões de tokens, melhorámos a geração de código, o raciocínio lógico e o planeamento, a conversação multiturno e a compreensão de áudio e imagens. Vemos melhorias significativas no benchmarks internas e públicos em cada uma destas tarefas.
O 1.5 Pro pode seguir instruções cada vez mais complexas e diferenciadas, incluindo instruções que especificam o comportamento ao nível do produto, como função, formato e estilo. Melhorámos o controlo sobre as respostas do modelo para casos de utilização específicos, como a criação de personas e estilo de resposta de um agente de chat ou automatização de fluxos de trabalho através de múltiplas funções de chamadas. E permitimos aos utilizadores adaptar o comportamento do modelo ao definir instruções de sistema.
Também adicionámos compreensão de áudio na API Gemini e no AI Studio, e por isso, o 1.5 Pro pode agora desenvolver raciocínios entre imagem e áudio para vídeos carregados no AI Studio. E agora estamos a integrar o 1.5 Pro em produtos Google, incluindo o Gemini Advanced e aplicações Workspace.
Mais informações sobre o 1.5 Pro na Página de Tecnologia do Gemini. Mais detalhes estarão disponíveis em breve no nosso relatório técnico atualizado do Gemini 1.5.
Gemini Nano compreende entradas multimodais
O Gemini Nano está a expandir-se para além das entradas apenas de texto para incluir também imagens. A começar com o Pixel, as aplicações que usam o Gemini Nano com Multimodalidade serão capazes de compreender o mundo da mesma forma que as pessoas o fazem – não apenas através da entrada de texto, mas também através da visão, do som e do idioma falado.
Mais informações em Gemini 1.0 Nano no Android.
Nova geração de modelos abertos
Hoje estamos a partilhar uma série de atualizações ao Gemma, a nossa família de modelos abertos desenvolvidos com a mesma tecnologia e investigação usados para criar os modelos Gemini.
Estamos a apresentar Gemma 2, a nossa próxima geração de modelos abertos para inovação responsável em IA. O Gemma 2 tem uma nova arquitetura projetada para desempenho e eficiência inovadores e estará disponível em novos tamanhos.
A família Gemma também está a expandir-se com PaliGemma, o nosso primeiro modelo de linguagem de visão inspirado no PaLI-3. E atualizámos o nosso kit de ferramentas de IA generativa responsável com LLM Comparator para avaliar a qualidade das respostas do modelo.
Mais informações no blog para programadores.
Progresso no desenvolvimento de agentes de IA universais
Como parte da missão do Google DeepMind de construir IA de forma responsável para beneficiar a humanidade, sempre quisemos desenvolver agentes de IA universais que pudessem ser úteis na vida quotidiana. É por isso que hoje estamos a partilhar o nosso progresso na construção do futuro dos assistentes de IA com o Projeto Astra (agente responsivo avançado que vê e fala).
Para ser verdadeiramente útil, um agente precisa de compreender e responder ao mundo complexo e dinâmico tal como as pessoas fazem – absorver e lembrar o que vê e ouve para compreender o contexto e agir. Ele também precisa ser proactivo, ensinável e pessoal de modo que os utilizadores possam conversar com ele naturalmente e sem atrasos.
Embora tenhamos feito um progresso incrível no desenvolvimento de sistemas de IA que podem compreender informações multimodais, reduzir o tempo de resposta a algo conversacional é um desafio difícil de engenharia. Nos últimos anos, temos trabalhado para melhorar a forma como os nossos modelos percebem, raciocinam e conversam para tornar o ritmo e a qualidade da interação mais naturais.
Estes agentes foram construídos a partir do modelo Gemini e de outros modelos específicos de tarefas, e foram projetados para processar informações mais rapidamente, codificando continuamente frames de vídeo, combinando a entrada de vídeo e voz numa linha do tempo de eventos e armazenando essas informações em cache para uma recuperação eficiente.
Ao aproveitar os nossos principais modelos de voz, também melhorámos a forma como eles soam, proporcionando aos agentes uma gama mais ampla de entonações. Estes agentes podem compreender melhor o contexto em que estão a ser usados e a responder rapidamente na conversa.
Com tecnologia como esta, é fácil antever um futuro onde as pessoas podem ter um assistente de IA especialistas ao seu lado através de telefone ou óculos. E algumas destas capacidades irão chegar aos produtos da Google, como a aplicação Gemini e experiência web, ainda este ano.
Exploração contínua
Fizemos um progresso incrível até agora com a nossa família de modelos Gemini e estamos sempre a esforçar-nos para avançar ainda mais no que há de mais moderno. Ao investir numa linha de produção incansável de inovação, somos capazes de explorar novas ideias de vanguarda, ao mesmo tempo que se abre a possibilidade de novos e interessantes casos de uso do Gemini.
Mais informações sobre Gemini e as suas capacidades.
Publicado por Demis Hassabis, CEO da Google DeepMind, em nome da equipa Gemini
Ao longo dos últimos 25 anos, perante tantas mudanças tecnológicas, tivemos de reinventar e expandir as capacidades da Pesquisa Google. Para que possa aceder à informação na web refinámos, de forma meticulosa, os nossos principais sistemas de qualidade de informação. E desenvolvemos uma base de conhecimento com milhares de milhões de factos sobre pessoas, locais e coisas - de modo a que possa aceder à informação em que confia num piscar de olhos.
Atualmente, graças à IA generativa, a Pesquisa pode ir muito além do imaginado. Por isso, pode perguntar ou pedir seja o que for - da pesquisa ao planeamento e no debate de ideias - que a Google põe mãos à obra para o ajudar.
Tudo isto é possível graças a um novo modelo Gemini personalizado para a Pesquisa Google. Ele reúne as capacidades avançadas do Gemini, incluindo raciocínio em várias etapas, planeamento e multimodalidade - com os nossos melhores sistemas de pesquisa de excelência.
Obtenha respostas rápidas com os Resumos de IA
Às vezes precisamos de uma resposta rápida, mas não temos tempo para examinar minuciosamente toda a informação disponível. A Pesquisa pode fazer esse trabalho por si através dos Resumos de IA.
Alguns utilizadores já tiveram a oportunidade de usar os Resumos de IA em milhares de milhões de pesquisas através desta experiência no Search Labs. Estes utilizadores gostaram do facto de poderem obter não só uma vista geral rápida sobre um determinado tópico, mas também links para saber mais. Descobrimos que, com os Resumos de IA, os utilizadores fazem mais uso da Pesquisa e estão mais satisfeitos com os resultados.
A partir de hoje, os Resumos de IA vão começar a ser disponibilizados a todos os utilizadores nos EUA e Reino Unido, estendendo-se, em breve, a outros países. Isto significa que nesta semana centenas de milhões de utilizadores vão ter acesso aos Resumos de IA, e esperamos alcançar mil milhões de pessoas até ao final do ano.
Com os Resumos de IA, os utilizadores estão a visitar uma maior variedade de Websites para questões mais complexas. E estamos a ver que os links incluídos nos Resumos de IA têm mais cliques do que quando aparecem numa listagem da web tradicional para essa pesquisa. E, à medida que alargamos esta experiência, mantemos o foco de enviar tráfego valioso para os publishers e criadores. Como sempre, os anúncios vão continuar a aparecer em espaços dedicados por toda a página, com etiquetagem clara para se poder distinguir os resultados orgânicos dos patrocinados.
Ajuste o seu Resumo de IA
Em breve, vai poder ajustar o seu Resumo de IA com opções para simplificar a linguagem ou apresentá-la de forma mais detalhada. Isto pode ser particularmente útil quando um certo tópico é novo para si, ou se quiser simplesmente simplificar um tema para satisfazer a curiosidade de uma criança.
Em breve, esta atualização vai estar disponível no Search Labs para consultas em inglês nos EUA.
Coloque as questões mais complexas
Com as capacidades de raciocínio em várias etapas do Gemini, os Resumos de IA vão ajudar com questões cada vez mais complexas. Em vez de fazer várias pesquisas, vai passar a poder fazer as perguntas mais elaboradas com todas as nuances e ressalvas, tudo de uma só vez.
Por exemplo, vamos imaginar que está à procura de um novo estúdio de ioga ou pilates e quer que esse estúdio seja popular entre as pessoas locais, que tenha uma localização conveniente para as deslocações, e que ofereça um desconto para novos membros. Em breve, em apenas uma pesquisa, vai ser possível pedir algo como “encontra o melhor estúdio de ioga ou pilates em Boston e mostra-me detalhes sobre ofertas e a distância a pé a partir da Beacon Hill.”
Estas capacidades de raciocínio em várias etapas vão ser brevemente integradas nos Resumos de IA no Search Labs para consultas em inglês nos EUA.
Planifique à vontade
Além de encontrar a resposta ou a informação ideal para uma questão complexa, a Pesquisa também vai poder fazer um planeamento por si.
Com as capacidades de planeamento do Gemini, a Pesquisa vai ajudar na criação de planos para o que precisar, a começar por refeições e férias. Faça uma pesquisa por “cria um plano de refeições de 3 dias para um grupo e que sejam fáceis de preparar” e aceda a uma ampla variedade de receitas em toda a Web.
Se quiser fazer alguma alteração, pode simplesmente pedir à Pesquisa que faça os ajustes necessários, como trocar o jantar por um prato vegetariano, por exemplo. De imediato, a Pesquisa personaliza o seu plano de refeições, e logo a seguir, pode exportar o seu plano de refeições para o Docs ou Gmail.
O planeamento de refeições e de viagens com personalização está agora disponível no Search Labs em inglês nos Estados Unidos. Mais para o final do ano iremos acrescentar mais capacidades de personalização e mais categorias como festas, saídas à noite e fitness.
Explore páginas de resultados organizadas pela IA
Quando procura por novas ideias, o facto de ter a inspiração ideal e considerar todas as opções pode ser muito trabalhoso. Em breve, quando estiver à procura de sugestões, a Pesquisa vai poder usar a IA generativa para debater ideias consigo e, assim, criar uma página de resultados organizada pela IA para facilitar a exploração.
Vai poder ver resultados agrupados sob títulos únicos gerados pela IA, com uma ampla variedade de perspectivas e tipos de conteúdo.
Em breve, para pesquisas em inglês nos EUA, vai poder aceder a estas novas páginas de resultados de pesquisa organizadas pela IA quando procura inspiração - a começar com jantares e receitas, seguindo-se filmes, música, livros, hotéis, compras e muito mais.
Grave um vídeo, obtenha ajuda da IA
A Pesquisa é muito mais do que palavras numa caixa de texto. Frequentemente, as suas perguntas são motivadas por coisas à sua volta, incluindo objetos em movimento.
Graças aos avanços feitos no âmbito da compreensão de vídeo, agora podemos levar a pesquisa visual a outro nível, com a possibilidade de fazer perguntas com vídeos.
Vamos imaginar que comprou um gira-discos numa loja de artigos em segunda mão, mas que não está a funcionar quando ligado e que a agulha está inesperadamente em movimento. Pesquisar com vídeo permite-lhe poupar o tempo e o trabalho necessários para encontrar as palavras certas e descrever o problema, disponibilizando-lhe um Resumos de IA com os passos e recursos para o resolver.
Em breve, esta funcionalidade estará disponível em inglês no Search Labs para utilizadores nos EUA e será alargada a mais regiões no futuro.
Isto é apenas um vislumbre de como estamos a reinventar a Pesquisa Google - combinando o melhor da Pesquisa com as capacidades avançadas do Gemini. Em breve, o Google vai poder pesquisar, simplificar, investigar, planear, debater ideias e muito mais.
Inscreva-se no Search Labs e seja uma das primeiras pessoas a experimentar estas e outras funcionalidades.
Publicado por Liz Reid, VP, Head of Google Search
Estamos a viver um momento único em que os mais recentes avanços da IA reinventam o que é possível fazer com os telefones. Graças à integração da IA da Google no centro do sistema operativo Android, os milhares de milhões de utilizadores do Android podem agora interagir com os seus dispositivos de formas completamente novas.
A funcionalidade Circundar para Pesquisar pode, agora, ajudar os estudantes com os seus trabalhos de casa
Com a funcionalidade Circundar para Pesquisar integrada diretamente na experiência do utilizador, é possível pesquisar qualquer coisa que veja no seu telefone através de um simples gesto, sem ter de parar o que está a fazer ou mudar para uma aplicação diferente. Desde o lançamento no Samsung Unpacked, adicionámos novas capacidades à funcionalidade Circundar para Pesquisar, como a tradução em ecrã inteiro, e a disponibilidade alargada a mais dispositivos Pixel e Samsung.
A partir de hoje, a funcionalidade Circundar para Pesquisar pode ajudar os estudantes nos seus trabalhos de casa, diretamente a partir dos seus telefones e tablets. Quando os estudantes circundam uma parte exata de um comando em que têm dificuldades, recebem uma orientação detalhada para resolver problemas de física e de matemática sem terem que sair das folhas de informação digitais ou dos seus planos de estudos. Ainda este ano, a funcionalidade Circundar para Pesquisar vai conseguir resolver problemas ainda mais complexos que envolvam fórmulas simbólicas, diagramas, gráficos e muito mais. Tudo isto é possível graças ao nosso esforço com o LearnLM, a nossa nova família de modelos ajustados para a aprendizagem.
A funcionalidade Circundar para Pesquisar já está disponível em mais de 100 milhões de dispositivos. Com planos para levar a experiência a mais dispositivos, estamos no caminho certo para duplicar este número até ao final deste ano.
O Gemini vai melhorar ainda mais a compreensão do contexto para o ajudar na realização de tarefas
O Gemini no Android é um novo tipo de assistente que usa a IA generativa para o ajudar a ser mais criativo e produtivo. Esta experiência integrada no Android está ainda melhor no que diz respeito à compreensão do contexto do que está no ecrã e na aplicação que está a usar.
Em breve, vai poder colocar a sobreposição do Gemini na parte superior da app que está a usar, de forma a utilizar de mais formas o Gemini. Por exemplo, pode arrastar e largar imagens geradas para o Gmail, Mensagens Google e em outros locais, ou clicar em “Perguntar a este vídeo” para obter informações específicas de um vídeo do YouTube. Se tiver o Gemini Advanced, também terá a opção “Perguntar a este PDF” para obter respostas, de forma rápida, sem ter de percorrer várias páginas. Esta atualização será lançada para centenas de milhões de dispositivos ao longo dos próximos meses.
Vamos continuar a melhorar o Gemini para lhe dar sugestões mais dinâmicas relacionadas com o conteúdo do seu ecrã.
As capacidades multimodais completas chegam ao Gemini Nano
O Android é o primeiro sistema operativo móvel com um modelo fundacional integrado no dispositivo. Com o Gemini Nano, conseguimos levar experiências até si mais rapidamente e manter as suas informações completamente privadas. A começar com o Pixel ainda este ano, o Gemini Nano terá capacidades multimodais completas, por isso, para além do processamento da introdução de texto, o seu telefone também vai conseguir compreender mais informações em contexto como sinais, sons e idioma falado.
Descrições mais claras com o Talkback
Ainda este ano, as capacidades multimodais do Gemini Nano vão chegar ao Talkback, ajudando as pessoas com deficiência visual ou com visão reduzida a obter descrições mais claras e detalhadas sobre uma determinada imagem. Em média, os utilizadores do Talkback encontram 90 imagens não etiquetadas por dia. Esta atualização vai ajudar a preencher as informações em falta, quer sejam mais detalhes sobre o que está numa foto que a família ou amigos enviaram, ou o estilo e o design das roupas enquanto compram online. Como o Gemini Nano está incorporado no dispositivo, estas descrições aparecem rapidamente e funcionam mesmo quando não existe ligação à rede.
Receba alertas para esquemas suspeitos durante as chamadas telefónicas
De acordo com um relatório recente, num período de 12 meses, as pessoas perderam mais de 1 bilião de dólares em fraudes. Estamos a testar uma nova funcionalidade que usa o Gemini Nano para fornecer alertas em tempo real durante uma chamada caso detete padrões de conversação geralmente associados a esquemas (scams). Por exemplo, o utilizador recebe um alerta se um “representante do seu banco” lhe pedir para transferir, urgentemente, dinheiro, para fazer um pagamento com um vale de oferta ou se lhe pedir informações pessoais como PINs ou palavras-passe, pedidos estes que são solicitações bancárias invulgares. Esta proteção acontece no próprio dispositivo, por isso, a conversa do utilizador permanece privada. Ainda este ano, vamos partilhar mais detalhes sobre esta funcionalidade.
Mais novidades no futuro no Android
Estamos a começar a compreender como a IA no dispositivo pode mudar o que pode fazer com o seu telefone, e vamos continuar a integrar a IA da Google em todas as partes da experiência dos smartphones Pixel, Samsung e muito mais. Se for um programador, consulte o Blogue de programadores do Android para saber como pode integrar as nossas mais recentes funcionalidades e modelos de IA, como o Gemini Nano e o Gemini no Android Studio.
Acompanhe-nos para saber mais novidades do Android 15 e atualizações do ecossistema.
Publicado por Sameer Samat, President, Android Ecosystem
A um mês do encerramento das urnas nos 27 Estados-Membros da UE, estamos a partilhar uma visão geral dos nossos esforços para ajudar as pessoas dentro e fora da Europa a encontrar notícias e informações eleitorais úteis e confiáveis. Quer seja a pesquisar o local onde votar, a compreender as posições dos candidatos ou a aprender sobre as questões que moldam o debate, as nossas equipas dedicadas estão a trabalhar arduamente para implementar, de forma correcta, as políticas e os sistemas Eis o que estamos a fazer para garantir que o conteúdo eleitoral de alta qualidade prospera no YouTube.
Ajudar os eleitores a encontrar conteúdo confiável
Para as Eleições do Parlamento Europeu de 2024, seguem-se algumas funcionalidades que irão surgir à medida que ligamos os eleitores à informação e ao contexto de que necessitam para se manterem informados:
Tudo isto baseia-se nas nossas funcionalidades atuais que destacam as informações provenientes de fontes confiáveis, tais como meios de comunicação social, nos resultados de pesquisa, na página inicial e no painel "A seguir".
Lidar com conteúdo prejudicial
As nossas políticas determinam o que não é permitido no YouTube e aplicam-se a todo o conteúdo - independentemente do idioma ou do ponto de vista político. Temos políticas rigorosas contra o discurso de incitamento ao ódio, contra o assédio e ciberbullying, contra o incitamento a conteúdo violento e contra certos tipos de desinformação eleitoral. Por exemplo, removemos conteúdos que induzam em erro os eleitores sobre como votar ou que incentivem a interferência no processo democrático.
A nossa equipa global de revisores, com recurso a uma combinação com a tecnologia de aprendizagem de máquina, aplica estas políticas em grande escala, 24 horas por dia, 7 dias por semana. O nosso Intelligence Desk também tem trabalhado ao longo dos meses para estar à frente das questões e tendências emergentes que poderão afetar as eleições da UE, tanto dentro como fora do YouTube. Isto ajuda as nossas equipas de aplicação das políticas a abordar estas potenciais tendências antes que se tornem problemas mais graves.
Em 2023, removemos mais de 35.000 vídeos que foram carregados a partir da União Europeia por violarem as nossas políticas de desinformação.
Para além de remover conteúdo que viole as nossas políticas, também acompanhamos a percentagem de visualizações do conteúdo que viola políticas no YouTube antes do mesmo ser removido. No quarto trimestre de 2023, este conteúdo representou 0,11% - 0,12% das visualizações na nossa plataforma, o que significa que em cada 10.000 visualizações no YouTube, entre 11 e 12 eram conteúdos que violavam as nossas Regras da Comunidade. Vamos continuar a investir neste trabalho, em que a IA ajuda a aumentar ainda mais a velocidade e a precisão dos nossos sistemas de moderação de conteúdo.
Reforçar a transparência no que diz respeito ao conteúdo gerado por IA
Esta é uma área crítica na qual temos vindo a investir há algum tempo. Todo o conteúdo carregado no YouTube está sujeito às nossas Regras da Comunidade, independentemente de como é gerado. Também temos políticas de longa data que proíbem conteúdo tecnicamente manipulado que induza em erro os espectadores e que constitua um risco sério de danos graves. E exigimos que os anunciantes divulguem quando os seus anúncios eleitorais incluem materiais alterados ou gerados digitalmente.
Combater as campanhas de desinformação
Operações de influência coordenadas não são permitidas no YouTube, independentemente dos pontos de vista políticos que apoiam. Trabalhamos em estreita colaboração com o Grupo de Análise de Ameaças (TAG) da Google para identificar estes tipos de campanhas no YouTube e encerrar os seus canais. Isto pode incluir tentativas de interferência nas eleições. Por exemplo, tal como a TAG partilhou, antes das recentes eleições portuguesas, encerrámos 7 canais do YouTube ligados a indivíduos na Argentina no âmbito das nossas investigações em curso sobre as campanhas de desinformação. Através do TAG, também partilhámos informações sobre as ameaças com autoridades policiais, tais como a EUROPOL.
Promover competências em literacia mediática
Para ajudar os espectadores a avaliar o conteúdo que veem e que partilham, lançámos, em 2022, a campanha de literacia mediática HitPause. A série de vídeos, que está disponível em todas as línguas oficiais da UE, disponibiliza dicas sobre como identificar diferentes táticas de manipulação — desde o uso de linguagem emocional até a compreensão do potencial do impacto do que cada um de nós partilha com as outras pessoas online.
Vamos continuar a trabalhar em conjunto com os governos, com a indústria e ONGs em toda a União Europeia e não só nestes esforços, e não apenas em períodos eleitorais. À medida que entramos no último mês da campanha de 2024, equipas dedicadas do YouTube e da Google irão continuar a aperfeiçoar e a melhorar estes esforços, tendo sempre em mente o nosso objetivo principal: ligar as pessoas a conteúdo de alta qualidade e a proteger a nossa plataforma.
Publicado por The YouTube Team
Chegou o Google Pixel 8a! Alimentado pelo nosso mais recente chip Google Tensor G3, está equipado com muitas das funcionalidades de IA imprescindíveis do Pixel 8 e do Pixel 8 Pro, tais como o Melhor Take, Borracha Mágica de Áudio e muito mais. Projetado para capturar fotos incríveis, economizar tempo e manter o utilizador e seus entes queridos seguros, o Pixel 8a oferece um valor imbatível a partir de €559.
Cores divertidas e um design moderno
O design refinado da nossa Série A adapta-se ainda melhor às suas mãos ostentando cantos arredondados, uma traseira fosca e uma estrutura em alumínio polido. O seu design resistente pode resistir a quedas, água e poeiras, tornando o Pixel 8a no telefone da série A mais resistente até hoje. Além disso, o novo ecrã Actua é 40% mais brilhante que o ecrã do Pixel 7a, e uma taxa de atualização mais rápida de 120 Hz torna o scrolling mais suave.
Existem duas novas cores na série A: Aloe (cor de edição limitada!) e Azul Baía. O utilizador também pode escolher uma das nossas opções de cores neutras: Obsidiana ou Porcelana. E pela primeira vez, existe a opção de maior capacidade de armazenamento de 256 GB, oferecendo mais espaço para o seu conteúdo favorito.
Fotografia incrível de uma forma simples
Classificada como a melhor câmara fotográfica em smartphones da sua categoria, o Pixel 8a apresenta uma câmara dupla poderosa com uma lente principal de 64 megapixels e uma lente ultra grande angular de 13 megapixels. O Pixel 8a também vem equipado com uma câmara frontal de 13 megapixels, com um amplo campo de visão para caber ainda mais nas suas fotos.
Graças ao Google Tensor G3, o Pixel 8a está equipado com ferramentas de IA para possibilitar tirar o máximo partido das suas fotos e vídeos:
A IA da Google torna ainda mais fácil realizar tarefas
O Pixel 8a foi projetado para ajudar o utilizador a realizar as tarefas do seu dia a dia com mais facilidade. Equipado com funcionalidades que ajudam a poupar tempo, o utilizador pode passar mais tempo a fazer as coisas que são mais importantes para si.
A funcionalidade Circundar para Pesquisar também está presente no Pixel 8a, para que o utilizador não precise mais de andar a trocar de aplicação para encontrar a informação que procura – poupando assim o seu tempo. Basta usar o dedo para desenhar um círculo, rabiscar ou tocar numa imagem, texto ou vídeo para pesquisar por aquilo que está a ver. E as funcionalidades do Assistente de Chamadas no Pixel com tecnologia de IA – tais como o Filtro de Chamadas, a Direct My Call, Colocar em Espera e as Chamadas Nítidas - também estão incluídas no Pixel 8a.
Pretende planear uma viagem? O Maps ajuda-o a descobrir verdadeiros tesouros escondidos e a criar o itinerário perfeito. Mergulhe no seu futuro destino com a deslumbrante Vista Imersiva – explore virtualmente antes mesmo de estar no local! E assim que chegar, o Lens será a sua janela para o mundo. Tire uma foto de um monumento histórico para desvendar os seus segredos ou traduza o menu do restaurante num ápice.
Enquanto isso, o widget Resumo do Google Pixel irá mantê-lo no caminho certo, colocando as informações essenciais diretamente no ecrã de bloqueio. Pode encontrar informações e atualizações, como tarefas, informações meteorológicas e eventos futuros sem desbloquear o telefone.
O Pixel 8a irá ter também Audio Emojis, tornando as suas chamadas mais expressivas e envolventes. Com os Audio Emojis, basta tocar num emoji para desencadear uma reação de áudio e um efeito visual. Experimente usar um emoji de palmas para aplaudir um trabalho bem executado ou o emoji de rir depois de contar sua melhor piada.
O Próximo Nível da Segurança
A segurança e proteção são sempre uma prioridade máxima. Semelhante ao Pixel 8 e 8 Pro, este telefone é construído com o mais recente chip Google Tensor G3, tornando-o o telefone Pixel da série A mais rápido e seguro até ao momento. O Pixel 8a funciona com o chip de segurança certificado Titan M2 para proteção adicional, tornando-o ainda mais resiliente contra ameaças.
E o Pixel 8a estará seguro e protegido graças aos sete anos de suporte de software, incluindo as atualizações de segurança e as atualizações do Android. Além disso, o utilizador vai poder beneficiar de todas as novas funcionalidades e melhorias nos próximos Features Drops.
Tenha acesso ao Pixel 8a e aos outros dispositivos Pixel, a partir de hoje
O Pixel 8a está disponível a partir de €559 com o período de pré-encomendas a iniciar-se hoje. Compre um Pixel 8a (mediante disponibilidade) entre o dia 7 de maio (17h) e 3 de junho de 2024 (23h59) num retalhista oficial e na troca de um telefone qualificado receba mais €150 além do valor negociado do seu telefone.
Além disso, se comprar, entre 7 e 14 de maio, um Pixel 8a na Vodafone recebe de oferta uma capa para o telefone. Na Worten, por sua vez, terá um desconto de 50% na compra dos Pixel Buds A.
Publicado por Soniya Jobanputra, Director, Product Management