Décadas de pesquisa levaram ao rápido e atual progresso da IA - hoje estamos a anunciar três novas formas como as pessoas podem ser beneficiadas.
Tive um primeiro contato com as redes neurais quando era estudante universitário em 1990. Nesse período, muitas pessoas da comunidade de IA estavam entusiasmadas com o potencial das redes neurais, que eram impressionantes, mas nessa altura ainda não conseguiam realizar tarefas importantes do mundo real. Eu também estava super entusiasmado! Fiz a minha tese sobre a utilização de computação paralela para treinar as redes neurais a pensar que precisávamos apenas de 32 vezes mais poder de computação para chegar a este objetivo. Eu estava demasiado longe. Naquela altura precisávamos de 1 milhão de vezes mais de poder computacional.
21 anos depois, com um poder computacional exponencialmente maior, era a altura de dar outro impulso às redes neurais. Em 2011, eu e outros colegas na Google começámos a treinar redes neurais extensas usando milhões de frames selecionados aleatoriamente de vídeos do YouTube. Os resultados foram
impressionantes. Sem treino explícito, o sistema aprendeu automaticamente a reconhecer objetos diferentes (especialmente gatos, o YouTube está cheio de gatos). Esta foi uma descoberta transformadora em IA entre uma longa série de sucessos que ainda estão em curso – na Google e em outros locais.
Partilho a minha própria história em redes neurais para ilustrar que, embora o progresso na IA possa, atualmente, parecer especialmente rápido, a verdade é que vem de um longo arco de progresso. Na verdade, antes de 2012, os computadores tinham muita dificuldade em ver, ouvir ou entender a linguagem falada ou escrita. Nos últimos 10 anos, fizemos um
progresso especialmente rápido em IA.
Hoje, estamos empolgados com os muitos avanços recentes em IA que a Google está a liderar – não apenas do lado técnico, mas na implementação responsável de formas que ajudam as pessoas em todo o mundo. Isto significa implementar a IA na
Google Cloud, nos nossos produtos, desde os
smartphones Pixel à
Pesquisa Google, e em muitos campos da ciência e outros empreendimentos humanos.
Estamos conscientes dos desafios e dos riscos que a IA representa como uma tecnologia emergente. Fomos a primeira grande empresa a lançar e a operacionalizar um conjunto de
Princípios de IA, e segui-los (e alguns podem pensar nisto de forma contraintuitiva) permitiu-nos focar em fazer progressos rápidos em tecnologias que podem ser úteis para todos. Fazer IA de uma forma correta precisa de ser um esforço coletivo – envolvendo não apenas investigadores, mas de especialistas de domínios, programadores, membros da comunidade, empresas, governos e cidadãos.
Estou feliz por fazer anúncios em três áreas transformadoras da IA: primeiro, utilizar a IA para tornar a tecnologia acessível em muitos outros idiomas. Em segundo lugar, explorar como a IA pode reforçar a criatividade. E em terceiro, em IA em prol do bem social, incluindo a adaptação climática.
1. Suporte a 1.000 idiomas com IA
A linguagem é fundamental para a forma como as pessoas se comunicam entre si e dão sentido ao mundo. Portanto, não é surpresa que também seja a maneira mais natural das pessoas se envolverem com a tecnologia. Mais de 7.000 idiomas são falados em todo o mundo mas apenas alguns estão, hoje, bem representados online. Isto significa que as abordagens tradicionais de treino de modelos de linguagem em texto da web não conseguem capturar a diversidade da forma como nos comunicamos entre nós e de forma global. Isto tem sido historicamente um obstáculo na busca da nossa missão de tornar as informações do mundo universalmente acessíveis e úteis.
É por isso que, hoje, estamos a anunciar o projecto 1.000 Languages Initiative, um compromisso ambicioso de construir um modelo de IA que dará suporte aos 1.000 idiomas mais falados, trazendo maior inclusão a milhares de milhões de pessoas em comunidades marginalizadas em todo o mundo. Este será um empreendimento de muitos anos – alguns podem até chamar o projeto de moonshot – mas já estamos a dar passos significativos neste processo e a visualizar claramente o caminho. A tecnologia está a mudar rapidamente, desde a maneira como as pessoas a usam até ao que ela é capaz de fazer. Vemos cada vez mais pessoas a encontrar e a partilhar informação através de novas modalidades, como imagens, vídeos e conversação. E os nossos modelos de linguagem mais avançados são multimodais, o que significa que são capazes de desbloquear informações em vários formatos diferentes. Com estas mudanças gigantescas, surgem novas oportunidades.
Como parte da nossa iniciativa e do nosso foco na multimodalidade, desenvolvemos um Modelo de Conversação Universal — ou USM — que suporta mais de 400 idiomas, tornando-o na maior cobertura de linguagem vista num modelo de conversação até hoje. À medida que expandimos este trabalho, estamos a estabelecer parcerias com comunidades em todo o mundo para obter dados de conversação representativos.
Recentemente, anunciámos a digitação por voz para mais nove idiomas africanos no Gboard, trabalhando em estreita colaboração com investigadores e organizações em África para criar e publicar dados. E no sul da Ásia, estamos a trabalhar ativamente com os governos locais, ONGs e instituições académicas para recolher, eventualmente, amostras de áudio representativas de todos os dialetos e idiomas das regiões.
2. Capacitar criadores e artistas com IA
Os modelos geradores baseados em IA têm o potencial de libertar a criatividade, ajudando as pessoas de todas as culturas na sua expressão através de vídeo, imagens e design de uma forma que anteriormente não era possível.
Os nossos investigadores têm trabalhado arduamente no desenvolvimento de modelos que lideram em termos de qualidade com imagens geradas a serem preferidas pelos avaliadores humanos às de outros modelos. Recentemente, partilhamos avanços importantes, incluindo o nosso modelo de difusão aplicado a sequências de vídeo, e o modelo que gera vídeos longos e coerentes para uma sequência de prompts de texto. Podemos juntar estas duas técnicas para produzir vídeos e pela primeira vez estamos, hoje, a partilhar vídeos de super-resolução gerados por IA:
Em breve, vamos trazer as nossas tecnologias de geração de texto para imagem para o AI Test Kitchen, que proporciona uma maneira de as pessoas aprenderem, experimentarem e darem opinião sobre a tecnologia de IA emergente. Estamos ansiosos para ouvir a opinião dos utilizadores sobre estas demos na AI Test Kitchen - Segunda temporada. O utilizador poderá construir cidades temáticas com “City Dreamer” e criar personagens monstruosas amigáveis que se podem mover, dançar e saltar com “Wobble” — tudo isto utilizando prompts de texto.
Além das imagens 2D, o texto para 3D é, agora, uma realidade com o DreamFusion que produz um modelo tridimensional que pode ser visualizado a partir de qualquer ângulo e pode ser composto em qualquer ambiente 3D. Os investigadores também estão a fazer progressos significativos no espaço de geração de áudio através do AudioLM, um modelo que aprende a gerar um discurso realista e música de piano apenas a partir da audição do áudio. Da mesma forma que um modelo de linguagem pode prever as palavras e frases que se seguem a um prompt de texto, o AudioLM pode prever quais os sons que se devem seguir após alguns segundos de um prompt de áudio.
Estamos a colaborar com comunidades criativas a nível global à medida que desenvolvemos estas ferramentas. Por exemplo, estamos a trabalhar com escritores recorrendo ao Wordcraft, que é construído com base no nosso sistema de diálogo LaMDA de última geração, para experimentar a geração de texto com inteligência artificial. O utilizador pode ler o primeiro volume destas histórias no
Wordcraft Writers Workshop.
3. Enfrentar as mudanças climáticas e os desafios de saúde com IA
A IA também tem também um grande potencial para mitigar os efeitos das mudanças climáticas, inclusive ajudar as pessoas na adaptação a novos desafios. Um dos piores são os incêndios florestais, que afetam hoje centenas de milhares de pessoas e estão a aumentar em termos de frequência e de escala.
Hoje, tenho o prazer de partilhar que avançámos no uso de imagens de satélite para treinar modelos de IA para identificar e monitorizar incêndios florestais em tempo real, ajudando a prever como os mesmos podem evoluir e espalhar. Lançámos este sistema de monitorização de incêndios florestais na Austrália, EUA, Canadá e México e, desde julho, cobrimos mais de 30 grandes eventos de incêndios florestais nos EUA e Canadá, alcançando mais de 7 milhões de impressões na Pesquisa Google e no Maps para ajudar a informar os nossos utilizadores e equipas de combate a incêndios.
Também estamos a utilizar a IA para prever inundações, outro padrão climático extremo exacerbado pelas mudanças climáticas. Já
ajudamos comunidades a prever quando as inundações iriam ocorrer e a altura das águas — em 2021, enviamos 115 milhões de notificações de alerta de inundação para 23 milhões de pessoas através da Pesquisa Google e pelo Maps, ajudando a salvar inúmeras vidas. Hoje, estamos a partilhar que estamos a alargar a nossa cobertura para mais países da América do Sul (Brasil e Colômbia), África Subsaariana (Burkina Faso, Camarões, Chade, República Democrática do Congo, Costa do Marfim, Gana, Guiné, Malawi, Nigéria, Serra Leoa, Angola, Sudão do Sul, Namíbia, Libéria e África do Sul) e Sul da Ásia (Sri Lanka). Usamos uma técnica de IA chamada transferência de aprendizagem para fazê-la funcionar em áreas onde há menos dados disponíveis. Também estamos a anunciar o lançamento global do Google
Flood Hub, um novo modelo que exibe quando e onde podem ocorrer inundações. Vamos trazê-lo para a Pesquisa Google e para o Google Maps para ajudar mais pessoas a manterem-se em segurança em situações de cheias.
Por fim, a IA está a ajudar a proporcionar ainda mais acesso à saúde em regiões com poucos recursos. Por exemplo, estamos a estudar maneiras como a IA pode ajudar a ler e a analisar os resultados de dispositivos de ultrassom de baixo custo, fornecendo aos pais as informações necessárias na identificação de problemas no início da gravidez. Também estamos a planear continuar em parceria com prestadores de serviços de saúde e agências de saúde pública para expandir o acesso à triagem de retinopatia diabética através da nossa ferramenta Automated Retinal Disease Assessment (ARDA). Através da ARDA, examinamos com sucesso mais de 150.000 pacientes em países como a Índia, Tailândia, Alemanha, Estados Unidos e Reino Unido em uso implementado e estudos prospectivos - mais de metade, apenas em 2022. Além disso, estamos a explorar como a IA pode ajudar o seu telefone na detectação de frequências respiratórias e cardíacas. Este trabalho faz parte da visão mais ampla da Google Health, que inclui
tornar a saúde mais acessível para qualquer pessoa através de um smartphone.
Os nossos avanços na arquitetura de redes neurais, algoritmos de aprendizagem de máquina e novas abordagens de hardware para aprendizagem de máquina ajudaram a IA a resolver problemas importantes do mundo real para milhares de milhões de pessoas. Mas muito mais ainda está para vir. O que estamos a partilhar hoje é uma visão esperançosa no futuro – a IA está a permitir reimaginarmos como a tecnologia pode ser útil. Esperamos que se junte a nós à medida que exploramos estes novos recursos e usamos esta tecnologia para melhorar a vida das pessoas em todo o mundo.