Alguma vez se perguntou como é que a Google entende o que está a procurar? Há muita coisa envolvida na disponibilização dos resultados de pesquisa úteis, e entender o idioma é um dos requisitos mais importantes. Graças aos avanços em IA e machine learning, estamos mais próximos do que nunca de entender a linguagem humana. Achamos que seria útil partilhar um olhar aos bastidores de como isto se traduz em melhores resultados para o utilizador.
Mas primeiro, vamos voltar aos primórdios: nos primeiros dias da Pesquisa, antes de termos a IA avançada, os nossos sistemas simplesmente procuravam palavras correspondentes. Por exemplo, se o utilizador pesquisasse por “pziza” – a menos que houvesse uma página com este erro ortográfico específico, seria provável que o utilizador tivesse que refazer a pesquisa escrevendo a palavra de forma correcta para encontrar uma fatia perto de si. E, eventualmente, aprendemos a codificar algoritmos para encontrarem classes de padrões – como erros ortográficos populares ou possíveis erros de digitação de palavras semelhantes – para ajudar a fazer essa correção. Agora, através do machine learning avançado, os nossos sistemas podem reconhecer de forma mais intuitiva se uma palavra não parece estar correta e a sua possível correção.
Este tipo de desenvolvimento da IA nos nossos sistemas de Pesquisa significa que eles estão a melhorar constantemente para entender o que o utilizador está a procurar. E como as curiosidades do mundo e das pessoas estão sempre a evoluir é muito importante que a Pesquisa acompanhe a tendência. De facto, 15% das pesquisas diárias são totalmente novas. A IA desempenha um papel importante para mostrar resultados úteis, mesmo nos limites da sua imaginação.
Como os nossos sistemas funcionam em conjunto
Desenvolvemos centenas de algoritmos ao longo dos anos, como o nosso sistema de ortografia inicial, para ajudar a disponibilizar resultados de pesquisa relevantes. Quando desenvolvemos os novos sistemas de IA, os nossos algoritmos e sistemas anteriores não são simplesmente arquivados. Na verdade, a Pesquisa corre em centenas de algoritmos e modelos de machine learning, e podemos aperfeiçoá-la quando os nossos sistemas - novos e antigos - funcionam em conjunto. Cada algoritmo e modelo tem uma função específica mas eles são acionados em momentos diferentes e em combinações distintas para ajudar a disponibilizar os resultados mais úteis. E alguns dos nossos sistemas mais avançados podem desempenhar um papel mais proeminente do que outros. Vamos espreitar os principais sistemas de IA que atualmente correm na Pesquisa e o que fazem.
RankBrain — um sistema de classificação mais inteligente
Quando lançámos o RankBrain em 2015, ele foi o primeiro sistema de aprendizagem profunda implementado na Pesquisa. Na altura, foi inovador – não só porque foi o nosso primeiro sistema de IA, mas porque ajudou-nos a entender como as palavras estão relacionadas com os conceitos. Isto é algo que os humanos entendem instintivamente, mas é um desafio complexo para um computador. O RankBrain ajuda-nos a encontrar informações que não conseguiríamos anteriormente, entendendo mais amplamente como as palavras numa pesquisa se relacionam com os conceitos do mundo real. Por exemplo, se o utilizador pesquisar "qual é o nome do consumidor que está no topo da cadeia alimentar", os nossos sistemas aprendem ao ver essas palavras em várias páginas que o conceito de uma cadeia alimentar pode estar relacionado com animais, e não com consumidores humanos. Ao entender e a corresponder estas palavras com os seus conceitos relacionados, o RankBrain ajuda-nos a entender que o utilizador está a pesquisar por “Superpredador”, a expressão frequentemente utilizada.
Graças a este tipo de compreensão, o RankBrain (como o próprio nome sugere) é usado para ajudar a hierarquizar – ou a decidir a melhor ordem para – os principais resultados de pesquisa. Embora tenha sido o nosso primeiro modelo de aprendizagem profunda, o RankBrain continua a ser um dos principais sistemas de IA que alimentam, hoje, a Pesquisa.
Correspondência neural — um mecanismo de recuperação sofisticado
As redes neurais sustentam, atualmente, muitos sistemas modernos de IA. Mas foi só em 2018, quando introduzimos a correspondência neural na Pesquisa, que pudemos usá-los para nos ajudarem a entender melhor como as perguntas se relacionam com as páginas. A correspondência neural ajuda-nos a entender representações mais difusas de conceitos em perguntas e páginas e a combiná-las umas com as outras. É possível fazê-lo porque ele analisa uma pergunta ou página inteira em vez de apenas palavras-chave, desenvolvendo uma melhor compreensão dos conceitos subjacentes representados nelas. Por exemplo, na pesquisa “insights de como gerir um verde". Se um amigo lhe perguntasse isto, provavelmente o utilizador ficaria perplexo. Mas com a correspondência neural, somos capazes de entender esta pesquisa intrigante. Ao observar as representações mais amplas de conceitos na pergunta - gestão, liderança, personalidade e muito mais - a correspondência neural pode decifrar que determinada pessoa está a pesquisar por dicas de gestão com base num guia popular de personalidade através das cores.
Quando os nossos sistemas entendem os conceitos mais amplos representados numa pergunta ou página, estão em melhores condições para corresponderem um ao outro. É este nível de compreensão que nos ajuda a lançar uma ampla rede quando examinamos o nosso índice de conteúdos que possa ser relevante para a sua pesquisa. É isso que torna a correspondência neural uma parte tão crítica de como recuperamos documentos relevantes de um fluxo de informações enorme e em constante mudança.
BERT — um modelo para entender o significado e o contexto
Lançado em 2019, o BERT foi uma grande mudança na compreensão da linguagem natural, ajudando-nos a entender como as combinações de palavras expressam diferentes significados e intenções. Em vez de simplesmente procurar conteúdo que corresponda a palavras individuais, o BERT permite-nos compreender como uma combinação de palavras expressa uma ideia complexa. O BERT entende as palavras numa sequência e como se relacionam umas com as outras de modo a que excluamos palavras importantes da sua pesquisa - não importa quão pequenas elas sejam. Por exemplo, se o utilizador pesquisar "pode-se comprar medicamentos para alguém na farmácia", o BERT ajuda-nos a entender que o utilizador está a tentar descobrir se pode comprar medicamentos para outra pessoa. Antes do BERT, não dávamos o mesmo valor a esta preposição curta, principalmente ao revelar resultados sobre como preencher uma receita. Graças ao BERT, entendemos que mesmo pequenas palavras podem ter grandes significados.
Hoje, o BERT desempenha um papel crítico em quase todas as pesquisas em inglês. Isto ocorre porque os nossos sistemas BERT destacam-se em duas das tarefas mais críticas na disponibilização de resultados relevantes – classificação e recuperação. Com base na sua compreensão de linguagem complexa, o BERT é capaz de classificar documentos muito rapidamente pela respetiva relevância. Também melhoramos os sistemas anteriores com treino BERT, tornando-os mais úteis na recuperação de documentos relevantes para hierarquização. E embora o BERT desempenhe um papel importante na Pesquisa, nunca funciona sozinho — como todos os nossos sistemas, o BERT faz parte de um conjunto de sistemas que trabalham juntos para apresentar resultados de alta qualidade.
MUM — passando da linguagem para a compreensão da informação
Em maio, apresentamos o nosso mais recente marco de IA na Pesquisa – o Multitask Unified Model (MUM) Mil vezes mais poderoso que o BERT, o MUM é capaz de entender e gerar linguagem. Ele é treinado em 75 idiomas diferentes e em muitas tarefas diferentes ao mesmo tempo, permitindo que desenvolva uma compreensão mais abrangente das informações e do conhecimento do mundo. O MUM também é multimodal, o que significa que pode entender informações em vários modos, como texto, imagens e muito mais no futuro.
Embora ainda estejamos nos primeiros dias para explorar o potencial do MUM, já o usamos para melhorar as pesquisas de informações sobre a vacina COVID-19 e estamos ansiosos por oferecer maneiras mais intuitivas de pesquisar usando uma combinação de texto e imagens no Google Lens nos próximos meses. Estas são aplicações muito especializadas - e o MUM não é usado atualmente para ajudar a hierarquizar e a melhorar a qualidade dos resultados de pesquisa da mesma forma que os sistemas RankBrain, correspondência neural e BERT.
À medida que introduzirmos mais experiências com a tecnologia MUM na Pesquisa, vamos começar a mudar da compreensão avançada de linguagem para uma compreensão mais subtil das informações sobre o mundo. E como em todas as melhorias na Pesquisa, qualquer aplicação MUM passará por um rigoroso processo de avaliação, com especial especial para a aplicação responsável da IA. E quando estes novos sistemas são implementados, juntam-se aos sistemas que funcionam em grupo para tornarem a Pesquisa útil.