Existem muitas coisas envolvidas no desenvolvimento de um motor de pesquisa. Embora pareça algo bastante simples (o utilizador digita uma pergunta e nós encontramos resultados correspondentes), temos enfrentado muitos desafios técnicos profundos para tornar a Google naquilo que é hoje.
E a realidade é que a Pesquisa nunca é um problema resolvido. Os velhos desafios evoluem e surgem constantemente novos desafios — porque a Internet e o mundo estão sempre a mudar.
Então, vamos relembrar alguns dos maiores avanços tecnológicos que fizemos — e onde continuamos a ampliar os limites da inovação — à medida que vamos desenvolvendo e melhorando a Pesquisa Google.
Disponibilizar resultados de qualidade
É importante hierarquizarmos as informações não apenas com base no que é relevante para a sua consulta, mas também no que provavelmente será útil e confiável. Este insight foi o que diferenciou a Google desde o primeiro dia: o nosso algoritmo PageRank não levava apenas em consideração se as palavras de uma página correspondiam, mas analisava como os websites se relacionavam entre si, como se tratasse de uma pista para saber quais as páginas que eram importantes ou confiáveis.
Adaptamos as nossas técnicas ao longo dos anos à medida que a web tem evoluído e à medida que a tecnologia tem melhorado. Por exemplo, com o aumento da desinformação, desenvolvemos formas de compreender se determinados tópicos podem ser mais suscetíveis a conteúdos não fiáveis, tais como teorias da conspiração ou a desinformação médica e a orientar o nosso ranking rumo à autoridade e confiabilidade nesses momentos.
Fazemos centenas de milhar de avaliações de qualidade todos os anos para garantir que estamos a atingir os nossos altos padrões de qualidade. De forma regular, fazemos actualizações amplas nos nossos sistemas, as chamadas atualizações principais, bem como atualizações mais especializadas, tais como a nossa atualização de conteúdo útil, para continuar a apresentar resultados úteis.
Existem dimensões da qualidade da informação que continuam a evoluir e exigem novas abordagens. Por exemplo, um desafio conhecido são as lacunas de informação, também conhecidas por “vazios de dados”, nas quais poderá não estar disponível informação de alta qualidade. Criámos maneiras de mostrar avisos quando os tópicos estão a evoluir rapidamente ou quando não temos muita confiança na qualidade dos resultados, alertando as pessoas que devem analisar estes resultados com um maior escrutínio. Também investimos em outras ferramentas de literacia da informação que ajudam as pessoas a verificar as fontes e a obter contexto para avaliar o que estão a encontrar.
Decifrar o significado
A compreensão da informação – e em particular, a compreensão do significado por detrás das consultas das pessoas – tem sido uma área de foco crítica para a Google ao longo dos anos. No início, os nossos sistemas foram em grande parte desenvolvidos com base na simples correspondência de palavras. Mas foi aí que coisas como a ortografia se tornaram realmente importantes. Na altura, se o utilizador escrevesse algo errado, também encontraria páginas com a palavra errada! Por isso, desenvolvemos o nosso primeiro sistema de aprendizagem de máquina na Pesquisa para enfrentar este desafio.
Com o passar dos anos, os nossos sistemas tornaram-se muito mais sofisticados, compreendendo melhor os sinónimos e o contexto das palavras. Avanços como o Gráfico do Conhecimento ajudaram-nos a entender como as pessoas, os lugares e as coisas do mundo se relacionam entre si — entendendo mais o mundo como as pessoas o fazem — para que possamos disponibilizar exatamente o que o utilizador procura e até mesmo dar o próximo passo. Por exemplo, pesquisar o filme mais recente e obter informações sobre o elenco e o tempo de exibição, para além das salas de cinema perto do utilizador e os links para a compra dos bilhetes.
Grandes modelos de linguagem como o BERT, desenvolvidos pela equipa de Pesquisa da Google, ajudaram-nos a fazer grandes avanços na decifração de pesquisas em linguagem natural para podermos fornecer resultados mais relevantes em todos os idiomas usados em todo o mundo. Estes modelos podem aprender um idioma e aplicá-lo a outros para podermos devolver melhores resultados nos vários idiomas onde a Pesquisa é disponibilizada. E criámos ferramentas como o Google Tradutor para ajudar a quebrar as barreiras linguísticas para as pessoas, de forma a que possam compreender melhor a informação do mundo.
A mais recente tecnologia de IA generativa e grandes modelos de linguagem podem ajudar-nos a reimaginar a Pesquisa, a revelar novos tipos de perguntas e a transformar a forma como organizamos a informação. No momento, estamos a experimentar a aplicação da IA generativa na nossa experiência de Pesquisa através do Search Labs e estamos a atualizar rapidamente a experiência à medida que exploramos o que é possível.
Compreender imagens, vídeos e muito mais
Há tanta informação no mundo que não é texto e tantas formas de perguntar algo para além de digitarmos palavras na caixa de pesquisa.
Ao aplicar os mais recentes desenvolvimentos no processamento de linguagem natural (PNL), em 2008, disponibilizamos a capacidade de pesquisar com a voz do utilizador, tornando mais natural a pesquisa nos dispositivos móveis. Depois, levamos a pesquisa por voz mais além, através da capacidade de “trautear para pesquisar”, para todos aqueles momentos em que o utilizador tem uma música presa na cabeça, mas não sabe a letra para pesquisar.
Em 2015, os avanços na visão computacional tornaram possível pesquisar o que o utilizador vê com o Lens. Transformamos a câmara do seu smartphone numa forma de explorar e de fazer perguntas sobre o mundo ao seu redor para que o próprio utilizador possa aprender mais sobre aquela flor ou inseto que viu enquanto passeava pelo seu bairro. Atualmente, as pessoas fazem mais de 12 mil milhões de pesquisas visuais todos os meses através do Lens.
No ano passado, lançamos a multipesquisa, que melhorou estes recursos para permitir que o utilizador adicione texto às suas pesquisas visuais. Agora, é possível fazer coisas como tirar uma foto de um sofá que o utilizador goste, adicionar a palavra “cadeira” e o Google vai utilizar a imagem e a palavra para mostrar peças semelhantes para adicionar ao conjunto da sua sala de estar.
Detectar e parar o spam
Qualquer pessoa que já tenha olhado para a sua pasta de spam no e-mail pode constatar todo o trabalho necessário para manter esse lixo fora da sua caixa de entrada. Na Pesquisa, desenvolvemos sistemas avançados para combater o Spam da mesma forma. Sem as nossas proteções avançadas, os resultados da pesquisa ficariam obstruídos com informações completamente irrelevantes, tentativas de phishing e links para malware.
Estamos constantemente a desenvolver novas técnicas e a implementar atualizações nos nossos sistemas de ranking de proteção contra o spam. Contudo o Spam também se adapta e evolui, exigindo uma atenção constante por parte das nossas equipas.
Nos últimos anos, aplicamos novas técnicas baseadas na IA para detecção de spam, o que nos ajudou a manter os resultados de pesquisa acima de 99% livres de spam. Esta continua a ser uma grande área de investimento para nós: enquanto as pessoas acederem ao Google em busca de informação, os spammers vão tentar contornar as nossas proteções, por isso temos que permanecer vigilantes e um passo à frente.
Tornar a Pesquisa mais Segura
Ao longo dos anos, mantivemos um forte compromisso com os nossos princípios de maximizar o acesso à informação, ao mesmo tempo que ajudamos as pessoas a permanecerem seguras e sob controlo. O nosso objetivo é ajudar as pessoas a encontrar informação que esteja dentro dos limites legais de expressão, sem expô-las inadvertidamente a conteúdo prejudicial ou de baixa qualidade que não pediram para ver.
Abordámos esta questão através da expansão das nossas políticas de proteção para que as pessoas removam informações pessoais e sensíveis dos nossos resultados, e através da melhoria dos nossos sistemas de classificação tendo em mente a segurança e a inclusão.
Por exemplo, lançamos melhorias para reduzir a exibição de conteúdo explícito indesejado na Pesquisa e novas atualizações para desfocar imagens explícitas por defeito, além de melhorias no ranking para limitar o alcance de websites que usam práticas abusivas. Enquanto isso, atualizamos as nossas políticas para que as pessoas com menos de 18 anos possam ter as suas imagens removidas da Pesquisa e lançamos novas ferramentas, como Resultados sobre Si, para facilitar o controlo de como as suas informações pessoais aparecem nos resultados da Pesquisa.
Milhares de milhões de pessoas confiam na Google para obter informação, por isso há sempre algo mais que podemos fazer e novas perguntas nas quais podemos ajudar os utilizadores. É por isso que estamos sempre a trabalhar para tornar a Pesquisa melhor a cada dia que passa.
Publicado por Elizabeth Reid, Vice President & GM, Search