Muitas coisas têm nomes diferentes. Por vezes, é uma função da linguagem, mas às vezes é uma questão de tendências ou nuances culturais ou, simplesmente, em que parte do mundo estiver.
Um exemplo muito relevante é a COVID-19. À medida que as pessoas em todo o lado procuravam informação, tivemos que aprender a identificar todas as diferentes frases que as pessoas usaram para se referirem ao novo coronavírus para garantir que proporcionávamos informações de alta qualidade e oportunas de autoridades de saúde confiáveis como a Organização Mundial da Saúde e Centros de Controlo e de Prevenção de Doenças. Um ano depois, estamos a enfrentar um desafio semelhante com os nomes das vacinas. Só que, desta vez, temos uma nova ferramenta para ajudar: o Multitask Unified Model (MUM).
Compreender pesquisas por informações sobre vacinas
AstraZeneca, CoronaVac, Moderna, Pfizer, Sputnik e outras vacinas distribuídas amplamente têm nomes diferentes em todo o mundo - mais de 800, com base nas nossas análises. As pessoas que procuram informações sobre as vacinas poderão procurar por “Coronavaccin Pfizer”, “mRNA-1273,” “CoVaccine” - e a lista continua.
A nossa capacidade de identificar corretamente todos estes nomes é fundamental para levar às pessoas as informações mais recentes e confiáveis sobre a vacina. Mas identificar as diferentes maneiras como as pessoas se referem às vacinas em todo o mundo é uma tarefa humana que consome muito tempo e envolve centenas de horas.
Com o MUM, conseguimos identificar mais de 800 variações nos nomes de vacinas em mais de 50 idiomas numa questão de segundos. Depois de validar as descobertas do MUM, aplicamo-las à Pesquisa Google de modo a que pessoas encontrem informações oportunas e de alta qualidade sobre as vacinas COVID-19 em todo o mundo.
Transferência de conhecimento entre idiomas
O MUM conseguiu realizar, em segundos, um trabalho que deveria levar semanas graças às suas capacidades de transferência de conhecimento. O MUM consegue aprender e transferir conhecimento nos mais de 75 idiomas em que está treinado. Por exemplo, imagine que está a ler um livro; se dominar outros idiomas poderá partilhar noutros idiomas que fala o que aprendeu no livro - dependendo da sua fluência - uma vez que tem a compreensão do livro, algo que não é um idioma - ou uma tradução- dependente. O MUM transfere conhecimento entre idiomas de forma semelhante a esta.
De forma semelhante, com as suas capacidades de transferência de conhecimento, o MUM não precisa aprender uma nova competência ou capacidade em cada novo idioma - ele pode transferir o que aprendeu entre eles, ajudando-nos a escalar rapidamente as melhorias, mesmo quando não há muitos dados de treino para trabalhar. Isto deve-se, em parte, às eficiências da amostra do MUM - o que significa que o MUM requer muito menos entradas de dados do que nos modelos anteriores para realizar a mesma tarefa. No caso das vacinas, com apenas uma pequena amostra de nomes oficiais de vacinas, o MUM foi capaz de identificar rapidamente essas variações entre os idiomas.
Melhorando a Pesquisa Google com o MUM
Esta primeira aplicação do MUM ajudou-nos a obter informações críticas para os utilizadores em todo o mundo em tempo útil e estamos ansiosos por ver as inúmeras formas como o MUM pode tornar a Pesquisa mais útil para as pessoas no futuro. Os nossos testes iniciais indicam que o MUM será capaz de, não apenas, melhorar em muitos aspectos os nossos sistemas existentes, mas também irá ajudar-nos a criar formas, completamente novas, para pesquisar e explorar informações.