O Google Tradutor quebra as barreiras linguísticas para ajudar as pessoas a conectarem-se e a compreenderem melhor o mundo à sua volta. Estamos sempre a aplicar as tecnologias mais recentes para que mais pessoas possam aceder a esta ferramenta: em 2022, adicionámos 24 novos idiomas usando a Tradução Automática Zero-Shot, onde um modelo de aprendizagem de máquina aprende a traduzir para outro idioma sem nunca ver um exemplo. E anunciámos a Iniciativa 1.000 Línguas, um compromisso para construir modelos de IA que vão oferecer suporte aos 1.000 idiomas mais falados no mundo.
Agora, estamos a usar a IA para expandir a variedade de idiomas suportados. Graças ao nosso grande modelo de linguagem PaLM 2, estamos a começar a implementar 110 novos idiomas no Google Tradutor, a nossa maior expansão de todos os tempos, incluindo o Português de Portugal.
Apoio à tradução para mais de 500.000.000 pessoas
Do cantonês ao Q'eqchi', estas novas línguas representam mais de 614 milhões de falantes, permitindo traduções para cerca de 8% da população mundial. Algumas são línguas importantes do mundo, com mais de 100 milhões de falantes. Outros são falados por pequenas comunidades de povos indígenas e alguns quase não têm falantes nativos mas esforços ativos de revitalização. Cerca de um quarto das novas línguas são de África e representam a nossa maior expansão de línguas africanas até à data, incluindo Fon, Kikongo, Luo, Ga, Swati, Venda e Wolof.
Eis alguns dos idiomas agora suportados no Google Tradutor:
Como escolhemos a variedade de idiomas
Há muito a considerar quando adicionamos novos idiomas ao Tradutor: tudo, desde as variedades que oferecemos até as grafias específicas que usamos.
As línguas têm uma imensa variação: variedades regionais, dialetos, diferentes padrões ortográficos. Na verdade, muitos idiomas não possuem um formato padrão, por isso é impossível escolher a variedade “certa”. A nossa abordagem tem sido priorizar as variedades mais usadas comumente em cada idioma. Por exemplo, o Romani é uma língua que possui muitos dialetos na Europa. Os nossos modelos produzem texto mais próximo do Southern Vlax Romani, uma variedade usada comumente online. Mas também mistura elementos de outros, como Northern Vlax e Balkan Romani.
O PaLM 2 foi uma peça-chave neste puzzle, ajudando o Tradutor a aprender com mais eficiência idiomas intimamente relacionados entre si, incluindo idiomas próximos do hindi, como Awadhi e Marwadi, e os crioulos franceses, como o crioulo das Seicheles e o crioulo das Maurícias. À medida que a tecnologia avança e continuamos a fazer parcerias com linguistas especializados e falantes nativos, apoiaremos, ao longo do tempo, ainda mais variedades linguísticas e convenções ortográficas.
Visite o nosso Centro de Ajuda para saber mais sobre os novos idiomas suportados. E comece a traduzir em tradutor.google.com ou na aplicação Google Tradutor para Android e iOS.
Publicado por Isaac Caswell, Software Engineer, Google Translate