Quando as recomendações do YouTube estão no seu melhor, elas ligam milhares de bilhões de pessoas em todo o mundo a um conteúdo que inspira, ensina e diverte de maneira única. Para mim, isso significa mergulhar em palestras que exploram as questões éticas que a tecnologia enfrenta hoje ou assistir aos destaques dos jogos de futebol americano da University of Southern California que me lembro de ver quando era criança. Para a minha filha mais velha, foi encontrar risos e uma comunidade com os Vlogbrothers. E para o meu filho mais velho, as recomendações foi uma melhor compreensão de álgebra linear através de explicadores com o 3Blue1Brown - com pausas para assistir a vídeos KSI.
Como o caso da minha família mostra, há um público para quase todos os vídeos e o trabalho do nosso sistema de recomendação é encontrar esse público. Pense em como seria difícil navegar por entre todos os livros numa biblioteca enorme sem a ajuda de bibliotecários. As recomendações geram uma quantidade significativa de audiência geral no YouTube, ainda mais do que as subscrições ou as pesquisas de canais. Passei mais de uma década no YouTube a desenvolver o nosso sistema de recomendações e estou orgulhoso por ver como ele se tornou parte integrante da experiência de todos no YouTube. Mas, com muita frequência, as recomendações são vistas como uma caixa preta misteriosa. Queremos que estes sistemas sejam compreendidos publicamente e, por isso, deixe-me explicar como eles funcionam, como eles evoluíram e porque tornámos a disponibilização de recomendações responsáveis a nossa principal prioridade.
O que é um sistema de recomendação?
O nosso sistema de recomendação baseia-se no princípio simples de ajudar as pessoas a encontrar os vídeos que desejam assistir e isso cria-lhes valor. Um utilizador pode encontrar recomendações em dois locais principais: na sua página inicial e no painel “seguinte”. Na página inicial é o que o utilizador vê quando abre o YouTube pela primeira vez — ela exibe uma mistura de recomendações personalizadas, subscrições e as últimas notícias e informações. O painel “seguinte” surge quando está a assistir a um vídeo e sugere conteúdo adicional com base no que está a assistir no momento em conjunto com outros vídeos que achamos que poderá estar interessado.
Em 2008, quando começámos a construir o nosso sistema de recomendação, a experiência era totalmente diferente. Imaginemos que assistia principalmente a vídeos de culinária. Não seria frustrante se na sua página inicial apenas lhe recomendassem vídeos de música e de desporto mais recentes porque eles tinham tido o maior número de visualizações? Isto foi o YouTube nos primeiros dias. O sistema classificava os vídeos com base na popularidade para criar uma grande página de “Tendências”. Não havia muita gente a assistir a estes vídeos e a maioria das visualizações do YouTube vinham das pesquisas ou da partilha de links na plataforma.
Hoje, o nosso sistema classifica milhares de milhões de vídeos para recomendar conteúdo ajustado aos seus interesses específicos. Por exemplo, o nosso sistema reconheceu que eu assisti a um destaque de um clássico de futebol americano e descobriu para mim outros destaques desportivos da minha juventude. Sem recomendações, eu nunca saberia que estes vídeos estavam disponíveis. Ao contrário de outras plataformas, não conectamos os espectadores a conteúdos através de suas redes sociais. Em vez disso, o sucesso das recomendações do YouTube depende de uma previsão precisa dos vídeos que pretende assistir.
Para fazer isto, partimos do princípio de que todos têm hábitos de visualização únicos. O nosso sistema compara depois os seus hábitos de visualização com aqueles que lhe são semelhantes e usa essas informações para sugerir outro conteúdo que poderá querer assistir. Portanto, se gosta de vídeos de ténis e o nosso sistema percebe que outras pessoas que gostam dos mesmos videos de ténis também gostam de jazz, poderá recomendar-lhe vídeos de jazz (para as categorias como notícias e informações, isto pode funcionar de forma diferente - mais informação sobre isto para mais tarde) — mesmo que nunca tenha assistido a um único antes. Há alguns anos, o nosso sistema recomendou vídeos de Tyler Oakley à minha filha mais velha porque era isso que muitas das pessoas que assistiam Vlogbrothers também assistiam na época. Ela acabou por se tornar uma grande fã, tanto, que mais tarde levámo-la a um encontro com ele.
Mas, é claro, também sabemos que nem todas as pessoas desejam sempre partilhar estas informações conosco. Por isso, desenvolvemos controlos que o ajudam a decidir a quantidade de dados que deseja fornecer. Um utilizador pode pausar, editar ou excluir as suas pesquisas no YouTube e o seu histórico de exibição sempre que quiser.
Como personalizamos as recomendações
Para disponibilizar esta curadoria personalizada, o nosso sistema de recomendação não funciona com base num "livro de receitas" do que fazer. Ele está em constante evolução, aprendendo todos os dias a partir de 80 mil milhões de pedaços de informação a que chamamos sinais. É por isso que proporcionar mais transparência não é tão simples como listar uma fórmula para as recomendações, mas envolve entender toda a informação que alimenta o nosso sistema. Vários sinais complementam-se para ajudar a informar o nosso sistema sobre o que considera satisfatório: cliques, tempo de visualização, respostas a questionários, partilhas, gostos e não gosto.
Mas, como aprendemos em 2011, clicar num vídeo não significa que o viu na realidade. Digamos que está à procura dos destaques da partida de Wimbledon daquele ano. Desce a página e clica num dos vídeos, que tem uma miniatura e um título que sugerem que mostra a partida. Porém, é uma pessoa no seu quarto a falar sobre o jogo. Um utilizador clica num vídeo, o nosso sistema recomenda no painel “seguinte” apenas para encontrar outro fã a falar sobre o jogo. E clica repetidamente nesses vídeos até que seja recomendado um vídeo com o jogo que pretende assistir. É por isso que adicionámos o tempo de exibição em 2012.
Quando incorporámos, pela primeira vez, o tempo de visualização nas recomendações, observamos uma queda imediata de 20% nas visualizações. Acreditamos, no entanto, que era mais importante proporcionarmos mais valor aos espectadores. Ainda assim, nem todo tempo de visualização é igual. Por vezes, fiquei acordado até tarde, a assistir aleatoriamente a vídeos quando, em vez disso, poderia ter estado a aprender um novo idioma no YouTube ou a melhorar as minhas habilidades culinárias em conjunto com um criador. Não queremos que os espectadores se arrependam com o tempo que passam a assistir aos vídeos e percebemos que precisamos fazer ainda mais para medir o valor que obtém do seu tempo no YouTube.
É claro que nem todos respondem a um questionário sobre cada vídeo a que assistem. Com base nas respostas que recebemos, treinámos um modelo de Machine Learning para prever possíveis respostas a questionários para todos. Para testar a precisão destas previsões retemos propositadamente algumas das respostas da pesquisa do treino. Desta forma, estamos sempre a analisar o quão próximo o nosso sistema acompanha as respostas reais.
Porém, como nas recomendações, a importância de cada sinal depende de cada utilizador. Se for um que partilha qualquer vídeo que assiste, incluindo aqueles que classifica com uma ou duas estrelas, o nosso sistema saberá não levar muito em consideração as partilhas ao recomendar conteúdo. É por isto tudo que o nosso sistema não segue uma fórmula definida. Ela desenvolve-se dinamicamente conforme mudam os hábitos de visualização do utilizador.
Foco nas recomendações responsáveis
Cliques, visualizações, tempo de visualização, questionários, partilhas, gostos e não gosto funcionam muito bem para gerar recomendações para tópicos como música e entretenimento -- o que a maioria das pessoas vem assistir no YouTube. Mas, com o passar dos anos, um número crescente de espectadores vem ao YouTube em busca de notícias e informações. Quer sejam as últimas notícias ou estudos científicos complexos, estes tópicos são aqueles onde a qualidade da informação e o contexto são mais importantes. Alguém pode relatar que está muito satisfeito com os vídeos que afirmam que “a Terra é plana”, mas isto não significa que queremos recomendar este tipo de conteúdo de baixa qualidade.
É por isto que as recomendações desempenham um papel tão importante em como mantemos a plataforma responsável. Elas ligam os espectadores a informações de alta qualidade e minimizam a probabilidade de verem conteúdo problemático. E complementam o trabalho das nossas robustas Diretrizes da Comunidade que definem o que é ou não permitido no YouTube.
Usamos recomendações para limitar a ampla visualização de conteúdo de baixa qualidade desde 2011, quando criámos classificadores para identificar vídeos racistas ou violentos e impedimos que fossem recomendados. Mais tarde, em 2015, percebemos que o conteúdo sensacionalista dos tablóides estava a aparecer nas páginas iniciais e tomámos medidas para o despromover. Um ano depois, começámos a prever a probabilidade de um vídeo incluir menores em situações de risco e a removê-los das recomendações. E em 2017, para garantir que o nosso sistema de recomendação fosse justo para as comunidades marginalizadas, começámos a avaliar o Machine Learning que alimenta o nosso sistema para assegurar que é justo para grupos protegidos, como a comunidade LGTBQ +.
A ascensão da desinformação nos últimos anos levou-nos a expandir ainda mais as formas como usamos o nosso sistema de recomendações para incluir desinformação problemática e os conteúdos duvidosos -- ou seja, conteúdo que se aproxima, mas não viola totalmente as nossas Diretrizes da Comunidade. Isto inclui vídeos de teorias da conspiração (“a aterragem na lua foi falsificada”) ou outros conteúdos que espalham a desinformação (“sumo de laranja pode curar cancro”).
Estamos em condições de fazer isto usando classificadores para identificar se um vídeo é "oficial" ou "duvidoso". Estas classificações dependem de avaliadores humanos que avaliam a qualidade das informações em cada canal ou vídeo. Estes avaliadores vêm de todo o mundo e são treinados através de um conjunto de diretrizes de classificação detalhadas e disponíveis publicamente. Também contamos com especialistas certificados, como médicos, quando o conteúdo envolve informações de saúde.
Para determinar o grau de confiabilidade, os avaliadores respondem a algumas perguntas-chave. O conteúdo cumpre a sua promessa ou atinge o seu objetivo? Que tipo de conhecimento ou competência são necessárias para atingir o objetivo do vídeo? Qual é a reputação do interveniente no vídeo e do canal em que está? Qual é o tópico principal do vídeo (por exemplo, notícias, desporto, história, ciência etc.)? O conteúdo pretende ser uma sátira? Essas respostas e outras determinam o quão confiável é um vídeo. Quanto maior a pontuação, mais o vídeo é promovido quando se trata de notícias e conteúdo informativo. Para determinar o conteúdo que está na fronteira, os avaliadores avaliam fatores que incluem, mas não se limitam a, se o conteúdo é: impreciso, deturpado ou enganador; insensível ou intolerante; e prejudicial ou com potencial para causar danos. Os resultados são combinados para se obter uma pontuação sobre a probabilidade do vídeo conter informações incorretas prejudiciais ou que estão na zona limite. Qualquer vídeo classificado como duvidoso é rebaixado nas recomendações.
Estas avaliações humanas treinam depois o nosso sistema para modelar as suas decisões, e agora escalamos as suas avaliações para todos os vídeos no YouTube.
Respondendo a perguntas comuns sobre recomendações
As recomendações desempenham um papel fundamental em toda a nossa comunidade, apresentando aos espectadores o conteúdo que eles gostam e ajudando os criadores a ligarem-se a novos públicos. Para a sociedade como um todo, as recomendações poderão ser significativas para ajudar a impedir a disseminação da desinformação prejudicial. Porque, embora cliques, tempo de visualização, questionários a utilizadores, partilhas, gostos e não gosto sejam sinais importantes que informam o nosso sistema, eles podem ser anulados pelo nosso compromisso de cumprir a nossa responsabilidade com a comunidade do YouTube e com a sociedade.
Há ainda há algumas perguntas que me são regularmente dirigidas sobre o nosso sistema de recomendações e que acho importante responder:
1. É o conteúdo duvidoso aquele que tem o maior nível de envolvimento?
Na verdade, através dos questionários e comentários que recebemos, descobrimos que a maioria dos espectadores não quer receber recomendações de conteúdo duvidoso e muitos acham isso perturbador e desagradável. Na verdade, quando despromovemos conteúdo indecente ou do tipo tablóide, verificámos que o tempo de visualização, na verdade, aumentou 0,5% por cento ao longo de 2,5 meses, em relação ao período em que não estabelecemos nenhum limite.
Além disso, não vimos evidências de que o conteúdo duvidoso seja, em média, mais envolvente do que outros tipos de conteúdo. Considere-se o conteúdo de terraplanistas. Embora haja muito mais vídeos carregados que dizem que a Terra é plana do que aqueles que dizem que é redonda, os vídeos sobre a Terra plana têm, em média, muito menos visualizações. As pesquisas mostram que o conteúdo duvidoso satisfaz apenas uma pequena parte dos espectadores no YouTube. Investimos muito tempo e dinheiro para garantir que ele não encontra caminho para um público mais amplo através do nosso sistema de recomendações. Hoje, o conteúdo duvidoso obtém a maior parte das suas visualizações a partir de outras plataformas que estão ligadas ao YouTube.
2. O conteúdo duvidoso aumenta o tempo de visualização para o YouTube?
Para a grande maioria das pessoas, o conteúdo duvidoso não atinge o padrão de tempo considerado bem gasto no YouTube. É por isso que em 2019 começámos a despromover o conteúdo duvidoso nas recomendações, resultando numa queda de 70% no tempo de visualização de conteúdo duvidoso recomendado não subscrito nos EUA. Hoje, o consumo de conteúdo duvidoso que vem das nossas recomendações está significativamente abaixo de 1%.
3. As recomendações levam os espectadores a um conteúdo cada vez mais extremo?
Conforme expliquei, despromovemos ativamente as informações de baixa qualidade nas recomendações. Mas também demos o passo adicional de mostrar aos espectadores vídeos confiáveis sobre tópicos que podem interessá-los. Imaginemos que assisto a um vídeo sobre a vacina COVID-19. No meu painel Seguinte verei vídeos de fontes confiáveis como Vox e Bloomberg Quicktake e não verei vídeos que contenham informações falsas sobre vacinas (até à extensão em que nosso sistema pode detectá-los).
Ao lado de notícias e vídeos explicativos sobre a COVID-19, também receberei recomendações personalizadas de outros tópicos com base no meu histórico de visualização -- um sketch do Saturday Night Live ou TEDx Talk sobre o efeito Super Mario. Essa diversidade personalizada ajuda os espectadores a acederem a novos assuntos e formatos em vez do mesmo tipo de vídeo repetidamente.
Um número crescente de investigadores independentes têm investigado como as plataformas de tecnologia têm impacto no consumo de conteúdo borderline -- e enquanto continuam os estudos em curso -- artigos publicados recentemente concluem que as recomendações do YouTube não estão realmente a direcionar os espectadores para conteúdo extremo. Em vez disso, o consumo de notícias e conteúdo político no YouTube geralmente reflete preferências pessoais que podem ser vistas nos seus hábitos online.
4. O conteúdo duvidoso gera dinheiro?
Para começar, as nossas diretrizes já proíbem a monetização de muito conteúdo duvidoso. Muitos anunciantes disseram-nos que não querem ser associados a este tipo de conteúdo no YouTube e, muitas vezes, optam por não anunciar nele. Isto significa que cada vídeo duvidoso assistido é uma oportunidade de monetização perdida levando a uma perda real de receita para o YouTube. Da mesma forma, este tipo de conteúdo gera desconfiança e aumenta a preocupação não apenas com os parceiros de publicidade, mas com o público, a imprensa e os legisladores. A realidade é que, à medida que o nosso trabalho em termos de responsabilidade cresceu, também cresceu a nossa empresa e toda a economia dos criadores. A responsabilidade é boa para o negócio.
Com tudo isto, por que simplesmente não removemos conteúdo duvidoso?A desinformação tende a mudar e a evoluir rapidamente e, ao contrário de áreas como o terrorismo ou segurança infantil, muitas vezes, há falta de um consenso claro. Além disso, a desinformação pode variar dependendo da perspectiva pessoal e do seu contexto. Reconhecemos que, às vezes, isto significa deixar conteúdo controverso ou mesmo ofensivo. Portanto, continuamos concentrados fortemente na criação de recomendações responsáveis e a tomar medidas significativas para evitar que o nosso sistema recomende amplamente este conteúdo.
Tudo junto, todo o nosso trabalho de responsabilidade em torno das recomendações mostrou um impacto real. O tempo de visualização de notícias oficiais aumentou drasticamente e a visualização do conteúdo duvidoso diminuiu. Isto não significa que resolvemos os problemas -- significa apenas que precisamos de continuar a refinar e a investir nos nossos sistemas para continuar a melhorar. O nosso objetivo é ter visualizações de conteúdo duvidoso a partir de recomendações abaixo de 0,5% das visualizações totais no YouTube.
A missão do YouTube é dar a todos uma voz e mostrar-lhes o mundo. Isto fez uma enorme diferença na vida da minha própria família. Vídeos que trouxeram lições de tolerância e empatia tiveram um impacto profundo e positivo no caráter da minha filha mais velha. O meu filho ultrapassou os momentos difíceis nas suas aulas de álgebra linear. Aprendi uma quantidade significativa de contexto e nuances com palestras de líderes em ética em tecnologia. E o nosso compromisso com a abertura deu origem a novas vozes e ideias que de outra forma não teriam uma plataforma. Criadores como Marques Brownlee, MostlySane, ou NikkieTutorials inspiraram milhões com o seu conhecimento, ativismo e honestidade.
O nosso sistema de recomendação está a melhorar a cada dia graças ao feedback de todos vocês, mas, como sempre, pode ainda ficar melhor. A minha equipa e eu temos o compromisso de continuar este trabalho em curso e proporcionar-lhe a experiência mais útil e valiosa possível.