Acesse o menu principal

Por dentro do YouTube

O Sistema de Recomendações do YouTube

  • Por Cristos Goodrow
  • VP of Engineering At YouTube
  • 15.Set.2021
Uma análise mais aprofundada de como funciona o sistema de recomendação do YouTube.

Quando o sistema de recomendações do YouTube funciona perfeitamente, ele conecta bilhões de pessoas de todo o mundo a conteúdo que inspira, ensina e diverte. No meu caso, isso significa mergulhar numa palestra sobre as questões éticas relacionadas à tecnologia dos dias de hoje, ou assistir aos melhores momentos dos jogos de futebol americano da University of Southern California, que vi quando era criança. Para minha filha mais velha, encontrar esse conteúdo é gargalhar e ter uma comunidade com os Vlogbrothers. Já meu filho mais velho conseguiu, graças às recomendações do YouTube, entender melhor a álgebra linear com ajuda das animações do 3Blue1Brown – e intervalos, é claro, para assistir aos vídeos do KSI.

As recomendações são responsáveis por uma parcela considerável do total de visualizações no YouTube – mais até do que inscrições em canais ou pesquisas.

Minha família é um exemplo de que existe uma plateia para qualquer vídeo, e a tarefa do nosso sistema de recomendações é encontrar esse público. Imagine como seria difícil achar um livro numa biblioteca gigantesca sem a ajuda de um bibliotecário. As recomendações são responsáveis por uma parcela considerável do total de visualizações no YouTube – mais até do que inscrições em canais ou pesquisas. Eu trabalho há mais de uma década no YouTube construindo esse sistema de recomendações, e me orgulho de ver que ele se transformou numa parte fundamental da experiência de tanta gente nessa plataforma. No entanto, com frequência as recomendações são vistas como uma caixa misteriosa. Queremos que qualquer pessoa entenda como o sistema funciona, e por isso vou falar aqui sobre a evolução das recomendações com o passar do tempo e sobre a importância de nossa principal prioridade: oferecer recomendações responsáveis.

O que é um sistema de recomendações?

Recommendations on homepage

                                                Recomendações na Homepage

Nosso sistema de recomendações parte do princípio simples de ajudar as pessoas a encontrarem os vídeos que querem assistir e que ofereçam algo útil e interessante ao público. Existem dois lugares principais onde podemos observar o funcionamento das recomendações: na homepage de cada usuário e no painel “Próximo Vídeo”. Sua homepage é aquela que você vê quando abre o YouTube. Ela traz uma mistura de recomendações personalizadas, canais nos quais você está inscrito, últimas notícias e informações. Já o painel “Próximo Vídeo” aparece enquanto você assiste um vídeo. Ele sugere outros conteúdos com base no que você está assistindo no momento, além de indicações que possam ser de seu interesse.

Em 2008, quando começamos a criar nosso sistema de recomendações, a experiência era totalmente diferente. Digamos que você assistisse a muitos vídeos de culinária. Seria meio decepcionante abrir sua homepage e ver apenas recomendações de vídeos de esportes e música só porque eles têm mais visualizações, não é? Mas, no começo, era assim que o YouTube funcionava. O sistema classificava os vídeos com base na popularidade, e criava uma única grande página de “Tendências”. Pouca gente assistia aos vídeos dessa página, e a maior parte das visualizações no YouTube vinha de pesquisas ou links compartilhados fora da plataforma.

Recomendações em "Assista a Seguir"

                                       Recomendações em "Assista a Seguir"

Para fazer isso, partimos do fato de que diferentes usuários têm hábitos diferentes na hora de ver vídeos. Em seguida, nosso sistema compara os hábitos de uma pessoa aos de outros usuários que tenham gostos semelhantes, e usa essa informação para sugerir conteúdos que talvez interessem. Por isso, se você gosta de vídeos sobre jogos de tênis, e nosso sistema percebe que pessoas com esse mesmo gosto também costumam ver vídeos de jazz, pode ser que suas recomendações incluam conteúdos sobre esse gênero musical – mesmo que você nunca tenha visto um vídeo de jazz antes. (Para categorias de conteúdo como notícias e informações, o esquema pode ser diferente, e já já vou contar mais sobre isso). Há alguns anos, o sistema recomendou vídeos de Tyler Oakley para minha filha mais velha – porque, na época, muita gente que assistia Vlogbrothers também gostava de Tyler Oakley. Com isso, ela acabou se tornando fã dele – tão fã que chegamos a levá-la para conhecê-lo num evento.


Atualmente, nosso sistema “peneira” bilhões de vídeos para recomendar conteúdo baseado  nos interesses específicos de cada pessoa. Um exemplo: nosso sistema reconheceu que eu costumava assistir a um vídeo clássico com os melhores momentos do futebol americano da universidade, e encontrou conteúdos semelhantes com destaques de partidas dos meus tempos de juventude. Sem as recomendações, eu jamais teria descoberto que esses vídeos existiam. Ao contrário de outras plataformas, não conectamos os usuários a conteúdo por meio de redes sociais. Em vez disso, o sucesso das recomendações do YouTube depende de uma previsão precisa dos vídeos que cada pessoa deseja assistir.

Mas sabemos que nem todo mundo quer compartilhar esse tipo de informação com o YouTube. Por isso criamos controles que ajudam cada um a decidir quais dados está disposto a fornecer. A qualquer momento é possível pausar, editar ou deletar o histórico de vídeos assistidos e o histórico de pesquisa no YouTube.

HYTW History UI

Como personalizamos as recomendações

Recommendations timeline

Para oferecer essa curadoria sob medida, nosso sistema de recomendações não se baseia em uma fórmula pronta com instruções exatas sobre o que fazer. Ele está em constante evolução, aprende diariamente com mais de 80 bilhões de pedacinhos de informação – que chamamos de “sinais”. Justamente por isso, explicar o sistema de forma transparente não é tão simples quanto listar uma fórmula de recomendações. É preciso entender todos os dados que alimentam o sistema. Juntos, vários tipos de sinais ajudam a dizer ao sistema o que você gosta de assistir. Esses sinais incluem cliques, tempo assistindo, respostas a pesquisas, compartilhamentos, números de “gostei” e “não gostei”.


  • Cliques: Clicar num vídeo é um forte sinal de que a pessoa provavelmente vai gostar dele. Afinal de contas, ninguém clica numa coisa que não quer assistir.


No entanto, em 2011 descobrimos que apenas clicar no vídeo não necessariamente significava assisti-lo. Digamos que uma pessoa estivesse em busca dos melhores momentos de um jogo do torneio de Wimbledon daquele ano. O usuário desceria a página e clicaria num dos vídeos indicados na pesquisa – e esse vídeo teria uma imagem em miniatura e um título sugerindo conter imagens da partida. Mas, na verdade, era um vídeo de um cara sentado no próprio quarto, falando sobre o jogo. Aí a pessoa clicaria num vídeo que o sistema de recomendações coloca no painel “Próximo Vídeo” e descobriria que era mais um fã de tênis comentando o jogo. O usuário então sairia clicando e clicando, até finalmente chegar a uma recomendação de um vídeo que de fato contivesse imagens do jogo em questão. Por isso, em 2012 acrescentamos o sinal de “tempo assistido”.


  • Tempo assistido (watchtime): O tempo que você passa assistindo um vídeo – quais vídeos você vê e durante quantos minutos – envia ao sistema um sinal personalizado sobre o que é mais provável que você queira assistir. Ou seja: se aquele fã de tênis assistiu a vinte minutos dos melhores momentos de Wimbledon, mas apenas alguns segundos do fã sentado no quarto e comentando o jogo, dá para supor, sem medo de errar, que para aquela pessoa assistir às imagens do jogo é mais interessante do que os comentários do fã.


Logo que incorporamos o “tempo assistido” às recomendações, observamos uma queda imediata de 20% nas visualizações. Mesmo assim, acreditamos que o mais importante era oferecer aos usuários aquilo que interessa para eles. Ainda assim, nem todo o tempo que passamos assistindo a vídeos é igual. Já me aconteceu, por exemplo, de ficar acordado até tarde assistindo vídeos aleatórios no YouTube – quando, em vez disso, eu poderia ter aproveitado para aprender um novo idioma na plataforma ou uma receita nova com algum criador. Não queríamos que as pessoas se arrependessem de ter gasto tempo assistindo a determinados vídeos, e percebemos que era preciso trabalhar ainda mais para medir o valor do tempo que cada um passa no YouTube.


  • Respostas a pesquisas: Para ter mais certeza de que as pessoas gostam do conteúdo que assistem, medimos o que chamamos de “tempo valioso assistido”: é o tempo que a pessoa passa assistindo a um vídeo que considera importante de alguma maneira. Para medir o “tempo valioso assistido”, fazemos pesquisas com usuários e pedimos que eles classifiquem o vídeo com uma nota que vai de uma a cinco estrelas. Isso nos dá uma régua para saber o quanto as pessoas gostaram de cada conteúdo. Quando alguém dá uma ou duas estrelas, a gente pergunta por que a nota foi tão baixa. Da mesma maneira, se alguém dá cinco estrelas o YouTube pergunta por quê: foi inspirador? Foi significativo? Apenas vídeos classificados com quatro ou cinco estrelas são considerados tempo valioso pelo nosso sistema. 


Mas é claro que nem todo mundo participa dessa pesquisa toda vez que assiste a um vídeo. Com base nas respostas que recebemos, ensinamos um modelo de inteligência de máquina a prever respostas possíveis para todas as pessoas. Para testar a exatidão dessas previsões, nós propositalmente retiramos algumas respostas das pesquisas na hora de treinar o algoritmo. Com isso, monitoramos o tempo todo a precisão de nosso sistema na hora de rastrear respostas reais.  


  • Compartilhamentos, “gostei” e “não gostei”: Via de regra, as pessoas provavelmente estão mais satisfeitas com vídeos que compartilham ou nos quais clicam em “gostei”. Nosso sistema usa essa informação para tentar prever a probabilidade de um usuário compartilhar ou clicar em “gostei” em outros vídeos. Quando alguém clica em “não gostei”, isso é um sinal de que provavelmente a pessoa não gostou do que viu.


No entanto, à semelhança das recomendações que cada pessoa oferece, a importância desses sinais varia de um indivíduo para outro. Se você é do tipo que gosta de compartilhar tudo o que assiste (inclusive vídeos que classifica com uma ou duas estrelas), nosso sistema é capaz de saber que as recomendações que não devem dar um peso muito alto ao que você compartilha. É por tudo isso que o sistema não segue uma fórmula única para todos. Ele se desenvolve de forma dinâmica, acompanhando mudanças nos seus hábitos de assistir conteúdo. 

A importância de recomendações responsáveis


Cliques, visualizações, tempo assistido, pesquisas, compartilhamentos, “gostei” e “não gostei” são ótimos sinais para orientar as recomendações de assuntos como música e entretenimento – temas que a maioria das pessoas procura no YouTube. Com o passar dos anos, porém, um número cada vez maior de usuários passou a acessar a plataforma em busca de notícias e informações. Não importa se são notícias quentes ou estudos científicos complexos, é justamente no caso desses temas que a qualidade e o contexto da informação são mais importantes. Uma pessoa pode até dizer que gostou de um vídeo afirmando que “a Terra é plana”, mas isso não significa que o YouTube queira recomendar esse tipo de conteúdo de baixa qualidade.

Por isso as recomendações são muito importantes para garantir que a plataforma aja de forma responsável. Elas conectam as pessoas a informações confiáveis, e minimizam as chances de colocar usuários em contato com conteúdo problemático.

Por isso as recomendações são muito importantes para garantir que a plataforma aja de forma responsável. Elas conectam as pessoas a informações confiáveis, e minimizam as chances de colocar usuários em contato com conteúdo problemático. As recomendações também complementam o trabalho desempenhado pelas Diretrizes da Comunidade, que definem o que é e não é permitido no YouTube.

Desde 2011 nós usamos as recomendações para limitar a disseminação de conteúdo de baixa qualidade. Naquele ano, construímos os classificadores, que identificam vídeos racistas ou violentos e impedem que sejam recomendados. Depois, em 2015, notamos que conteúdo sensacionalista produzido por tabloides estava aparecendo na homepage, e tomamos medidas para acabar com isso. Um ano mais tarde, começamos a prever a probabilidade de um vídeo mostrar menores de idade em situações de risco, e retiramos esse conteúdo das recomendações. Já em 2017, para garantir que o sistema de recomendações fosse justo com comunidades marginalizadas, começamos a avaliar a inteligência de máquina que sustenta nosso sistema, para ver como ele age no caso de grupos protegidos – como pessoas LGTBQ+.


Nos últimos anos, o aumento da desinformação levou o YouTube a ampliar o uso do sistema de recomendações para identificar informações enganosas e problemáticas, e também conteúdo limítrofe – vídeos que cheguem muito perto de desrespeitar as Diretrizes da Comunidade, mesmo que não infrinjam de fato as regras. Isso inclui, por exemplo, vídeos contendo teorias conspiratórias (“o homem nunca pousou na Lua”) ou conteúdo que dissemina desinformação (“suco de laranja cura câncer”).

Fazemos isso graças a classificadores que identificam se um vídeo é “confiável” ou “limítrofe”. Essas classificações contam com avaliadores humanos que analisam a qualidade das informações em cada canal ou vídeo. Temos avaliadores espalhados pelo mundo, treinados para aplicar uma série de diretrizes detalhadas de classificação, disponíveis para o público. Também contamos com especialistas certificados, como médicos, no caso de conteúdo que traga informações da área de saúde.

Para determinar se um vídeo é confiável, os avaliadores respondem a algumas perguntas principais. O conteúdo entrega o que promete e cumpre seu objetivo? Que tipo de conhecimento especializado é necessário para atingir o objetivo do vídeo? Qual a reputação da pessoa que fala no vídeo e do canal que abriga o conteúdo? Qual o tema principal do vídeo (notícias, esporte, história, ciência, etc.)? O objetivo principal do conteúdo é ser humorístico? Essas respostas, e mais algumas outras, determinam se um vídeo é confiável. Quanto mais alta a pontuação, mais o vídeo é promovido no caso de notícias e informações.

Qualquer vídeo que seja classificado como limítrofe é retirado das recomendações.

Para determinar se um vídeo é limítrofe, os avaliadores analisam se o conteúdo é impreciso, enganoso, insensível, intolerante, danoso ou com potencial de prejudicar pessoas (e outros fatores além desses). Os resultados são combinados e formam uma pontuação que mostra a probabilidade do conteúdo conter desinformação prejudicial ou ser limítrofe. Qualquer vídeo que seja classificado como limítrofe é retirado das recomendações.

Em seguida, as avaliações feitas por seres humanos são usadas para treinar o sistema a tomar as próprias decisões – e agora essas avaliações são aplicadas a todos os vídeos do YouTube.


Perguntas comuns sobre o sistema de recomendações


As recomendações são muito importantes para toda a nossa comunidade. Graças a elas, as pessoas descobrem conteúdo de que gostam e os criadores ganham acesso a novos públicos. Para a sociedade como um todo, as recomendações ajudam a impedir a disseminação de desinformação prejudicial. Isso porque, embora cliques, tempo assistindo, pesquisas, compartilhamentos, “gostei” e “não gostei” sejam sinais importantes para ajudar nosso sistema, o que realmente importa é nosso compromisso de cumprir a responsabilidade que temos com a comunidade do YouTube e com a sociedade em geral.  

Existem mais algumas perguntas que costumo ouvir sobre o sistema de recomendações – e são perguntas importantes:


1. Conteúdo limítrofe gera mais engajamento?

Na verdade, as pesquisas e informações que fazemos e recebemos dos usuários mostram que as pessoas não querem receber recomendações de conteúdo limítrofe, e a maioria se aborrece e fica frustrada com esses vídeos. Quando passamos a retirar conteúdo indecoroso ou de tabloides, descobrimos que o “tempo assistido” aumentou 0,5% em dois meses e meio, comparado ao tempo assistindo na época em que não havia esse tipo de limitação.

 Além disso, não observamos evidências de que conteúdo limítrofe gere, na média, mais engajamento do que outros tipos de vídeo. Basta pensar em conteúdo produzido por quem afirma que a Terra é plana. Embora haja mais uploads de vídeos afirmando que a Terra é plana do que vídeos dizendo que a Terra é redonda, os vídeos de terraplanistas têm bem menos visualizações. Pesquisas mostram que conteúdo limítrofe agrada apenas uma parte muito pequena do público do YouTube. Fizemos investimentos consideráveis, de recursos financeiros e tempo, para garantir que esse tipo de vídeo não chegue a uma plateia mais ampla através do sistema de recomendações. Atualmente, a maior parte das visualizações de conteúdo limítrofe chega por meio de fontes de tráfego que não sejam as recomendações de conteúdo ao qual o usuário não seja inscrito. 


Por isso, em 2019 começamos a retirar conteúdo limítrofe das recomendações. De lá para cá, registramos, nos Estados Unidos, uma queda de 70% no tempo assistido a conteúdo limítrofe via recomendações, em canais nos quais os usuários não são inscritos.

2. O conteúdo limítrofe aumenta o tempo que as pessoas passam assistindo vídeos no YouTube?

Na imensa maioria dos casos, o conteúdo limítrofe não atinge o padrão que indica tempo bem gasto no YouTube. Por isso, em 2019 começamos a retirar conteúdo limítrofe das recomendações. De lá para cá, registramos, nos Estados Unidos, uma queda de 70% no tempo assistido a conteúdo limítrofe via recomendações, em canais nos quais os usuários não são inscritos. Atualmente, o consumo de conteúdo limítrofe que chega por meio das recomendações é inferior a 1%.


3. As recomendações levam as pessoas a ver conteúdo cada vez mais extremo?

Conforme expliquei, fazemos um trabalho pró-ativo de retirar informações de baixa qualidade das recomendações. Além disso, tomamos medidas adicionais, como mostrar aos usuários vídeos de fontes confiáveis sobre temas que possam ser de interesse. Digamos que eu assista a um vídeo sobre a vacina contra COVID-19. No meu painel “Próximo Vídeo”, estará uma lista de vídeos de fontes confiáveis, como Vox e Bloomberg Quicktake, e eu não verei nessa lista nenhum vídeo que contenha informações enganosas sobre vacinas (desde que nosso sistema seja capaz de detectá-los). 

Ao lado desses vídeos com notícias e explicações sobre COVID-19, eu verei ainda recomendações personalizadas sobre outros assuntos, com base no meu histórico de visualizações – um esquete do Saturday Night Live ou um TEDx Talk sobre o Efeito Super Mario. Essa diversidade personalizada ajuda as pessoas a entrar em contato com novos temas e formatos, em vez de ficarem o tempo todo expostas ao mesmo tipo de vídeo, repetidas vezes.  

Cada vez mais pesquisadores independentes vêm estudando o impacto das plataformas tecnológicas no consumo de conteúdo limítrofe, e esses estudos prosseguem. Alguns deles, publicados recentemente, concluem que as recomendações do YouTube não estão direcionando as pessoas para conteúdo extremo. Em vez disso, o consumo de notícias e conteúdo político no YouTube costuma refletir preferências pessoais, que se reproduzem nos hábitos de cada usuário em tudo o que essa pessoa faz na internet.


4. Conteúdo limítrofe gera receita?


Para começo de conversa, nossas diretrizes de conteúdo adequado sobre publicidade já proíbem a monetização de diversos tipos de conteúdo limítrofe. Muitos anunciantes nos disseram que não querem ver suas marcas associadas a esse tipo de conteúdo no YouTube, e com frequência optam por não anunciar em vídeos como esses. Isso significa que cada vídeo limítrofe assistido se torna uma oportunidade perdida de monetização, o que faz com que o YouTube perca receita. Da mesma maneira, esse tipo de conteúdo gera desconfiança e preocupação não apenas por parte de anunciantes parceiros, mas também do público, da imprensa e de legisladores. A verdade é que o crescimento de nosso trabalho na área de responsabilidade veio acompanhado de avanços também da empresa e da economia dos criadores como um todo. Resumindo: ser responsável é bom para os negócios.

Considerando tudo isso, por que então não retiramos do ar o conteúdo limítrofe? A desinformação muda e evolui em alta velocidade – e, ao contrário de temas como terrorismo ou segurança infantil, ela não costuma ser um consenso entre todas as pessoas. Além disso, a visão sobre desinformação varia dependendo da perspectiva individual e da história de cada um. Sabemos que, em algumas situações, isso pode significar deixar no ar conteúdo polêmico e até agressivo. Por isso, seguimos trabalhando com afinco na construção de recomendações responsáveis, e tomando medidas concretas para impedir que nosso sistema dissemine recomendações desse tipo de conteúdo.

Nosso objetivo é que as visualizações de conteúdo limítrofe vindo por meio de recomendações fiquem abaixo de 0,5% do total de visualizações no YouTube.

Somado, todo esse trabalho de responsabilidade em relação às recomendações tem demonstrado impacto prático e real. O tempo assistindo notícias de fontes confiáveis aumentou consideravelmente, e a visualização de conteúdo limítrofe está em queda. Mas isso não significa que a questão esteja resolvida: significa apenas que temos de continuar refinando nossos modelos e investindo na melhoria do sistema. Nosso objetivo é que as visualizações de conteúdo limítrofe vindo por meio de recomendações fiquem abaixo de 0,5% do total de visualizações no YouTube.

A missão do YouTube é que todas as pessoas possam se expressar e ser ouvidas pelo mundo. Isso fez uma imensa diferença na vida da minha família. Vídeos com lições de tolerância e empatia tiveram efeitos profundos e positivos na personalidade da minha filha mais velha. Já meu filho conseguiu ajuda para superar fases difíceis das aulas de álgebra linear. Eu mesmo aprendi uma porção de coisas com palestras dadas por líderes no campo de ética e tecnologia. E nosso compromisso com a liberdade abriu espaço para novas vozes e ideias que, sem isso, poderiam não ter tido acesso a nenhuma plataforma. Criadores como Marques Brownlee, MostlySane ou NikkieTutorials e exemplos como o Felipe Neto no Brasil, inspiraram milhões com seus conhecimentos especializados, suas defesas de causas importantes e sua sinceridade. 

Nosso sistema de recomendações melhora a cada dia graças às opiniões e sugestões que recebemos de todos vocês – mas sempre há espaço para avançar mais. Eu e minha equipe temos o compromisso de continuar trabalhando e oferecendo aos usuários a experiência mais útil e interessante possível.