Sobre el sistema de recomendaciones de YouTube
15 Sep, 2021 – [[read-time]] mins de lectura
15 Sep, 2021 – [[read-time]] mins de lectura
Pasé más de una década en YouTube creando nuestro sistema de recomendaciones y me enorgullece ver cómo se ha convertido en una parte integral de la experiencia de YouTube para todos.”
Cuando las recomendaciones de YouTube están en su mejor momento, conectan a miles de millones de personas en todo el mundo con contenido que inspira, enseña y entretiene de manera única. Para mí, eso significa sumergirse en conferencias que exploran las cuestiones éticas que enfrenta la tecnología en la actualidad o ver los aspectos más destacados de los juegos de fútbol de la Universidad del Sur de California que recuerdo haber visto cuando era niño. Para mi hija mayor, es encontrar risas y comunidad con los Vlogbrothers. Y para mi hijo mayor, las recomendaciones le permitieron comprender mejor el álgebra lineal a través de explicaciones animadas de 3Blue1Brown, con descansos para ver videos de KSI.
Como muestra mi familia, hay una audiencia para casi todos los videos, y el trabajo de nuestro sistema de recomendación es encontrar esa audiencia. Piensa en lo difícil que sería navegar por todos los libros en una biblioteca enorme sin la ayuda de los bibliotecarios. Las recomendaciones generan una cantidad significativa de audiencia general en YouTube, incluso más que las suscripciones al canal o la búsqueda. Pasé más de una década en YouTube creando nuestro sistema de recomendaciones y me enorgullece ver cómo se ha convertido en una parte integral de la experiencia de YouTube para todos. Pero con demasiada frecuencia, las recomendaciones son vistas como una misteriosa caja negra. Queremos que estos sistemas se entiendan públicamente, así que permíteme explicarte cómo funcionan, cómo han evolucionado y por qué hemos hecho de la entrega de recomendaciones responsables nuestra principal prioridad.
¿Qué es un sistema de recomendación?
Nuestro sistema de recomendaciones se basa en el principio simple de ayudar a las personas a encontrar los videos que quieren ver y que les ofrecen valor. Puedes encontrar recomendaciones en acción en dos lugares principales: tu página de inicio y el panel "A continuación". Tu página de inicio es lo que ves cuando abres YouTube por primera vez, y muestra una combinación de recomendaciones personalizadas, suscripciones y las últimas noticias e información. El panel “A continuación” aparece cuando estás viendo un video y te sugiere contenido adicional basado en lo que estás viendo actualmente, junto con otros videos que creemos que pueden interesarte.
En 2008, cuando comenzamos a crear nuestro sistema de recomendaciones, la experiencia era completamente diferente. Digamos que miras principalmente videos de cocina. ¿No sería frustrante si tu página de inicio sólo te recomendara los últimos videos deportivos y musicales porque tienen la mayor cantidad de vistas? Eso fue YouTube en los primeros días. El sistema clasificó los videos según su popularidad para crear una gran página de "Tendencias". No mucha gente vio esos videos y la mayoría de la audiencia de YouTube provino de búsquedas o enlaces compartidos fuera de la plataforma.
Hoy en día, nuestro sistema clasifica miles de millones de videos para recomendar contenido adaptado a tus intereses específicos. Por ejemplo, nuestro sistema reconoció que vi un momento destacado de fútbol clásico de la USC y encontró para mi otros aspectos destacados deportivos de mi juventud. Sin las recomendaciones, nunca hubiera sabido que estos videos estaban disponibles. A diferencia de otras plataformas, no conectamos a los espectadores con el contenido a través de su red social. En cambio, el éxito de las recomendaciones de YouTube depende de predecir con precisión los videos que deseas ver.
Para hacer esto, comenzamos con el conocimiento de que todos tienen hábitos de visualización únicos. Luego, nuestro sistema compara tus hábitos de visualización con aquellos que son similares y utiliza esa información para sugerir otro contenido que quizás desees ver. Entonces, si te gustan los videos de tenis y nuestro sistema se da cuenta de que a otros a quienes les gustan los mismos videos de tenis que a ti también disfrutan de los videos de jazz, es posible que te recomiende videos de jazz (para categorías como noticias e información, esto podría funcionar de manera diferente; más sobre eso más adelante), incluso si nunca antes has visto uno. Hace unos años, nuestro sistema recomendó videos de Tyler Oakley a mi hija mayor, porque eso es lo que muchas de las personas que vieron Vlogbrothers también vieron en ese momento. Terminó convirtiéndose en una gran fan, tanto que luego la llevamos a verlo en una reunión.
Pero, por supuesto, también sabemos que no todo el mundo quiere compartir siempre esta información con nosotros. Por eso, hemos creado controles que te ayudarán a decidir cuántos datos deseas proporcionar. Puedes pausar, editar o eliminar tu historial de búsqueda y visualización de YouTube cuando lo desees.
Para proporcionar tal selección personalizada, nuestro sistema de recomendación no funciona a partir de un "libro de recetas" de qué hacer. Está en constante evolución, aprendiendo todos los días de más de 80 mil millones de piezas de información que llamamos señales. Es por eso que brindar más transparencia no es tan simple como enumerar una fórmula para recomendaciones, sino que implica comprender todos los datos que ingresan a nuestro sistema. Varias señales se complementan entre sí para ayudar a informar a nuestro sistema sobre lo que te satisface: clics, tiempo de visualización, respuestas a encuestas, lo compartido, los me gusta y los no me gusta.
Clics: hacer clic en un video proporciona una fuerte indicación de que también lo encontrarás satisfactorio. Después de todo, no harías clic en algo que no quieras ver.
Pero como aprendimos en 2011, hacer clic en un video no significa que realmente lo hayas visto. Digamos que estabas buscando lo más destacado del partido de Wimbledon de ese año. Te desplazas por la página y haces clic en uno de los videos, que tiene una miniatura y un título que sugiere que muestra imágenes del partido. En cambio, se trata de una persona en su habitación hablando sobre el partido. Haces clic en un video que nuestro sistema recomienda en tu panel “A continuación”, sólo para encontrar a otro fan hablando sobre el partido. Una y otra vez haces clic en estos videos hasta que finalmente se te recomienda un video con imágenes del partido que deseas ver. Es por eso que agregamos el tiempo de visualización en 2012.
Tiempo de visualización: el tiempo de visualización (qué vídeos miraste y durante cuánto tiempo) proporciona señales personalizadas a nuestro sistema sobre lo que probablemente quieras ver. Entonces, si nuestro fanático del tenis vio 20 minutos de clips de momentos destacados de Wimbledon y sólo unos segundos de video de análisis de partidos, podemos asumir con seguridad que encontró más valioso ver esos momentos destacados.
Cuando incorporamos por primera vez el tiempo de visualización en las recomendaciones, vimos una caída inmediata del 20% en las visualizaciones. Pero creíamos que era más importante para nosotros ofrecer más valor a los espectadores. Aún así, no todo el tiempo de visualización es igual. A veces me quedo despierto hasta tarde, viendo videos al azar cuando en cambio podría haber estado aprendiendo un nuevo idioma en YouTube o perfeccionando mis habilidades culinarias junto con un creador. No queremos que los espectadores se arrepientan de los videos que pasan tiempo viendo y nos dimos cuenta de que teníamos que hacer aún más para medir cuánto valor obtienes de tu tiempo en YouTube.
Respuestas a encuestas: para asegurarnos realmente de que los espectadores estén satisfechos con el contenido que miran, medimos lo que llamamos "tiempo de visualización de valor": el tiempo que dedicas a ver un video que consideras valioso. Medimos el tiempo de visualización de valor a través de encuestas de usuario que te piden que califiques el video que viste con una a cinco estrellas, lo que nos brinda una métrica para determinar qué tan satisfactorio te pareció el contenido. Si calificas un video con una o dos estrellas, te preguntamos por qué le diste una calificación tan baja. De manera similar, si le das al video de cuatro a cinco estrellas, te preguntamos por qué, es decir, ¿fue inspirador o significativo? Solo los videos que calificas con cuatro o cinco estrellas se cuentan como tiempo de visualización de valor.
Por supuesto, no todos responden una encuesta en cada video que ven. Con base en las respuestas obtenidas, hemos entrenado un modelo de aprendizaje automático para predecir las posibles respuestas a la encuesta para todos. Para probar la precisión de estas predicciones, deliberadamente no usamos algunas de las respuestas a la encuesta en el aprendizaje. De esta manera, siempre estamos monitoreando qué tanto se acerca nuestro sistema a las respuestas reales.
Lo compartido, los me gusta y los no me gusta: en promedio, es más probable que las personas se sientan satisfechas con los videos que comparten o que les gustan. Nuestro sistema utiliza esta información para tratar de predecir la probabilidad de que compartas o te gusten más videos. Si no te gusta un video, es una señal de que probablemente no fue algo que disfrutaste viendo.
Sin embargo, al igual que tus recomendaciones, la importancia de cada señal depende de ti. Si eres el tipo de persona que comparte cualquier video que mira, incluidos los que calificas con una o dos estrellas, nuestro sistema sabrá que no debe tomar tanto en cuenta tus acciones al recomendar contenido. Por todo esto, nuestro sistema no sigue una fórmula establecida, sino que se desarrolla dinámicamente a medida que cambian tus hábitos de visualización.
Los clics, las visualizaciones, el tiempo de visualización, las encuestas a usuarios, lo compartido, los me gusta y los no me gusta funcionan muy bien para generar recomendaciones sobre temas como música y entretenimiento, lo que la mayoría de la gente viene a ver a YouTube. Pero a lo largo de los años, un número creciente de espectadores ha venido a YouTube en busca de noticias e información. Ya se trate de las noticias de última hora o de estudios científicos complejos, estos temas son para los que más importa la calidad de la información y el contexto. Alguien puede informar que está muy satisfecho con los videos que afirman que “la Tierra es plana”, pero eso no significa que queramos recomendar este tipo de contenido de baja calidad.
Es por eso que las recomendaciones juegan un papel tan importante en cómo mantenemos una plataforma responsable. Conectan a los espectadores con información de alta calidad y minimizan las posibilidades de que vean contenido problemático. Y complementan el trabajo realizado por nuestros sólidos Lineamientos de la comunidad que definen lo que está y no está permitido en YouTube.
Hemos utilizado recomendaciones para limitar la visualización generalizada del contenido de baja calidad desde 2011, cuando creamos clasificadores para identificar videos subidos de tono o violentos y evitar que fueran recomendados. Luego, en 2015, notamos que aparecía contenido sensacionalista de tabloides en las páginas de inicio y tomamos medidas para limitarlo. Un año después, comenzamos a predecir la probabilidad de que un video incluyera a menores en situaciones de riesgo y los quitamos de las recomendaciones. Y en 2017, para asegurarnos de que nuestro sistema de recomendación fuera justo para las comunidades marginadas, comenzamos a evaluar el aprendizaje automático que impulsa nuestro sistema para la equidad a lo largo de todos los grupos protegidos, como la comunidad LGBTQ+.
El aumento de la información errónea en los últimos años nos llevó a ampliar aún más las formas en que usamos nuestro sistema de recomendación para incluir información errónea problemática y contenido en el límite de lo aceptable, es decir, contenido que se acerca, pero que no infringe del todo nuestros Lineamientos de la comunidad. Esto incluye videos sobre teorías de la conspiración ("el alunizaje fue simulado") u otro contenido que difunda información errónea ("el jugo de naranja puede curar el cáncer").
Podemos hacer esto mediante el uso de clasificadores para identificar si un video proviene de "fuentes confiables" o está "en el límite". Estas clasificaciones se basan en evaluadores humanos que valoran la calidad de la información en cada canal o video. Estos evaluadores provienen de todo el mundo y están capacitados a través de un conjunto de lineamientos de calificación detallados y disponibles al público. También confiamos en expertos certificados, como médicos, cuando el contenido involucra información de salud.
Para determinar si los contenidos provienen de fuentes confiables, los evaluadores responden algunas preguntas clave. ¿El contenido cumple su promesa o logra su objetivo? ¿Qué tipo de conocimiento se necesita para lograr el objetivo del video? ¿Cuál es la reputación del orador en el video y el canal en el que está? ¿Cuál es el tema principal del video (por ejemplo, Noticias, Deportes, Historia, Ciencia, etc.)? ¿El contenido está destinado principalmente a ser una sátira? Estas respuestas y otras más determinan si un video tiene fuentes confiables. Cuanto más alta sea la puntuación, más se promocionará el video en lo que respecta al contenido de noticias e información. Para determinar el contenido en el límite, los evaluadores valoran factores que incluyen, entre otros, si el contenido es: inexacto, confuso o engañoso; insensible o intolerante; y dañino o con el potencial de causar daño. Los resultados se combinan para dar una puntuación de la probabilidad de que el video contenga información errónea dañina o esté en el límite. Cualquier video clasificado como en el límite es restringido en las recomendaciones.
Estas evaluaciones humanas luego entrenan nuestro sistema para modelar sus decisiones, y ahora escalamos sus evaluaciones a todos los videos en YouTube.
Las recomendaciones desempeñan un papel fundamental en toda nuestra comunidad, ya que presentan a los espectadores el contenido que les encanta y ayudan a los creadores a conectarse con nuevas audiencias. Para la sociedad en general, las recomendaciones pueden ser significativas para ayudar a detener la propagación de información errónea dañina. Porque si bien los clics, el tiempo de visualización, las encuestas a usuarios, lo compartido, los me gusta y los no me gusta son señales importantes que informan a nuestro sistema, nuestro compromiso de cumplir con nuestra responsabilidad con la comunidad de YouTube y la sociedad puede anularlas.
Es por eso que en 2019 comenzamos a restringir el contenido en el límite en las recomendaciones. Desde entonces, hemos visto una caída del 70% en el tiempo de visualización de contenido en el límite recomendado no suscrito en los EE.UU.”
Hay algunas preguntas restantes que me hacen comúnmente sobre nuestro sistema de recomendaciones que creo que es importante abordar:
¿El contenido en el límite obtiene la mayor interacción?
En realidad, a través de encuestas y comentarios, hemos descubierto que la mayoría de los espectadores no quieren que se les recomiende contenido en el límite, y muchos lo encuentran molesto y desagradable. De hecho, cuando limitamos el contenido lascivo o de tipo sensacionalista, vimos que el tiempo de visualización en realidad aumentó en un 0,5% por ciento en el transcurso de 2,5 meses, en relación a cuando no establecimos ningún límite.
Además, no hemos visto evidencia de que el contenido en el límite sea, en promedio, más atractivo que otros tipos de contenido. Considera el contenido de los terraplanistas. Si bien hay muchos más videos subidos que dicen que la Tierra es plana que los que dicen que es redonda, en promedio, los videos de la Tierra plana obtienen muchas menos vistas. Las encuestas muestran que el contenido en el límite es satisfactorio sólo para una pequeña parte de los espectadores en YouTube. Hemos invertido mucho tiempo y dinero para asegurarnos de que no llegue a un público más amplio a través de nuestro sistema de recomendaciones. Hoy en día, el contenido que está en el límite de lo permitido obtiene la mayoría de sus vistas de fuentes distintas a las recomendaciones no suscritas.
¿El contenido en el límite aumenta el tiempo de visualización de YouTube?
Para la gran mayoría de las personas, el contenido en el límite no cumple con el nivel de tiempo bien invertido en YouTube. Es por eso que en 2019 comenzamos a restringir el contenido en el límite en las recomendaciones. Desde entonces, hemos visto una caída del 70% en el tiempo de visualización de contenido en el límite recomendado no suscrito en los EE.UU. Hoy en día, el consumo de contenido en el límite que proviene de nuestras recomendaciones está significativamente por debajo del 1%.
¿Las recomendaciones llevan a los espectadores a contenidos cada vez más extremos?
Como he explicado, limitamos activamente la información de baja calidad en las recomendaciones. Pero también tomamos el paso adicional de mostrar a los espectadores videos de fuentes confiables sobre temas que pueden interesarles. Digamos que veo un video sobre la vacuna para COVID-19. En mi panel “A continuación”, veré videos de fuentes confiables como Vox y Bloomberg Quicktake y no veré videos que contengan información engañosa sobre vacunas (en la medida en que nuestro sistema pueda detectarlas).
Junto con esas noticias y videos explicativos sobre COVID-19, también obtendré recomendaciones personalizadas de otros temas en función de mi historial de reproducción: un sketch de Saturday Night Live o una TEDx Talk sobre el efecto Super Mario. Esta diversidad personalizada ayuda a los espectadores a acceder a nuevos temas y formatos en lugar de al mismo tipo de video una y otra vez.
Un número creciente de investigadores independientes ha estado indagando sobre cómo las plataformas tecnológicas impactan en el consumo de contenido en el límite, y mientras continúa el estudio en curso, los artículos publicados recientemente concluyen que las recomendaciones de YouTube en realidad no están dirigiendo a los espectadores hacia el contenido extremo. En cambio, el consumo de noticias y contenido político en YouTube refleja de manera más general las preferencias personales que se pueden ver a través de sus hábitos en línea.
¿El contenido en el límite genera dinero?
Para empezar, nuestros lineamientos para anunciantes ya prohíben la monetización de una gran cantidad de contenido en el límite. Muchos anunciantes nos han dicho que no quieren estar asociados con este tipo de contenido en YouTube y, a menudo, optan por no mostrar publicidad junto a estos contenidos. Esto significa que cada video en el límite visto es una oportunidad perdida para monetizar, lo que genera una pérdida real de ingresos para YouTube. Asimismo, este tipo de contenido genera desconfianza y genera preocupación no sólo entre los socios publicitarios, sino también entre el público, la prensa y los legisladores. La realidad es que a medida que nuestra labor en torno a la responsabilidad ha crecido, también lo ha hecho nuestra empresa y toda la economía de creadores. La responsabilidad es buena para los negocios.
Con todo eso, ¿por qué no simplemente eliminamos el contenido en el límite? La desinformación tiende a cambiar y evolucionar rápidamente y, a diferencia de áreas como el terrorismo o la seguridad infantil, a menudo carece de un consenso claro. Además, la información errónea puede variar según la perspectiva y los antecedentes personales. Reconocemos que, a veces, esto significa dejar contenido controvertido o incluso ofensivo. Por lo tanto, continuamos enfocándonos mucho en crear recomendaciones responsables y tomar medidas significativas para evitar que nuestro sistema recomiende ampliamente este contenido.
En conjunto, todo nuestro trabajo sobre la responsabilidad en torno a las recomendaciones ha mostrado tener un impacto real. El tiempo de visualización de noticias de fuentes confiables ha aumentado drásticamente y la visualización de contenido en el límite ha disminuido. Esto no significa que hayamos resuelto los problemas, sólo significa que tendremos que seguir refinando e invirtiendo en nuestros sistemas para seguir mejorando. Nuestro objetivo es que las visualizaciones de contenido en el límite desde las recomendaciones esté por debajo del 0,5% de las visualizaciones totales en YouTube.
Nuestro objetivo es que las visualizaciones de contenido en el límite desde las recomendaciones esté por debajo del 0,5% de las visualizaciones totales en YouTube.”
La misión de YouTube es dar voz a todos y mostrarles el mundo. Ha hecho una gran diferencia en la vida de mi propia familia. Los videos que trajeron lecciones de tolerancia y empatía tuvieron un impacto profundo y positivo en el carácter de mi hija mayor. Mi hijo superó algunos momentos difíciles en su clase de álgebra lineal. He aprendido una cantidad significativa sobre contexto y matices de las conferencias de líderes en ética tecnológica. Y nuestro compromiso con la apertura ha dado lugar a nuevas voces e ideas que de otro modo no tendrían una plataforma. Creadores como Marques Brownlee, MostlySane o NikkieTutorials han inspirado a millones con su experiencia, apoyo y honestidad.
Nuestro sistema de recomendaciones mejora cada día gracias a los comentarios de todos, pero siempre puede ser mejor. Mi equipo y yo estamos comprometidos a mantener ese trabajo en marcha y brindarles la experiencia más útil y valiosa posible.