Technologie
Étude: YouTube recommande à ses utilisateurs des vidéos à caractère "nocif"
07/07/2021 - 17:00
Lina Ibriz
Plus de 70% des contenus signalés par les utilisateurs de YouTube ont été recommandés par l’algorithme du réseau social, selon une étude menée par la fondation Mozilla en se basant sur les données partagées par les bénévoles ayant participé à l’étude. Fake news, fausses informations présentées comme "scientifiques", discours de haine, nudité, … Les résultats de l’étude sont choquants !
C’est par le biais de l’extension open-source RegretsReporter, disponible aussi bien sur le moteur de recherche Firefox que sur Chrome, que la fondation Mozilla a fait le suivi des contenus signalés qui ont été reproposés par les algorithmes de YouTube. 3.700 bénévoles ont contribué à la recherche en utilisant l’extension pour permettre à la Fondation d’analyser leurs données ainsi que leurs expériences sur la plateforme d’hébergement de vidéos la plus célèbre au monde.
L’étude, dont les résultats ont été publiés ce mercredi 7 juillet 2021, s’est étendue sur une période de 10 mois. C'est l’étude la plus élargie, à savoir qu'elle basée sur le "crowd sourcing" effectué sur les algorithmes de YouTube "bien gardés".
Les algorithmes de YouTube, le hic
L’une des conclusions principales de l’étude est que l’algorithme de recommandation utilisé par YouTube est par essence défaillant et favorise lui-même la visibilité de vidéos nocives et illicites. Selon l’étude, les vidéos recommandées par l’algorithme sont 40% plus susceptibles d’être signalées par les utilisateurs.
De plus, les chercheurs de Mozilla ont découvert que le taux de visualisation des vidéos à caractère problématique augmente, chaque jour, de 70% au-delà du taux de visualisation des autres vidéos. Ces vidéos problématiques suggérées par les algorithmes de YouTube ne sont généralement pas liées aux mêmes thématiques que les vidéos initialement regardées par les utilisateurs.
"Dans 43,6% des cas où Mozilla avait les données relatives aux vidéos regardées par un bénévole avant de tomber sur un regret (vidéo non souhaitée), la vidéo recommandée n’avait aucun rapport avec les vidéos précédentes qu’il avait visualisé", rapporte l’étude.
Are your @YouTube recommendations sometimes lies? Conspiracy theories? Or just weird as hell?
You’re not alone. That’s why we conducted a study to better understand harmful YouTube recommendations.
This is what we learned about #YouTubeRegrets ⤵️https://t.co/oSDVb0d63b pic.twitter.com/i1CtnaYN06
— Mozilla (@mozilla) July 7, 2021
Une auto-violation des politiques relatives au contenu
Commentant les résultats de l’étude, la responsable du plaidoyer à la fondation Mozilla, Brandi Geurkink, a réclamé que "YouTube doit admettre que son algorithme est conçu d’une manière qui nuit et désinforme les gens". Selon lui, la plateforme "non seulement héberge des vidéos qui violent ses propres politiques, mais les recommande de façon active aux utilisateurs".
Sur la page réservée aux politiques et des standards à respecter au niveau des vidéos publiées le réseau social, l’administration YouTube consacre plusieurs rubriques dénombrant les aspects qui font qu’un contenu soit répréhensible et inadmissible sur la plateforme : contenu compromettant destiné aux mineurs, harcèlement et cyber-intimidation, violence, discours de la haine, nudité ou encore désinformation autour de la Covid-19 figurent tous parmi les nombreux grands titres affichés en grand caractères.
Néanmoins, selon la récente étude, les vidéos recommandées signalées faisaient toutes partie d’une ou plus de ces catégories réprimandées de contenu. Ainsi, l’étude conclut que les algorithmes et l’intelligence artificielle utilisés par YouTube pour recommander les vidéos violent les politiques mises en place par ce dernier.
Des mécanismes de modération insuffisants ?
En analysant les données volontairement communiquées par des utilisateurs, l’étude soulève bien de questionnements relatifs aux mécanismes de régulation et de modération des contenus sur la plateforme, qui, contrairement à Facebook ou encore Twitter par exemple, reste quand même très discrète par rapport au mode de gestion de cet aspect de son activité et des mécanismes mis en place pour lutter contre les contenus nocifs et illicites.
L’intelligence artificielle n’étant toujours pas autant développée, et la modération humaine étant coûteuse et inefficace parfois, le signalement reste le moyen le plus fiable pour détecter certains contenus à caractère nocif ou illicite.
"Nous comptons sur les membres de la communauté YouTube pour signaler ou réclamer les contenus qu’ils trouvent inappropriés", précise l’administration YouTube. Et bien que cette dernière concède en ajoutant : "Quand un contenu est signalé, ce dernier ne sera pas automatiquement supprimé. Les contenus signalés sont revus en fonction de nos lignes directrices".
Tout de même, dans les cas mis en évidence à travers l'étude, il ne serait pas seulement question de non suppression des contenus signalés, mais plutôt de recommandation arbitraire par le système de ces contenus.
Des algorithmes "discriminatoires"
L’un des résultats les plus choquants de l’étude menée par Mozilla, était la disparité existante entre les utilisateurs des pays anglophones et ceux des pays parlant d’autres langues. Le taux des vidéos signalées recommandées par YouTube dans les pays non anglophones était élevé de 60% plus que dans ceux anglophones. Par ailleurs, les contenus non conformes et mensongers relatifs à la pandémie sont plus "abondants" en les langues autres que l’anglais. "Pour les utilisateurs utilisant la langue anglaise, les contenus relatifs à la pandémie représentaient 14% des contenus signalés contre 36% pour les utilisateurs n’utilisant pas la langue anglaise", note le rapport.
Commentant ce point, Brandi Geurkink a déclaré que "nous savons aussi maintenant que les personnes habitant des pays ne parlant pas la langue anglaise sont plus susceptibles de subir les dangers de l’algorithme, qui est hors contrôle, de recommandation de YouTube".
Pour rappel, YouTube avait déjà été critiqué suite aux mises à jour introduites à son règlement et à ses politiques en 2019 aux États Unies et d’autres pays anglophones, et qui n’ont été appliquées dans d’autres pays que deux ans plus tard.
D’ailleurs, YouTube n’est pas le seul à faire l’objet de ces critiques. En effet, plusieurs systèmes informatiques développés par des géants technologiques ont été accusés de racisme ou de discrimination contre certaines catégories.
En 2020, au pic du mouvement politique Black Lives Matter, la technologie de reconnaissance faciale utilisée dans plusieurs domaines, notamment celui sécuritaire a été au centre d’une violente polémique. Cette technologie a été accusée de reproduire et de renforcer les biais ethniques lorsqu’elle est utilisée par la police.
Selon plusieurs experts, cela est dû au fait que les bases de données utilisées pour le développement de l’intelligence artificielle dans le cadre du "machine learning" sont incomplètes et non représentatives, mais aussi à la programmation.
Une plus grande transparence est nécessaire
L’étude menée par la fondation Mozilla a ainsi conclu à plusieurs recommandations pouvant permettre d’améliorer la qualité des contenus publiés et circulant sur YouTube. La transparence des systèmes de recommandation ainsi que le maintien de la communication autour des politiques adoptées était la recommandation, voire la revendication principale. YouTube devrait donc rendre les informations relatives au fonctionnement de ses algorithmes ainsi que les modalités de gestion des contenus accessibles au public ou à la limite à des organismes internationaux ou non gouvernementaux afin de garantir davantage de transparence via des audits indépendants.
En outre, la plateforme devrait permettre à ses utilisateurs de paramétrer les conditions de recommandation et à contrôler les contenus qui leur sont suggérés ou affichés. L'intelligence artificielle ne devrait guère prendre la place du libre arbitre !
Articles en relations
Technologie
Technologie
Société