Bienvenue sur la YOUPOL base de données
Une base de données d'influenceurs politiques sur YouTube (2006–aujourd'hui), et bientôt sur TikTok.
Plus de 67 chaînes suivies, des milliers de vidéos transcrites, des millions de commentaires et des annotations NLP pour analyser le discours politique en ligne. La base est enrichie en continu par un réseau distribué de machines contributives. Rejoignez le réseau en déployant un worker sur votre machine, ou contactez-nous pour avoir accès.
Comprendre le politique sur YouTube
par son contenu
Les recherches antérieures sur le YouTube politique se limitaient aux métadonnées (titres, tags, nombre de vues). YOUPOL va plus loin en analysant ce que les créateurs disent réellement.
En transcrivant et annotant plus de 23,656 vidéos de plus de 67 chaînes politiques (2006 à aujourd'hui), nous avons construit la première base de données permettant l'analyse computationnelle du discours politique au niveau du contenu — de l'idéologie d'extrême droite à la rhétorique scientifique, du discours haineux à l'engagement de l'audience.
Collecter et transcrire
Les vidéos et 7M+ commentaires sont récoltés, l'audio est prétraité avec Demucs, puis transcrit avec Whisper et diarisé avec pyannote.audio.
Annoter et classifier
Des classifieurs NLP détectent l'idéologie d'extrême droite, le discours haineux, la rhétorique scientifique et l'orientation politique au niveau de la phrase. Annotation propulsée par LLM_Tool.
Analyser et visualiser
Réseaux d'entités, graphes de cooccurrence, régressions OLS et tendances temporelles révèlent l'évolution du discours politique sur deux décennies.
Le spectre politique
67 chaînes couvrant l'ensemble du paysage politique francophone, de la France et du Québec, catégorisées par orientation politique. Le corpus surdimensionne volontairement le contenu d'extrême droite afin de permettre une analyse fine du discours radical.
Croissance du YouTube politique (2006–aujourd'hui)
Nombre de vidéos publiées par année, par orientation politique
Détection de contenu politique dans le temps
Volume mensuel de phrases et proportion classée comme politique (niveau phrase)