Bienvenue sur la YOUPOL base de données
Une base de données d'influenceurs politiques sur YouTube et TikTok (2006–aujourd'hui), bientôt étendue au monde anglophone.
Plus de 68 chaînes suivies, des milliers de vidéos transcrites, des millions de commentaires et des annotations NLP pour analyser le discours politique en ligne. La base est enrichie en continu par un réseau distribué de machines contributives. Rejoignez le réseau en déployant un worker sur votre machine, ou contactez-nous pour avoir accès.
Comprendre le politique sur YouTube et TikTok
par son contenu
Les recherches antérieures sur le YouTube et TikTok politique se limitaient aux métadonnées (titres, tags, nombre de vues). YOUPOL va plus loin en analysant ce que les créateurs disent réellement.
En transcrivant et annotant plus de 23,712 vidéos de plus de 68 chaînes politiques (2006 à aujourd'hui), nous avons construit la première base de données permettant l'analyse computationnelle du discours politique au niveau du contenu — de l'idéologie d'extrême droite à la rhétorique scientifique, du discours haineux à l'engagement de l'audience.
Collecter et transcrire
Les vidéos et 7M+ commentaires sont récoltés, l'audio est prétraité avec Demucs, puis transcrit avec Whisper et diarisé avec pyannote.audio.
Annoter et classifier
Des classifieurs NLP détectent l'idéologie d'extrême droite, le discours haineux, la rhétorique scientifique et l'orientation politique au niveau de la phrase. Annotation propulsée par LLM_Tool.
Analyser et visualiser
Réseaux d'entités, graphes de cooccurrence, régressions OLS et tendances temporelles révèlent l'évolution du discours politique sur deux décennies.
Le spectre politique
68 chaînes couvrant l'ensemble du paysage politique francophone, de la France et du Québec, catégorisées par orientation politique, et bientôt étendue au monde anglophone. Le corpus surdimensionne volontairement le contenu d'extrême droite afin de permettre une analyse fine du discours radical.
Croissance du YouTube et TikTok politique (2006–aujourd'hui)
Nombre de vidéos publiées par année, par orientation politique
Détection de contenu politique dans le temps
Volume mensuel de phrases et proportion classée comme politique (niveau phrase)