Projet de recherche

Bienvenue sur la YOUPOL base de données

Une base de données d'influenceurs politiques sur YouTube (2006–aujourd'hui), et bientôt sur TikTok.

Plus de 67 chaînes suivies, des milliers de vidéos transcrites, des millions de commentaires et des annotations NLP pour analyser le discours politique en ligne. La base est enrichie en continu par un réseau distribué de machines contributives. Rejoignez le réseau en déployant un worker sur votre machine, ou contactez-nous pour avoir accès.

Statistiques du corpus
0
Vidéos en base
0
Chaînes
0
Commentaires
0
Transcriptions
0
Vues totales

Observatoire en continu

La base est mise à jour en continu : scan des chaînes, transcription et annotation des vidéos, extraction de commentaires, mise à jour des métadonnées (vues, likes, abonnés). Chaque scan produit un historique longitudinal exploitable via l'API.

Date de dernière mise à jour : 2026-04-04 11:06
Aujourd'hui
vidéos transcrites
commentaires extraits
chaînes scannées <span style="font-size:0.55rem;opacity:0.5">(03/31)</span>
Depuis janvier
vidéos transcrites
commentaires extraits
vidéos détectées
métadonnées mises à jour
chaînes scannées
Le projet

Comprendre le politique sur YouTube
par son contenu

Les recherches antérieures sur le YouTube politique se limitaient aux métadonnées (titres, tags, nombre de vues). YOUPOL va plus loin en analysant ce que les créateurs disent réellement.

En transcrivant et annotant plus de 23,656 vidéos de plus de 67 chaînes politiques (2006 à aujourd'hui), nous avons construit la première base de données permettant l'analyse computationnelle du discours politique au niveau du contenu — de l'idéologie d'extrême droite à la rhétorique scientifique, du discours haineux à l'engagement de l'audience.

20,970 Vidéos transcrites
7.6M+ Commentaires extraits
67 Chaînes analysées
20 Années de couverture
01

Collecter et transcrire

Les vidéos et 7M+ commentaires sont récoltés, l'audio est prétraité avec Demucs, puis transcrit avec Whisper et diarisé avec pyannote.audio.

yt-dlpWhisperpyannote
02

Annoter et classifier

Des classifieurs NLP détectent l'idéologie d'extrême droite, le discours haineux, la rhétorique scientifique et l'orientation politique au niveau de la phrase. Annotation propulsée par LLM_Tool.

TransformersNERLLM annotation
03

Analyser et visualiser

Réseaux d'entités, graphes de cooccurrence, régressions OLS et tendances temporelles révèlent l'évolution du discours politique sur deux décennies.

NetworkXOLSECharts
Composition du corpus

Le spectre politique

67 chaînes couvrant l'ensemble du paysage politique francophone, de la France et du Québec, catégorisées par orientation politique. Le corpus surdimensionne volontairement le contenu d'extrême droite afin de permettre une analyse fine du discours radical.

13,536 Extrême droite (FR) 59%
4,085 Extrême droite (QC) 18%
3,283 Gauche (FR) 14%
1,521 Masculiniste 7%
385 Complotisme (QC) 2%

Croissance du YouTube politique (2006–aujourd'hui)

Nombre de vidéos publiées par année, par orientation politique

Détection de contenu politique dans le temps

Volume mensuel de phrases et proportion classée comme politique (niveau phrase)

Contacter l'équipe
Une question sur les données, l'API ou le projet ? Envoyez-nous un message.
Proposer une chaîne ou fonctionnalité
Aidez-nous à enrichir le corpus YOUPOL. Proposez une chaîne YouTube politique que nous devrions suivre, ou une fonctionnalité.