Exploration des données

Analyse des données

Explorez les tendances du contenu politique sur YouTube à travers 67 chaînes francophones, 23,658 vidéos et 20 ans de discours (2006 à aujourd'hui).

Vidéos dans le temps par orientation politique

Nombre annuel de vidéos mises en ligne, empilées par orientation (2006 à aujourd'hui)

Vues totales dans le temps par orientation politique

Vues cumulées par année, réparties par orientation

Activité de publication mensuelle

Nombre total de vidéos publiées par mois toutes orientations confondues

Répartition des vidéos par orientation politique

Part du corpus par catégorie idéologique

Vidéos par pays

France vs. Québec répartis par orientation

Distribution de genre des créateurs de chaînes

Chaînes classifiées selon le genre de leur créateur(trice) principal(e)

Durée moyenne des vidéos par orientation

Durée moyenne en minutes par catégorie politique

Bientôt disponible

Annotation au niveau de la phrase

Chaque phrase du corpus est d'abord classifiée comme politique ou non-politique, puis annotée dans le cadre de trois projets de recherche : analyse de genre, néo-réactionnaires technophiles et idées d'extrême droite (SIED, suite de Boursier & Lemor, 2025). Annotation propulsée par LLM_Tool.

10M+ Phrases à annoter
68+ Modèles de classification
3 Projets de recherche
Exemple interactif

À quoi ressemble l'annotation

Sélectionnez une phrase du corpus. Chaque classifieur l'analyse indépendamment et attribue une étiquette lorsque le concept est détecté.

Annotations détectées

Pipeline d'annotation

Comment ça fonctionne

Propulsé par LLM_Tool, notre framework d'annotation open source.

Entrée Codebooks (politique, genre, NR, SIED) + 10M phrases
Traitement Annotation LLM + fine-tuning CamemBERT
Sortie Classifieurs validés à grande échelle
Méthodologie

Processus en trois étapes

Un codebook de détection politique filtre d'abord le contenu non-politique. Trois codebooks supplémentaires définissent les concepts cibles des projets de recherche : analyse de genre (genre, valence, rationalité, position scientifique), néo-réactionnaires technophiles (technologie, libertarianisme, métaphores fictionnelles, égalité, écologie) et SIED (nationalisme, immigration, démocratie, progrès, autorité, tradition, égalité, écologie) selon le cadre développé dans Boursier & Lemor (2025). Le LLM reçoit chaque codebook comme prompt système et annote des lots de 500 phrases, produisant des étiquettes et des justifications.

Pour chaque tâche de classification, un modèle CamemBERT est fine-tuné sur les données annotées par le LLM. Les modèles sont évalués sur un ensemble de validation. Si le score F1 est insuffisant, le pipeline entre dans une boucle de renforcement : les prédictions les plus incertaines sont renvoyées au LLM pour ré-annotation avec des prompts plus stricts, l'ensemble d'entraînement est augmenté, et le modèle est ré-entraîné. Cette boucle converge généralement en deux à trois itérations.

Les classifieurs validés exécutent l'inférence sur le corpus entier. Chacune des 10 millions de phrases reçoit une prédiction et un score de confiance pour chaque modèle applicable. Tous les résultats sont stockés dans PostgreSQL, permettant des requêtes telles que « afficher toutes les phrases politiques annotées immigration_security » ou « comparer la valence de genre entre orientations politiques ».

En pratique

Exemple concret

Entraînement d'un classifieur SIED — Exemple : « nation_threat »

Le codebook SIED, développé dans Boursier & Lemor (2025), définit nation_threat comme « la nation décrite comme menacée (interne ou externe), nécessitant protection, défense ou préservation ». Le LLM annote un échantillon de phrases, en étiquetant les positives (ex. « notre civilisation est en train de disparaître sous les coups de la mondialisation ») et les négatives. Un classifieur CamemBERT est fine-tuné sur ces étiquettes. Si les performances sont insuffisantes, la boucle de renforcement sélectionne les phrases les plus incertaines, les renvoie au LLM pour ré-annotation, et le modèle est ré-entraîné. Ce processus est appliqué à chaque sous-catégorie des trois projets.

À venir

Ce que vous pourrez explorer

Une fois le pipeline d'annotation terminé, cet onglet proposera des graphiques interactifs pour chacune des analyses suivantes.

SIED : décomposition par orientation politique

Comparez les catégories SIED (nationalisme, immigration, démocratie, progrès, autorité, tradition, égalité, écologie) entre les chaînes d'extrême droite, de gauche, masculinistes et complotistes, en prolongement de Boursier & Lemor (2025).

Analyse du discours de genre

Explorez la valence de genre, les types de rationalité et le positionnement scientifique dans le discours des chaînes politiques au fil du temps.

Néo-réactionnaires technophiles

Analysez les discours sur la technologie, le libertarianisme et les métaphores fictionnelles (red pill, Cathédrale, etc.) dans le YouTube politique francophone.

Comparaison France vs. Québec

Comparez comment les mêmes construits idéologiques se manifestent différemment dans les deux écosystèmes politiques francophones.

Catégories d'annotation

Toutes les catégories et sous-catégories

Un premier modèle classe chaque phrase comme politique ou non-politique selon une définition large (actualité, enjeux sociaux, acteurs politiques, rapports de pouvoir, normes sociales). Ce filtrage précède les trois projets d'annotation.

Détection politique

Classification binaire de chaque phrase comme politique ou non-politique.

political_yes La phrase fait référence à l'actualité, des enjeux sociaux, des acteurs politiques, des rapports de pouvoir ou des normes sociales.
political_no La phrase relève de la vie privée, du récit personnel ou du divertissement sans portée collective.

Détection du discours de genre et analyse multidimensionnelle : présence du genre, valence (positive, négative, ambivalente), type de rationalité mobilisée et positionnement vis-à-vis de la science.

Genre

Le contenu traite-t-il du genre ? Référence directe ou indirecte aux hommes, femmes, masculinité, féminité, rôles de genre, féminisme, antiféminisme, relations homme-femme, LGBTQ+.

gender_yes Présence de discours de genre
gender_no Absence de discours de genre

Valence de genre

Tonalité du discours de genre.

genre_valence_positive Promeut l'égalité de genre ou remet en question les stéréotypes
genre_valence_negative Hostilité, critique ou propos dénigrants envers le féminisme ou l'égalité de genre
genre_valence_ambivalent Apparence égalitaire mais relativise ou limite l'égalité
genre_valence_null Pas de prise de position évaluative sur le genre

Type de rationalité

Type de rationalité mobilisée dans le discours de genre.

rationality_none Aucune rationalité justificative
rationality_nature Arguments biologiques, naturels, évolutionnistes ou religieux-naturels
rationality_liberal Invocation de l'égalité formelle ou des droits individuels pour nier la domination structurelle
rationality_empirical Statistiques, données ou « faits » comme justification
rationality_heroic Posture de vérité courageuse, anti-politiquement correct

Position scientifique

Positionnement vis-à-vis de la science dans le discours de genre.

science_none Aucune référence à la science
science_pro_science Valorise les études, experts ou la recherche
science_anti_science Discrédite le milieu académique ou la recherche
science_ambivalent Registres pro- et anti-science coexistent

Mesure des idées néo-réactionnaires (NR) centrées sur l'optimisme technologique, le libertarianisme et l'usage de métaphores fictionnelles dans le discours politique, ainsi que les dimensions partagées avec le SIED (égalité et écologie).

Technologie

Optimisme technologique, technocratie et transhumanisme.

techno_optimism_overall Vision optimiste ou positive du rôle de la technologie et de l'innovation
innovation_as_progress L'innovation technologique comme moteur de progrès ou solution aux problèmes sociaux
pro_tech_figures Référence favorable à des figures tech (Musk, Thiel, Altman, Zuckerberg…)
technocracy_over_democracy La gouvernance technocratique ou experte est plus efficace que la démocratie
deregulation_of_tech Dérégulation de l'innovation technologique comme nécessaire au progrès
transhumanism Soutien au transhumanisme, post-humanisme, eugénisme ou augmentation technologique de l'humain

Libertarianisme

Sécession, autonomie individuelle, communautés alternatives et modèle entrepreneurial comme contre-modèle politique.

lib_sec Soutien à la sécession ou rupture avec la communauté politique nationale
lib_autonomy Vivre de manière autonome, en dehors des structures étatiques traditionnelles
lib_community Création de communautés fondées sur leurs propres valeurs et règles
lib_company Le modèle entrepreneurial comme contre-modèle politique à l'État ou à la démocratie
lib_state L'État devrait être géré comme une entreprise, selon des critères de performance

Métaphores fictionnelles

Usage de métaphores issues de la fiction populaire pour structurer l'interprétation politique.

metaphor_redpill Référence à la « pilule rouge », éveil à une vérité cachée, sortie des illusions égalitaires ou démocratiques
metaphor_lotr Références au Seigneur des Anneaux pour conceptualiser des hiérarchies sociales ou civilisationnelles
metaphor_starwars Références à Star Wars pour cadrer la lutte politique, l'autorité ou la légitimité
metaphor_cathedral La Cathédrale comme métaphore des universités, médias ou institutions progressistes formant un système idéologique

Égalité SIED + NR

Rapport à l'égalité, hiérarchies sociales et biologiques.

equality_value L'égalité comme menace aux valeurs, traditions ou à l'ordre social
equality_identity L'égalité comme menace à l'identité française ou facteur de dissolution nationale
equality_gender Les inégalités entre les sexes présentées comme naturelles ou biologiquement fondées
hierarchy_castes La société décrite en termes de castes ou de hiérarchies sociales naturelles
hierarchy_IQ Le QI mobilisé comme critère de classement des individus ou des groupes
hierarchy_race Référence à des inégalités naturelles entre races ou groupes ethniques
equality_utopia L'égalité décrite comme irréaliste, naïve ou utopique

Écologie SIED + NR

Positionnement écologique : éco-scepticisme, techno-solutionnisme ou écologie civilisationnelle.

eco_eco La croissance économique est plus importante que la protection environnementale
eco_tech Les préoccupations écologiques comme obstacles au développement technologique
eco_civ Les défis climatiques cadrés comme compétition entre civilisations

Score idéologique d'extrême droite (SIED) développé dans Boursier & Lemor (2025), Revue française de science politique. Mesure la présence des catégories d'appartenance idéologique à l'extrême droite (CAIED) — nationalisme, immigration, démocratie, progrès, autorité, tradition — ainsi que les dimensions partagées avec le projet NR (égalité et écologie), à travers leurs sous-dimensions respectives.

Nationalisme

Constructions de la nation et de l'identité nationale.

nation_ethnic Nation comme communauté ethnique ou culturelle fondée sur les liens du sang ou les ancêtres communs
nation_family Nation associée à la famille, citoyens comme enfants de la patrie
nation_state Nation fusionnée avec l'État comme entité unique et inséparable
nation_vital La nation comme élément essentiel et indépassable de la vie humaine
nation_threat Nation décrite comme menacée, nécessitant protection ou défense
nation_colonialism Nostalgie coloniale ou déni des conséquences de la colonisation

Immigration

Cadrage de l'immigration comme menace.

immigration_identity Menace à l'identité nationale, la culture ou les valeurs françaises/européennes
immigration_security Association avec la délinquance, la criminalité ou le terrorisme
immigration_women Menace aux droits des femmes ou à l'égalité de genre
immigration_law Appel à une législation plus stricte sur l'immigration ou le droit d'asile

Démocratie

Rapport critique à la démocratie comme idéal ou régime politique.

demo_value La démocratie comme menace aux valeurs, traditions ou à l'identité nationale
demo_sep Remise en cause de la séparation des pouvoirs, renforcement de l'exécutif
demo_vain La démocratie décrite comme inefficace, lente ou incapable de bonnes décisions
demo_corrupt La démocratie comme fondamentalement corrompue ou captée par des intérêts particuliers
demo_beyond Appel à dépasser ou se révolter contre la démocratie
demo_neg Soutien aux régimes non-démocratiques (autoritarisme, monarchie, technocratie)

Progrès

Rejet de la modernisation, de la mondialisation et du changement progressiste.

progress_identity Le progrès comme menace aux valeurs, traditions ou à l'identité nationale
progress_stop Appel à freiner, limiter ou arrêter le progrès social ou les réformes progressistes
progress_glob Critique du progrès via la mondialisation ou l'UE comme destruction des identités

Autorité

Obéissance à l'autorité, usage de la force et traditionalisme.

authority_chief Importance d'un chef fort ou d'une figure providentielle pour protéger la nation
authority_essential Mesure politique présentée comme essentielle, urgente pour restaurer l'autorité
authority_security Importance de l'ordre et de la sécurité, lutte contre la délinquance
authority_army Valorisation de l'armée, la police ou les forces de l'ordre

Tradition

Défense des valeurs traditionnelles et du projet civilisationnel.

tradition_value Valeurs, coutumes ou identité françaises à préserver et promouvoir
tradition_threat La tradition ou les valeurs traditionnelles menacées, nécessitant protection
tradition_family Promotion du modèle familial traditionnel ou critique des transformations familiales
tradition_laicite La laïcité comme marqueur identitaire national plutôt que principe de neutralité
tradition_civilization La tradition comme projet civilisationnel de diffusion de valeurs supérieures

Égalité SIED + NR

Rapport à l'égalité, hiérarchies sociales et biologiques.

equality_value L'égalité comme menace aux valeurs, traditions ou à l'ordre social
equality_identity L'égalité comme menace à l'identité française ou facteur de dissolution nationale
equality_gender Les inégalités entre les sexes présentées comme naturelles ou biologiquement fondées
hierarchy_castes La société décrite en termes de castes ou de hiérarchies sociales naturelles
hierarchy_IQ Le QI mobilisé comme critère de classement des individus ou des groupes
hierarchy_race Référence à des inégalités naturelles entre races ou groupes ethniques
equality_utopia L'égalité décrite comme irréaliste, naïve ou utopique

Écologie SIED + NR

Positionnement écologique : éco-scepticisme, techno-solutionnisme ou écologie civilisationnelle.

eco_eco La croissance économique est plus importante que la protection environnementale
eco_tech Les préoccupations écologiques comme obstacles au développement technologique
eco_civ Les défis climatiques cadrés comme compétition entre civilisations
Technologie

Propulsé par LLM_Tool

LLM_Tool
CamemBERT
Hugging Face
Ollama
PyTorch
PostgreSQL

Les 20 vidéos les plus vues du corpus YOUPOL, couvrant toutes les orientations politiques et les deux pays.

# Chaîne Titre Vues Likes Commentaires Orientation Pays Date
Contacter l'équipe
Une question sur les données, l'API ou le projet ? Envoyez-nous un message.
Proposer une chaîne ou fonctionnalité
Aidez-nous à enrichir le corpus YOUPOL. Proposez une chaîne YouTube politique que nous devrions suivre, ou une fonctionnalité.