Réunion de co-pilotage n°4 / 13.12.23
Organisations impliquées : QuotaClimat, Eleven strategy, Climat Médias, Expertises Climat
Thème : Général/Enjeux
Type d'événement :
Commun(s) impliqué(s) : Baromètre du traitement médiatique des enjeux écologiques
Compte-rendu comité de pilotage 3 du baromètre 17 novembre 2023 📝Tour de table et synthèse ● Signature dossier ADEME ● Levée de fonds QuotaClimat: Présentation de l’évènement ⇒ Réponse des partenaires: L’objectif est de faire du consortium une réalité. Pour cela, il faut prendre les bonnes habitudes de formulation (en présentant les partenaires) quand on présente le projet de baromètre, pour bien le distinguer avec le baromètre initial D4G et QC. ● Vision budget et financements ○ ANR : non retenu ● Autre? 🏗️ Retours sur les chantiers en cours Rencontre écosystèmes Resp : All Synthèse des échanges bilatéraux avec les autres acteurs intéressés par le projet ● QuotaClimat ○ MeCCO ■ On a discuté avec Max Boykoff (Un des co-fondateurs de MeCCO - lead project investigator, Professor Environmental Studies at University of Colorado, currently in Singapore for the Yale partnership). ■ Créé par des professeurs universitaires américains, MeCCO est un observatoire en ligne qui suit le traitement médiatique du sujet climatique à l’échelle globale. ■ Niveau méthodo: Fonctionnement par mots clés, 131 sources (journaux, radio et télévision) dans 59 pays de sept régions différentes du monde. Par l'intermédiaire des bases de données Nexis Uni, Proquest et Factiva via les bibliothèques de l'Université du Colorado. En France, ils regardent le Monde et Le Figaro. ■ Aujourd’hui l’Observatoire est généralement utilisé à des fins académiques. Ils publient des revues mensuelles. ■ Faute de financements, ils ont peu de capacité de développement ■ Pour voir le site: https://sciencepolicy.colorado.edu/icecaps/research/media_coverage/index.html ○ IPBES: ■ On a rencontré Robert Spaull (Head of communication de l’IPBES), avec qui on pu échanger sur la couverture médiatique des enjeux liés à la biodiversité. ■ Au delà de la prise de contact, l’objectif de cette rencontre était de comprendre leurs stratégies de communication, les obstacles qu’ils rencontraient, les améliorations qu’ils observaient, et leur regard sur des initiatives émanant de la société civile sur ces sujets. ■ Il était particulièrement intéressé par le baromètre, car il est étroitement lié au travail de l’équipe de communication de l’IPBES qui a mis au point une méthodologie de “suivi”/ tracking de leurs propres publications et concepts clés dans les médias. ■ Volontaire pour un échange sur la méthodologie du baromètre. A suivre! ● Climat Medias: Baromètre de la science ouverte : ○ Emmanuel Weisenburger travaille au sein du ministère de l'enseignement supérieur et de la recherche, entre autre ,sur le projet de baromètre de la science ouverte. ○ Enjeu de ce baromètre : doter le ministère d’un outil de connaissance du paysage de la recherche française et de mettre en valeur cette richesse. Il est revenu sur leur expérience. Au début, ils ont démarré avec une intuition mais les sources de datas qu'ils voulaient utilisées étaient payantes. Ils ont voulu créé un système qui libère la data. Objectif : rendre accessible les papiers scientifiques, suivre la part des publications qui sont entièrement accessibles, identifier les chercheurs, leur labo… ○ Etape 1 : Au départ ils ont passé de nombreux mois à expliquer leur méthodologie avant de publier leurs premières données, ça a permis de débattre longuement, d'expliquer, d'améliorer, de rassurer. Gain de temps pour la suite, selon lui. La méthodologie a été déposée scientifiquement en 6 mois en format pré print Puis ont publié très peu d’indicateurs sur une simple page : la part des publications en accès ouvert décliné par grands champs scientifiques avec quelques graphes. Ca a permis d'éviter de cibler des labo ou des territoires qui étaient en retard. Pas de name & shame pour limiter les critiques et favoriser l'appropriation de l'outil. ○ ETAPE 2 (N+2) : Ils ont amélioré l'interface et ont ajouté de + en + d'indicateurs. Une chercheuse a voulu décliner ce baromètre au niveau local. Ils ont travaillé avec elle pour mettre en place une manière de décliner les données. Aujourd'hui il y a 200 baromètres de la science ouverte locaux. La démarche ayant fait ses preuves, la demande est venue d'elle même. Une communauté s'est donc constituée est s'autogère désormais. Sont considérés comme la meilleure source de statistique française. Leur niveau de qualité constitue une certaine assurance et ont une communauté d’utilisateurs. ○ ETAPE 3 : La plateforme a été envisagée de manière multilingues dès le départ. Rapidement ils ont été identifié au niveau international. La data qu'ils ont créé est réutilisée par de multiples acteurs (partisans, commerciaux, .. ) Ils ne savent pas tout. Seule obligation : citer l'origine de la data. ⇒ au final est très intéressé par nos travaux. Envisage de nous aider dans l'identification des chercheurs dans les médias à minima. En attente de son retour sur ce point. A voir si d'autres pistes de collaboration sont envisageables. Communication externe Resp : QuotaClimat Restitution de la dernière réunion ● Etat d’avancement des EDL: Les partenaires s’accordent sur l'importance de concentrer nos EDL davantage sur le besoin d'obtenir des données unifiées et fiables ⇒ Pour V. Martin: 6 / 7 points clés, qui sont updatés régulièrement (qu’est ce qu’on peut dire ou pas) ⇒ Next steps: Pour Janvier - QuotaClimat fait une proposition du statement + Note de cadrage pour l’évenement du livrable intermédiaire ● Retours sur la charte visuelle: Points d’amélioration et de progression ● Décision sur la communication de la COP28: Les acteurs du consortium peuvent utiliser les données pour des analyses ponctuelles sur la COP28 et communiquent séparément pour leurs propres besoins ● Recherche d’un Web Designer pour l’Observatoire: Jean voit jeudi à 14h l'UI/UX designer de CarbonBombs qui est intéressé par le projet, pour lui présenter à quoi pourraient ressembler un peu les analyses ● Evenementiel: Evénement de lancement du livrable intermédiaire: Objectif de présenter au cercle “initié” l’Observatoire, sa mission, sa structure et son intérêt - pour intéresser, mobiliser. En fonction de l’état d’avancement de l’outil, il faudra définir le périmètre des invitations, la nature de l’évènement, garantir la présence de l’ADEME et - Plutot vers mars? Développement de l'outil Resp : Paul & Data4good ● Développement de l’outil: Mis en pause en attendant le web design***
Analyses Resp : Expertises Climat, Climat Medias, QuotaClimat ● Avancement de la réflexion sur les analyses ○ Retours sur la formation data analyse ○ Présentation du nouveau document de travail ○ Etat d’avancement des briques d’analyse et de la construction de la méthodo (progrès et points de blocage) ⇒ Il serait intéressant d’observer la progression de certains concepts dans l’espace médiatique: e.g surconsommation, compensation carbone, capture cabrone.. Peut etre l’objet d’analyses ponctuelles Comité d'experts Resp : Climat Medias ● Restitution de la dernière réunion du comité d’experts : PHASE 1 : Approche quantitative : Soit on reste avec une approche texto métrique (nombre de mention des mots) - (A) soit on a une approche temps d'antenne (B). A. Pour ce qui concerne l'approche texto métrique : 2 options 1. Chercher à constituer un dictionnaire d'une 30aine de mots à forte occurrence : 1. Soit on part de documents existants qui vulgarisent les rapports scientifiques et voir quels sont les mots qui ont le + d'occurence et les conserver. 2. Soit possible également d'avoir la base complète des retranscriptions et de compter les mots qui reviennent régulièrement. B. Pour ce qui concerne l'approche temps d'antenne : La méthode qui consiste à compter un segment d'1 minute avant 1 minute après un mot clef identifié nécessite d'être clarifiée auprès de médiatree pour être certain que cela fonctionne par segment et non par somme de mots clefs, sinon risque d'avoir plus de 100% de temps d'antenne. Différentes méthodes proposent de segmenter les mots clefs (et non les comptabiliser un à un) pour éviter un surcomptage. Pistes : Comparer les temps d'antennes identifiés par les bénévoles Climat Médias et récupérer les transcriptions sur cette méthode. Clarifier les possibilités avec Médiatree Conclusion des experts : Approche temps d'antenne ⇒ Réfléchir à ce que mesure ce chiffre exactement. Attention à ne pas lui faire dire n'importe quoi. Globalement cette méthode permettra de mesurer si un sujet est abordé ou pas et permettra de mesurer ses évolutions et de comparer certains médias entre eux. L'enjeu sera sur les ordres de grandeur. PHASE 2 : Approche qualitative pour les briques suivantes : C'est extrêmement complexe à faire. Machine learning passera par d'autres méthodes d'étiquetage et de labélisation humaine sur la base d'autres corpus pour entrainer les algo. Nous devons peaufiner la méthode. Cela va nécessité une grosse part de travail manuelle pour faire les bases de données d'entrainement des algorithmes. Présenter la base d'apprentissage, voila ce qu'on a considère comme une solution ou pas, une solution adaptation / atténuation … voir si les analyses de climat médias peuvent permettre d'étiqueter les risques d'être attaquer de subjectivité. ⇒ problème en un an risque d'être compliqué de donner un livrable. Quid des autres indicateurs + faciles à obtenir qui pourraient qualifier la qualité de l'information : adaptation / atténuation : ok semble pas trop compliqué. Quid du recours à des ordres de grandeur ? Dans quelle mesure les sujets climat couvrent toutes les rubriques d'une rédaction (politique / économique / faits divers / culture..). Conclusion : Enjeu : ● Brique 1 quanti : ○ finalisation du dictionnaire : creuser les différentes approches existantes en choisir une (méthode de mots clefs, de densité de mots clefs, approche d'identification des segments, approche iramuteq...) et être transparent sur le corpus utilisé et le dictionnaire. présentation d’exemples de construction dynamique de dictionnaires. ○ pour ce qui concerne le temps d'antenne, besoin de recroiser avec des analyses manuelles pour avoir une estimation de la marge d'erreur. Il faudra faire attention à ce qu'on en dit. Regarder le + et le mieux. ● Brique 2 quali : Identifier les outils qu'on a : les tableurs de classification des transcripts, les logiciels, se mettre d'accord sur une ou des méthodes et on voit comment on peut faire ce travail d'entrainement. Pour la partie “solutions” prévoir une revue par les paires à prévoir. ● Brique R&D : on n'a pas eu le temps d'en parler. Eleven contactera certains chercheurs pour avancer sur ce point. Nécessitera de travailler sur des bouts concrets de textes et trouver un process de validation par des paires. ● Perspectives du comité d'experts : Il est nécessaire de poursuivre le travail de manière transversale pour construire une bonne base, échanger sur les segments et comment on s'assure qu'on a rien oublié sur les mots et minutages. Prévoir pour la prochaine séance de faire une analyse entre la méthode du temps d'antenne et ce qui a été fait avec climat médias. Faire la chaine de bout en bout, faire le test de la liste des mots clefs + voir ce qui a déjà été quantifié et le comparer avec la méthode de calcule d'antenne. pour voir si méthode de temps d'antenne est pertinente ou pas. ● Calendrier: Conserver une réunion du comité d'expert tous les mois et demi afin de partager les points d'avancement et de blocage et de créer de la lisibilité pour tous les scientifiques sur le projet global. ⇒ Un framadate va être prochainement envoyé pour caler une réunion de 2h sur janvier
Point API MediaTree
Resp : eleven Strategy
● Capacités de l’API
● Notre utilisation envisagée
○ Récuperer et “reconstruire” tout le flux entre deux dates
■ Mettre “bout à bout” les blocs de 2 minutes pour une semaine par exemple
○ Une fois qu’on a tout le flux, faire les analyses comme détaillées dans la méthodo (par mots clés ou autre)
Présentation d’exemples de construction dynamiques de dictionnaires
Resp : eleven Strategy
Méthode
● Prendre tout le flux de certaines chaines (ex: Fr2 et M6) entre deux dates (ex: les deux derniers mois).
● Isoler les extraits contenant un mot clé (ex: “changement climatique”) et leur contexte (blocs de 6 minutes autour du mot clé donné)
● “Nettoyer” le texte
○ enlever les “stopwords”, mots qui reviennent souvent sans ajouter de contexte (de, la, les…)
○ prendre la racine de chaque mot (aimer, aimons, aimé… deviennent aim)
● Compter les occurences de chaque mot
● Prendre le top N (ex: 20) mots qui reviennent dans ces extraits
Résultats (voir Notion pr les photos)
Limites & Next Steps
● Méthodologie à faire varier: prendre des extraits plus longs, prendre plus de top mots…
● Liste de “stopwords” à modifier
● Contenu à ajouter (+ de chaines, sur un temps + long)
Côté R&D
Resp : eleven Strategy
Développement de 3 sujets en // mais les sujets sont complémentaires
● Sujet Classification
○ Définitions des catégories à trouver - À valider avec le comité d’experts
○ Développements en cours
■ supervisé et non supervisé
■ approche binaire (climat vs non climat) puis classification précise
■ LLM à explorer
● Sujet Discours de l’inaction
○ Ébauche d’une méthodo
○ Défrichage du sujet et des problématiques
○ Définitions des discours - à valider avec le comité
● Sujet Fact-checking
○ Défrichage du sujet et des problématiques
○ Ébauche d’une méthodo
○ Sources de vérité - à valider avec le comité
🎯 Prochaines étapes
● Prochaine réunion du comité d’experts : Janvier - TBD
● Prochaine réunion groupe de travail communication externe : 22 janvier - 15h
● Prochaine réunion analyses: Vendredi 15 décembre
● Prochain meeting co-pil : 19 janvier 2024