Contexte
Ce stage s’inscrit le cadre du projet OOPAIP (Ontologie et outil pour l’annotation des interventions politiques). C’est un projet transdisciplinaire financé dans le cadre du DIM STCN (Sciences du Texte et connaissances nouvelles) par le Conseil régional d’Ile de France. Il est porté par le CESSP – UMR 8209 (Centre européen de sociologie et de science politique) du CNRS et de l’Université Paris 1 Panthéon-Sorbonne, par l’INA Recherches (Institut national de l’audiovisuel) et le LIMSI-UPR3251 (Laboratoire d’Informatique pour la Mécanique et les Sciences de l’Ingénieur) du CNRS. L’objectif est de concevoir de nouvelles approches d’analyses détaillées, qualitatives et quantitatives des interventions politiques en France, dans les médias. Une part du projet porte sur l’étude de la dynamique des interactions conflictuelles dans les interviews et débats politiques, ce qui nécessite une description précise et un large corpus afin de généraliser des modèles de reconnaissance automatique des tours de parole. L’objet du projet est – outre l’analyse de sciences sociales – l’amélioration de la précision des algorithmes de détection de la parole superposée. Cette recherche doit permettre d’optimiser le travail d’annotation manuelle, et faciliter le travail d’analyse fine sur des corpus audiovisuels.
Objet du stage
Depuis octobre 2018, le travail réalisé en commun entre les chercheurs de l’université Paris 1 Panthéon-Sorbonne et le personnel de l’INA Recherche s’est principalement concentré sur la question des dynamiques d’interactions entre journalistes et hommes ou femmes politiques. Pour ce faire nous avons constitué un corpus de 30 interviews télévisées tirées de deux chaînes de télévision (France 2 et BFM TV). Invités sur un plateau, les professionnels de la politique sont immédiatement évalués par rapport à un attendu de rôle qu’ils.elles sont censé.e.s incarner et que le.s journaliste.s rappellent en permanence. Mais le.la journaliste lui-même est sous le regard du public des pairs et des concurrents du champ journalistique et politique, étant « trop » condescendant, connivent ou agressif, trop ou pas assez pugnace. Chaque tour de parole doit donc être annoté par un descripteur (pose une question, répond à la question, interruption, relance, demande de précision, énervement, etc.) afin de pouvoir étudier en détail les modalités de ces dynamiques d’interactions.
Dans ce projet, nous cherchons précisément à appréhender (voire à modéliser) l’analyse des discours et des rôles à la lumière d’un ensemble de variables descriptives et explicatives simples mais extrêmement précieuses sociologiquement : un ensemble d’indicateurs contextuels (type de média ; chaîne ; format de l’émission), conjoncturels (noms des journalistes et des invités) ainsi que des indicateurs de capitaux au sein du jeu politique (parti et famille politiques, majorité/opposition, position dans le champ politique) et de propriétés sociales (genre, études, âges) pour certaines attribuées conjoncturellement (titre à parler et opportunité de l’invitation). Pour ce faire, l’enquête s’intéresse à la fois aux discours et à leurs producteurs et croise analyse de discours et analyse positionnelle, effets de conjoncture et propriétés socio-biographiques des intervenants. Le travail engagé participe à l’élaboration d’une ontologie des types de prise de parole, des thématiques politiques abordées et des rôles incarnés et jouées (avec une classification des attitudes de rôles) pendant ces interviews. Ce travail permet en parallèle de travailler finement à la segmentation des entretiens afin d’apprendre aux algorithmes à repérer les tours de parole et les mécanismes de parole superposée. Ce travail d’annotation des entretiens s’effectue grâce à la plateforme OKAPI de l’INA. Le travail de l’année 2020-2021 consiste à poursuivre le travail d’annotation des entretiens des matinales radios.
Missions
Le.la stagiaire en traitement de données encadré par l’équipe CESSP devra :
- Poursuivre le travail d’annotation des données sur un nouveau corpus consacré aux matinales radios, retransmises en ligne ou à la télévision. Son action portera essentiellement sur le traitement des émissions grâce à la plateforme OKAPI.
- Participer au travail collectif de développement de l’outil (catégories et annotation) dans le cadre d’entretiens collectifs, avec comme terrain, les débats télévisuels pour la campagne pour les européennes de 2019.
Valorisation du stage
Différentes stratégies de valorisation des travaux du·de la stagiaire seront envisagées, en fonction du degré de maturité des travaux réalisés :
- Finalisation d’un travail de recherche de master et/ou préparation d’un éventuel terrain de thèse
- Diffusion des outils d’analyse réalisés sous licence open-source
- Rédaction de publications scientifiques
Conditions du stage
Le stage se déroulera sur une période de 4 à 5 mois, au sein du CESSP. Il.elle pourra être amené à se rendre à l’INA à Bry-sur-Marne. La·le stagiaire sera encadré·e par Nicolas Hubé (nicolas.hube chez univ-paris1.fr) et sera intégré à une équipe de 8 chercheur-e-s du CESSP et d’INA Recherche engagé-e-s sur ce projet.
Gratification conforme au cadre légal.
Profil recherché
- Étudiant·e en dernière année d’un bac +5 dans le domaine de la sociologie politique, des sciences de l’information et de la communication, de l’analyse de discours.
- Vif intérêt dans les SHS, les humanités numériques et les sciences politiques en particulier, le journalisme et les débats télévisés. Une connaissance du TAL serait un plus.
- Appétence pour le traitement de données, et l’annotation de base de données
- Capacité relationnelle d’échange et de coordination avec les autres équipes engagées dans le projet ; appétence pour la recherche collective.
- Travail en autonomie
Encadrement du stage et contact
Pour postuler, vous pouvez envoyer un email à Nicolas Hubé (nicolas.hube chez univ-paris1.fr) et Pierre Mayance (Pierre.Mayance chez univ-paris1.fr) comprenant un CV et une lettre de motivation.
Institutions
Centre Européen de sociologie et de science politique
CESSP