Chercheur en analyse outillée de données linguistiques

A propos de nous

AFFECTATION

<  Laboratoire d’Affectation : La personne recrutée sera affectée à la Maison des sciences Sociales et des Humanités de Dijon (MSH Dijon)

<  Composante : UAR 3516 CNRS – Université Bourgogne Europe (UBE)

<  Descriptif Laboratoire : La MSH Dijon, est un Centre de Recherche à caractère fédératif de l’UBE et une Unité d’Appui et de Recherche CNRS qui organise le regroupement, la coordination, l’impulsion et la promotion des activités de recherche en Sciences Humaines et Sociales, en soutenant notamment des programmes transdisciplinaires autour d’axes thématiques. La MSH Dijon accompagne les projets de recherche tout au long de leur déroulement, de la genèse à la publication scientifique, en visant une diffusion large des résultats. En appui, des équipements techniques (1 plateforme technologique Humanités Numériques composée de 3 pôles : « Archives, Documentation, Numérisation (ADN) », « Géomatique Bourgogne/Franche-Comté (GEOBFC) », « Plateforme Universitaire de Données (PUDD ») sont dédiés à la constitution et à l’exploitation de corpus numériques.

La MSH Dijon regroupe ainsi un ensemble de moyens au service du travail de recherche des 16 laboratoires qui lui sont associés et notamment les laboratoires/équipes impliqués dans le projet interdisciplinaire de recherche (unités de recherche CIMEOS, TIL, LIB) ayant pour objet : « Un dispositif de détection et d’analyse des stratégies de manipulation de l’information par les armées de robots sur Twitter (Beelzebot) » porté par Gilles Brachotte (Laboratoire Communication, médiations, organisations, savoirs – CIMEOS)



PROJET ET DOMAINE DE RECHERCHE

Projet de recherche : Objectif, Description, Contexte et Justification Scientifique

<  Objectif : Analyses sémantiques outillées du corpus du projet Beelzebot en vue d’une modélisation de critères de reconnaissances linguistiques des armées de robots sur X.

<  Description : Le contrat s’intègre dans le lot « Identification linguistiques des armées de robot » du projet ANR Beelzebot. Il viendra compléter les résultats obtenus par l’approche informatique.

<  Justification scientifique : Sur la base des travaux actuels en TAL et en IA appliquée au traitement linguistique, et dans le paradigme des approches constructionnelles des langues naturelles, il s’agit de vérifier l’hypothèse selon laquelle l’identification de patterns lexico-grammaticaux peut livrer des indices fiables d’identification qualitative de messages sur X générés par des armées de robots. Le travail s’inscrit donc dans le cadre des recherches sur la dimension linguistique de la communication médiée par ordinateurs.



Phasage du projet :

M1 – M6 : Prise en main du corpus de tweets et préparation du jeu de données pour l’analyse linguistique.

M7 – M18 : Analyse du corpus par différents outils.

M14 – M18 : Rédaction d’un ou plusieurs articles de discussion des résultats.

Mission proposée

Préparation du corpus pour l’analyse linguistique

Tests comparatifs d’outils de TAL et de LLM pour l’analyse lexico-grammaticale

Veille bibliographique

Rédaction d’un état de l’art

Communication lors de colloques

Rédaction scientifique (abstracts, articles

 

Champ relationnel :   

La personne recrutée travaillera en lien étroit avec les chercheurs des laboratoires sus-mentionnés, en particulier avec l’équipe Modèles & Discours de TIL.


<  Catégorie hiérarchique : catégorie A

<  Localisation géographique : le poste sera basé à la MSH Dijon, 6 Esplanade Erasme, 21000 Dijon.

<  Droits et obligations notamment déontologiques et de propriété intellectuelle :

Le bénéficiaire (post-doctorant) sera tenu au secret professionnel à l’égard des tiers, non seulement sur les activités du laboratoire touchant au domaine de l’étude et des recherches, mais également sur les activités du laboratoire dont il pourrait avoir connaissance. Il ne pourra faire de publications ou de communications écrites ou orales relatives à ses recherches qu’après accord préalable du Responsable Scientifique du projet. Les publications et communications du post-doctorant devront nécessairement être cosignées par le responsable scientifique des recherches, membre titulaire du laboratoire. Le résultat des recherches « brevetables » ou non, seront la propriété pleine et entière du laboratoire qui pourra déposer des brevets en son nom, pour protéger les inventions réalisées.


Début de contrat prévisible : 17/03/2025

Rémunération brut mensuelle indiquée : cf. arrêté du 04/11/2021

Notre profil idéal

Le candidat doit avoir obtenu un doctorat en sciences du langage ou informatique avec spécialisation en TAL.



Diplôme – Qualification – Domaine d’études requis

Le candidat doit avoir obtenu son doctorat avant la prise de poste.

Le candidat devra avoir moins de 3 ans d’expériences après la soutenance de sa thèse.



Compétences attendues

– Connaissances des modèles actuels de sémantique cognitive (frame semantics, grammaires de constructions, grammaire de patterns)

– Compétences en analyse linguistique

– Compétences en TAL et IA appliquée au traitement linguistique

– Compétences en traitement de corpus

– Compétences en rédaction scientifique en français et en anglais

– Capacité avérée au travail interdisciplinaire

Publié le 13/02/2025
Dijon
37,50h
/semaine
2271€
/mois
CDD Post-Doc

Partager cette offre

Intéressé(e) ? Pour postuler c'est ici que ça se passe !

Maximum file size: 20 Mo
Maximum file size: 20 Mo
Maximum file size: 20 Mo