Expressions polylexicales : a-t-on fait le tour de la question ?

Publié le 8 janvier 2020 Mis à jour le 13 février 2020
le 2 avril 2020 Salle E412 MDR

Carlos Ramisch, Aix-Marseille Université, Laboratoire d'Informatique et Systèmes (LIS) (Séminaire CLLE-ERSS - 14h/15h)

Dans cet exposé plus ou moins autobiographique, je parlerai de nos travaux en *identification d'expressions polylexicales* (EP) en TAL. Comme dans tout exposé sur les EP, j'essayerai (probablement sans succès) de dessiner les contours de ce phénomène linguistique hétérogène, défini par son caractère idiosyncratique par rapport à la composition régulière. Ensuite, je donnerai ma définition de la tâche d'identification (vs. découverte) d'EP, c'est-à-dire, le repérage automatique d'*occurrences d'EP* dans un texte. Je vais alors brièvement survoler quatre de nos contributions dans ce domaine. Premièrement, je parlerai de la *campagne d'évaluation PARSEME* : son guide d'annotation, ses corpus multilingues, ses mesures d'évaluation. Deuxièmement, je parlerai de notre propre soumission à la campagne d'évaluation : un système fondé sur les *réseaux de neurones récurrents * appelé Veyn. Troisièmement, je présenterai quelques résultats d'une analyse linguistique où nous avons démontré que les EP verbales sont *moins ambiguës* que ce qu'on ne croyait initialement. Pour finir, je présenterai une prise de position sur la *nécessité de lexiques syntaxiques* pour l'identification d'EP.

Note : tous les travaux qui seront présentés ont été effectués avec de nombreux co-auteures et co-auteurs que je créditerai pendant l'exposé.