ERSS Axe 4 CARTEL

Corpus, Applications et Ressources pour le Traitement et l'Etude du Langage (CARTEL)

Les recherches de l'axe CARTEL portent sur le développement, l'adaptation et l'utilisation de ressources informatiques pour l'étude du langage. L'approche développée dans cet axe est essentiellement linguistique. Elle se fonde sur l'idée que l'observation de données massives fait émerger des questionnements linguistiques originaux et que l'exploitation de ressources riches et variées peut contribuer à leur traitement. Les travaux de l'axe visent à la fois :
  • la construction de ressources langagières (corpus et lexiques) ;
  • le développement d'outils d'ingénierie linguistique ;
  • l'analyse linguistique outillée ;
  • la modélisation du lexique.

Nos recherches abordent des domaines variés : la structuration du lexique sur les plans sémantiques et morphologiques, les aspects linguistiques de la recherche d'information, l'analyse syntaxique et discursive, la classification de documents, etc. Les productions (outils et données) sont rendues accessibles à la communauté, aussi librement que le permettent les contraintes de propriété, sur le serveur dédié REDAC (REssources Développées À CLLE-ERSS) : redac.univ-tlse2.fr

Les trois principales thématiques de l'axe CARTEL sont :

Spécificités des travaux de l'axe

Au sein d'un environnement scientifique qui oriente le TAL vers un usage intensif de méthodes statistiques sur des données massives, nous privilégions le traitement linguistique. Notre approche donne une place centrale à l'observation fine des données manipulées avant et pendant un traitement automatisé, et au questionnement linguistique, même lorsque nous répondons à des besoins applicatifs. Ceci ne nous empêche pas de faire usage des méthodes par apprentissage (classification, fouille de données), en les articulant le plus souvent avec des modes d'observation outillés allant de la structure globale (visualisation, statistiques) aux phénomènes locaux (en facilitant le retour aux données initiales).

Productions de l'axe

Les travaux de l’axe se traduisent notamment par la production de corpus, outils et ressources numériques à destination des études langagières et des applications du TAL. La liste accessible ici donne les principales productions récentes, que nous avons cherché à rendre aussi accessibles que possible. Elles sont pour la plupart également disponibles en ligne sur le site REDAC (REssources Développées À CLLE-ERSS) avec d’autres, plus anciennes.

Projets financés

Les membres de l'axe participent à ou coordoonnent différents projets financés dont la liste (pour les dernières années seulement) est disponible ici.

Liens avec l'enseignement

Les membres de l'axe CARTEL sont impliqués dans deux masters spécifiques :

Dans le cadre du master LITL, le séminaire Thématiques Actuelles de la Recherche en TAL permet aux chercheurs de présenter leur travaux en cours et d'échanger entre eux et avec les étudiants.
Voir ici le programme du séminaire

 



Responsable
Ludovic Tanguy (MCF HDR)

Membres permanents
Gilles Boyé (MCF)
Cécile Fabre (PR)
Bruno Gaume (CR)
Nabil Hathout (DR)
Lydia-Mai Ho-Dac (MCF)
Anna Kupść (MCF)


Doctorants
Adel Ghamnia
Filip Miletic
Bénédicte Pierrejean
Daniele Sanacore
Gauvain Schalchli
Yizhe Wang
Marine Wauquier

Membres associés
Assaf Urieli