CARTEL : Caractérisation et classification linguistique de corpus

 

Prenant appui sur son expertise dans les différentes techniques et outils d'annotation linguistique, l'axe CARTEL dispose d'une compétence opérationnelle pour l'exploration et l'exploitation de corpus textuels.

Le point fort de nos travaux repose sur la multiplicité des niveaux d'annotation mobilisables, en articulation avec les compétences linguistiques disponibles dans l'équipe ERSS aux niveaux morphologique, lexical, syntaxique, sémantique, structurel et discursif. Ces annotations ont deux objectifs principaux : l'exploration de corpus à des fins de description et la classification automatique de documents (suivant par exemple leur thème, leur catégorie spécifique ou leur auteur).

Cette expertise donne à l'axe la capacité d'aborder des matériaux très variés (rapports d'incidents, articles scientifiques, messages dans les réseaux sociaux, etc.) et ainsi de lier des collaborations avec des partenaires académiques et de répondre à des questions posées en dehors de la sphère universitaire.

À voir entre autres :

  • Talismane, analyseur automatique développé à CLLE, effectue une annotation syntaxique du français
  • collaboration avec la société CFH / Safety Data pour l'analyse de rapports d'incidents aériens
  • projet ANR ANNODIS sur l'annotation discursive
  • projet Inter-MSH PATIENTS' MIND sur l'analyse des forums de santé
  • projet ANR ORFEO sur la constitution d'un Corpus d'Etude pour le Français Contemporain
  • projet ANR CRISTAL sur l'identification de Contextes RIches en connaissanceS pour la TrAduction terminoLogique
  • projet ANR CAAS (Contextual Analysis and Adaptive Search) sur l'analyse et la classification de requêtes en recherche d'information
  • projet ANR RESOCIT sur l'analyse des citations dans les articles scientifiques
  • l'axe a participé aux tâches collaboratives d'attribution d'auteurs PAN (en 2011 et 2012)