Membre non permanent

Céline BURET

Ingénieure d'études corpus occitans

Coordonnées

Adresse
Laboratoire CLLE - UMR 5263 - Maison de la Recherche - Université Toulouse Jean Jaurès - 5 Allées Antonio Machado - 31100 Toulouse
Bureau
B521
Mail
celine.buret@univ-tlse2.fr

Corps

Ingénieure d’études

Activités / CV

déc. 2024 - oct. 2025

Prise en charge d’une partie des missions de l’équipe OCRE dans le projet ANR DiViTal (accroître la vitalité et la visibilité de plusieurs langues de France), en particulier la collecte de données pour la constitution des corpus occitans, l’acquisition des textes (selon le cas : numérisation, océrisation, transcription), la saisie des métadonnées, l’encodage ou la conversion des données au format requis (XML TEI P5), l’intégration des textes dans les bases textuelles du projet (BaTelÒc et ParCoLab), puis l’alignement avec d’autres langues régionales ou nationales dans ParCoLab.
Gestion des annotations des corpus occitans dans ArboratorGrew : projet DIVITAL_occitan.

oct. 2013 - oct. 2015

Conception de dictionnaires en ligne dans le cadre du projet ANR HimalCo (corpus parallèles en langues himalayennes) au LACITO : développement de la bibliothèque Python LMF library basée sur la norme ISO LMF pour le traitement automatique des données, conversion vers d'autres formats (XML TEI), documentation (Doxygen, LaTeX).
Design et développement web (HTML 5.0, XSL, PHP, Javascript).
Archivage de corpus : annotations (XML) et métadonnées (Dublin Core).
Développement d'outils (Perl, Bash) pour le traitement algorithmique des données linguistiques de terrain (Toolbox, LexiquePro).

Article

Bonnet, Rémy, Céline Buret, Alexandre François, Benjamin Galliot, Séverine Guillaume, Guillaume Jacques, Aimée Lahaussois, Boyd Michailovsky & Alexis Michaud. 2017. Vers des ressources électroniques interconnectées : Lexica, les dictionnaires de la collection Pangloss. 9èmes Journées Internationales de la Linguistique de corpus, pp. 48–51. Grenoble. https://halshs.archives-ouvertes.fr/halshs-0155734

Publications extraites de HAL affiliées à Cognition, Langues, Langage, Ergonomie