-
Partager cette page
Membre non permanent
Céline BURET
Ingénieure d'études corpus occitansCoordonnées
- Adresse
- Laboratoire CLLE - UMR 5263 - Maison de la Recherche - Université Toulouse Jean Jaurès - 5 Allées Antonio Machado - 31100 Toulouse
- Bureau
- B521
- celine.buret@univ-tlse2.fr
Corps
Activités / CV
déc. 2024 - oct. 2025
Prise en charge d’une partie des missions de l’équipe OCRE dans le projet ANR DiViTal (accroître la vitalité et la visibilité de plusieurs langues de France), en particulier la collecte de données pour la constitution des corpus occitans, l’acquisition des textes (selon le cas : numérisation, océrisation, transcription), la saisie des métadonnées, l’encodage ou la conversion des données au format requis (XML TEI P5), l’intégration des textes dans les bases textuelles du projet (BaTelÒc et ParCoLab), puis l’alignement avec d’autres langues régionales ou nationales dans ParCoLab.
Gestion des annotations des corpus occitans dans ArboratorGrew : projet DIVITAL_occitan.
oct. 2013 - oct. 2015
Conception de dictionnaires en ligne dans le cadre du projet ANR HimalCo (corpus parallèles en langues himalayennes) au LACITO : développement de la bibliothèque Python LMF library basée sur la norme ISO LMF pour le traitement automatique des données, conversion vers d'autres formats (XML TEI), documentation (Doxygen, LaTeX).
Design et développement web (HTML 5.0, XSL, PHP, Javascript).
Archivage de corpus : annotations (XML) et métadonnées (Dublin Core).
Développement d'outils (Perl, Bash) pour le traitement algorithmique des données linguistiques de terrain (Toolbox, LexiquePro).
Article
Bonnet, Rémy, Céline Buret, Alexandre François, Benjamin Galliot, Séverine Guillaume, Guillaume Jacques, Aimée Lahaussois, Boyd Michailovsky & Alexis Michaud. 2017. Vers des ressources électroniques interconnectées : Lexica, les dictionnaires de la collection Pangloss. 9èmes Journées Internationales de la Linguistique de corpus, pp. 48–51. Grenoble. https://halshs.archives-ouvertes.fr/halshs-0155734