BaTelÒc

Le laboratoire CLLE-ERSS de l'Université Toulouse-Jean Jaurès propose BaTelÒc, une base textuelle en langue occitane qui rassemble des œuvres écrites du XIXe siècle à nos jours.
Ce corpus est le résultat d'années de travail. Il réunit des œuvres de plusieurs genres (roman, théâtre, poésie, conte, presse...) et accueille la variation graphique et dialectale. Les textes sont encodés selon les formats standard de constitution et de diffusion de corpus (format XML, norme TEI P5).
L'accès à ces données est essentiel pour les études linguistiques, car elles sont nécessaires pour construire un dictionnaire général de la langue occitane, pour les recherches en littérature, en sciences humaines, en didactique et pour l'enseignement de la langue.
BaTelÒc n'a pas pour but de proposer un corpus de référence de l'occitan, mais de fournir aux utilisateurs un ensemble de textes suffisamment large pour que chacun puisse y sélectionner les textes qui lui permettront de se construire son corpus de travail. Il propose une interface de consultation avec un moteur de recherche.
Pour le moment, la base contient 95 textes (3,37 millions de mots) de 49 auteurs différents. Elle sera enrichie régulièrement.