Création d'une base lexicale monolingue de l'occitan

Basa lexicala

Le Congrès permanent de la langue occitane et le laboratoire CLLE-ERSS (CNRS / Université Toulouse-Jean-Jaurés) ont initié un partenariat visant à la création d'un lexique ouvert des formes fléchies de l'occitan (Lofloc).

Cette initiative se fait dans le cadre de Restaure (RESsources informatisées et Traitement AUtomatique pour les langues Régionales), un projet ANR (Agence nationale de la recherche) qui voit s'associer CLLE-ERSS (université de Toulouse), LESCALP (université d'Amiens) et LILPA (Université de Strasbourg) autour du développement des ressources informatiques et des outils de traitement automatique pour trois langues régionales de France : alsacien, occitan et picard.

Dans la lignée du Morphalou pour le français ou du Lexic Obert Flexionat de Català, Lofloc sera un lexique des formes fléchies d'un lemme, à savoir une base lexicale monolingue comprenant une liste de mots occitans avec la catégorie grammaticale (type, genre, nombre, etc.), les formes fléchies (féminin, pluriel, conjugaison, etc.) et la variété.

Inscrit parmi les développements prioritaires de la feuille de route de développement numérique de l'occitan, Lofloc est une ressource indispensable à l'annotation des corpus textuels, mais également à la création d'applications numériques telles que la saisie prédictive et la correction orthographique.