Occitan et technologies : vers de nouvelles perspectives

Utís numerics

Suite à la rédaction de la feuille de route pour le développement numérique de l'occitan, Lo Congrès a été retenu pour deux projets majeurs de développement des technologies : Linguatec et ROLF.

Linguatec est un programme pluriannuel de développement des technologies de la langue pour l'aragonais, le basque et l'occitan. Il permettra, grâce à une coopération scientifique entre acteurs des différentes langues, de créer des outils qui manquent à chacun. Pour l'occitan, il est question de développer l'analyse morphosyntaxique, la traduction automatique et la synthèse vocale.

Linguatec est un partenariat transfrontalier (CNRS, Euskaltzaindia-Real Academia de la lengua vasca, Elhuyar, Université du Pays Basque et Société de Tourisme du Gouvernement aragonais) financé par les fonds européens transfrontaliers (FEDER). Il a été retenu dans le cadre de l'appel à projets de la Communauté de Travail des Pyrénées, qui rassemble les collectivités et autonomies des deux versants des Pyrénées.

ROLF (Ressources outils pour les langues de France) a pour objectif la constitution partagée de ressources linguistiques et de claviers prédictifs pour l'occitan, l'alsacien et le picard. Ils seront réalisés dans le cadre d'un partenariat avec les universités de Toulouse (laboratoire CLLE-ERSS), d'Amiens et de Strasbourg.

Grâce aux standards développés (format, annotation), il permettra la publication d'un lexique fléchi aligné et d'un clavier prédictif pour les smartphones Android pour les trois langues. Le format et les outils développés pourront être appliqués par la suite à d'autres langues, en économisant le coût et le temps de développement de ces ressources. Il est financé par le Ministère de la Culture - DGLFLF dans le cadre de son appel à projets « langue et numérique ».

L'inscription de l'occitan dans ces programmes structurants est une réussite qui donne une nouvelle perspective de la feuille de route. Leurs projets ambitieux de coopération scientifique et de transfert de technologies entre les langues déboucheront à des outils pour un large public. Il s'agit aussi d'une reconnaissance du travail du Congrès et de ses partenaires, dont l'Université de Toulouse-Jean Jaurès, dans le domaine du traitement automatique du langage (TAL).