Lettre de liaison :

Sélectionnez votre langue

Technologies de la langue

Traitement automatique du langage

Le numérique occitan s’est développé d’une façon générale ces dernières années : contenus encyclopédiques (Wikipèdia), patrimoine (Occitanica), médias (OCtele), réseaux sociaux sont autant de secteurs désormais investis. Toutefois la langue occitane pâtit toujours d’un important retard numérique avec, pour conséquence, une absence quasi totale dans des outils désormais courants (bureautique, téléphonie mobile, etc.). La prégnance croissante de ces technologies dans la vie quotidienne (travail, déplacements, consommation, éducation, vie sociale) font des technologies du langage un facteur supplémentaire de marginalisation pour une langue déjà minorisée.

"Le Congrès est engagé dans plusieurs programmes de développement
des technologies langagières pour l’occitan."

Ce phénomène est décrit et analysé dans une étude réalisée par META-NET, un réseau de recherche rassemblant différentes institutions, universités et centres de recherche et dont la mission principale est la mise en place de fondations technologiques solides pour une Europe multilingue. Son Livre blanc fait un état actuel des ressources et technologies du langage pour trente langues européennes dans six domaines (la traduction automatique, la synthèse et la reconnaissance vocales, la correction orthographique, l’analyse sémantique, l’analyse grammaticale et la génération automatique de texte) et propose également une grille commune de classification et d’évaluation des ressources et outils numériques. Les résultats de l’étude sont particulièrement alarmants : les éditeurs soulignent l’écart croissant entre les « grandes » et les « petites » langues, il est indispensable d’équiper toutes les langues (y compris les plus petites et les moins dotées) des technologies de base nécessaires, sans quoi ces langues sont condamnées à « l’extinction numérique ».

"plusieurs programmes opérationnels (traducteur automatique,
synthèse vocale, reconnaissance vocale, etc.)."

Pour ce faire, l’étude préconise la création massive de données, la mutualisation au niveau européen, le transfert technologique entre les langues, l’interopérabilité des ressources, des outils et des services.
Dans ce cadre le Congrès, avec l’ensemble de ses partenaires scientifiques et institutionnels, a engagé plusieurs programmes de développement des technologies langagières pour l’occitan : en 2014 est rédigée la Feuille de route de développement numérique l’occitan, un document cadre pluriannuel de planification des travaux, elle sera suivi de plusieurs programmes opérationnels (traducteur automatique, synthèse vocale, reconnaissance vocale, clavier prédictif, corpus, etc.). 


La Farga est le portail collaboratif TAL (traitement automatique de la langue) pour l’occitan. Vous y accéderez à l’ensemble des ressources existantes grâce à l’inventaire des ressources, pourrez télécharger des outils (modules/plug-in), entrer en contact avec la communauté et faire connaître vos projets.

 

(TAL) Traitement automatique des langues

Le traitement automatique du langage naturel (TALN), ou traitement automatique de la langue naturelle, ou encore traitement automatique des langues (TAL), plus couramment appelé NLP (de l'anglais : natural langage processing) est un domaine multidisciplinaire impliquant la linguistique, l'informatique et l'intelligence artificielle, qui vise à créer des outils de traitement de la langue naturelle pour diverses applications. Il ne doit pas être confondu avec la linguistique informatique, qui vise à comprendre les langues au moyen d'outils informatiques. (Wikipédia)

En savoir plus

Feuille de route

La Feuille de route pour le développement numérique de l'occitan est un document-cadre de planification de développement de l'outillage numérique.

Voir la page

Les chantiers

Le Congrès a engagé plusieurs chantiers de développement des ressources et des outils TAL pour l'occitan.

Voir la page

La Farga

La Farga est le portail collaboratif TAL (traitement automatique de la langue) pour l’occitan. Vous accéderez à l’ensemble des ressources existantes grâce à l’inventaire des ressources, pourrez télécharger les outils (API, modules/plug-in), entrer en contact avec la communauté et faire connaître vos projets.

La Farga - Un site de Lo Congrès

Voir la Farga