Lettre de liaison :

Le Congrès permanent de la langue occitane

Lo Congrès est l'organisme interrégional de régulation de la langue occitane. Il rassemble les institutions et les fédérations historiques occitanes et est soutenu par les collectivités et le Ministère de la Culture et de la Communication - DGLFLF.
  • dicod'Òc dicod'Òc
  • tèrm'Òc tèrm'Òc
  • vèrb'Òc vèrb'Òc
  • top'Òc top'Òc
  • express'Òc express'Òc
  • punt de lenga punt de lenga
FR→OC
OC→FR
OC→OC
Historique

Expressions

« Être indécis »

Être indécis

Gratà's l'aurelha

punt de lenga

Le genre des substantifs

Relòtge

Quels noms sont masculins, quels noms sont féminins ?

« Un relòtge »

Actualités

  • All
  • Institution
  • Politiques
  • Publications
  • Recherche
  • Ressources
  • Tout
  • Événements
  • Défaut
  • Titre
  • Date
  • Aléatoire
load more / hold SHIFT key to load all load all

Mise en lumière

Lo Basic en ligne !

Lo Basic, lexique élémentaire français-occitan du Congrès.

API du Congrès

Développez vos applications avec les données du Congrès.

Plateforme ReVOc

Donnez votre voix pour construire la reconnaissance vocale en occitan.

Base textuelle

Consultez la base textuelle occitane BaTelÒc.

Pour les mobiles

Téléchargez dicod'Òc et verb'Òc sur votre mobile.

Laboratòri

Outil de consultation avancée des lexiques du Congrès.

Lou Tresor dóu Felibrige

Lo Congrès, en partenariat avec le CIRDOC, a réalisé une édition numérique du Tresor dóu Felibrige de Frédéric Mistral. Le dictionnaire occitan historique est disponible en ligne au format Flipbook, qui permet de revivre l'expérience du livre papier tout en bénéficiant de la puissance du numérique, avec par exemple la possibilité de faire des recherches indexées plein texte ou de mettre des marques-pages.

Vous pouvez taper un mot dans le moteur de recherche, et vous aurez la liste de toutes les pages dans lesquelles ce mot apparaît. Lo Congrès a voulu vous offrir un outil ergonomique, ludique et facile à partager sur les réseaux sociaux.

Il a été réalisé grâce à un partenariat avec le CIRDOC – médiathèque occitane qui a numérisé le dictionnaire papier. L'édition numérique a été mise en ligne à l'occasion du centenaire de la mort de Mistral. Cet événement s'est déroulé dans le cadre de l'ouverture de la bibliothèque virtuelle Frédéric Mistral au sein d'Occitanica, la médiathèque numérique.

Pour mener à bien la feuille de route 2015-2019 pour le développement numérique de l'occitan, il était indispensable de disposer de données standardisées qui puissent être échangées entre ceux qui y travaillent. Il y avait également besoin de ressourses linguistiques dans un format que les machines puissent lire. Une telle standardisation, en effet, permet de développer de nouvelles ressources (bases lexicales, corpus) nécessaires à la création d'outils comme des traducteurs automatiques, un correcteur orthographique, un clavier prédictif...

Petit à petit, le Congrès convertit toutes ses ressources au format TEI (Text encoding initiative). Celui-ci est un sous-langage du XML (Extensible Markup Language) qui permet, grâce à des balises, d'indiquer la nature de chaque élément d'un texte (mot, phrase, morphème...). Il est pensé pour rendre les textes lisible par les machines, en particulier dans les domaines de la linguistique et des sciences humaines et sociales.

Un texte analysable par les machines peut être facilement modifié, découpé et/ou transfomé pour être utilisé par un outil informatique. Grâce au passage au format TEI des données du Congrès, créer de nouvelles applications sera beaucoup plus rapide. De plus, cela permettra de créer des outils qui n'auraient pas pu être réalisés avec des données au format brut.

Le format TEI, qu'es aquò ?

Si vous voulez mieux comprendre ce qu'est le format TEI, connaître les raisons de son choix et découvrir les possibilités de développement qu'il offre, vous trouverez dans la vidéo ci-dessous les explications d'Aure Séguier, webmaster et développeuse TAL pour le Congrès :

Choix de DTD

Pour adapter le format TEI à ses données, le Congrès a fait plusieurs choix de balisage spécifiques aux dictionnaires occitans traités. Vous les trouverez dans l'explicatif suivant :

Réalisations

Grâce au format TEI, le Congrès a déjà réalisé deux dictionnaires spéciaux :

 

Rimes

Entrer un mot :

Variété :

Synonimes

Entrer un mot :

Variété :

En savoir plus

Pour en savoir plus sur le format TEI en général :

Basa lexicala

Le Congrès permanent de la langue occitane et le laboratoire CLLE-ERSS (CNRS / Université Toulouse-Jean-Jaurés) ont initié un partenariat visant à la création d'un lexique ouvert des formes fléchies de l'occitan (Lofloc).

Lire la suite...

Le Congrès permanent de la langue occitane est heureux de vous présenter la restitution du projet « Diagnostic et feuille de route pour le développement numérique de la langue occitane 2015-2019 ».

Grâce à différentes initiatives, ces dernières années ont vu apparaître des ressources et des outils numériques fort utiles pour l'occitan et ce dans plusieurs domaines. Nous pouvons mentionner, par exemple, pour le patrimoine, l'information, la documentation, les productions de qualité en ligne du CIRDOC et de l'InOc Aquitaine, tous deux membres du Congrès, pour les contenus encyclopédiques et lexicaux Wikipédia où l'occitan est de plus en plus présent, des travaux universitaires en cours comme le Thesòc ou BaTeLòc, pour l'audiovisuel la jeune OCtele, etc.

L'étude de la DGLFLF - Ministère de la Culture et de la Communication1 sur la place des langues de France sur Internet parle pour l'occitan « d'une remarquable effervescence associative » qu'il n'est pas aisé de mesurer et suggère avec raison que les nouvelles initiatives se fassent « en collaboration entre les secteurs ».

Pour sa part, le Congrès s'est consacré dès sa création à offrir aux usagers, sous forme numérique, des outils linguistiques de référence : multidictionnaire, conjugueur, base terminologique, base toponimique, normes et oeuvres normatives.

Nous savons cependant que l'occitan pâtit d'un grand retard dans le domaine du numérique, surtout dans les technologies avancées du langage (TAL) qui sont désormais importantes pour le statut, l'utilisation et l'avenir d'une langue. Cette absence des TAL pour l'occitan, des études le montrent bien, est un facteur supplémentaire de marginalisation pour notre langue.

C'est pourquoi l'an dernier le Congrès a décidé de proposer une méthode et un cadre opérationnel pour traiter ce domaine de haute technologie et l'a intégré dans son programme 2014 présenté à ses membres à l'Assemblée générale.

Je laisserai ceux qui ont assuré la coordination présenter les travaux, mais je tiens à mentionner le cadre original et innovant de leur réalisation.

Dans l'esprit qui a prévalu à la création du Congrès, il a été décidé de mettre en place un dispositif institutionnel collégial associant à la fois les décideurs publics2 et les opérateurs de recherche, de transmission et de diffusion de la langue3. Par ce partenariat, les organisateurs ont souhaité garantir la meilleure qualité possible aux travaux ainsi que leur plus grande appropriation et diffusion par les différents acteurs.

Ces travaux ont été réalisés dans le cadre d'une recherche-action, c'est-à-dire que les stagiaires ont été acteurs de leur propre formation. Pendant plusieurs mois, ils ont été confrontés à la technicité de ces questions du numérique et des TAL.

Ils ont rencontré des experts internationaux, utilisé des nouvelles méthodes d'investigation, réalisé un diagnostic et des préconisations techniques : cette méthode contribuera, il faut l'espérer, à une prise de conscience collective des enjeux et de leur technicité, et à la création d'une culture commune visant à améliorer notre expertise et les pratiques dans ce domaine.

Je souhaite également préciser que cette production peut encore être amendée, enrichie et améliorée pour devenir une base d'action commune pour les cinq années à venir. Toutes les contributions complémentaires seront les bienvenues, sachant qu'il nous faudra peut-être définir des priorités.

Je remercie l'ADEPFO (Association de Développement des Pyrénées par la Formation) et les membres du Comité de pilotage de nous avoir soutenu dans cette initiative que nous n'aurions pu conduire sans eux.

Je remercie la fondation basque Elhuyar et la société Media.kom qui ont organisé et encadré ces travaux et nous ont fait profiter de leur grande expérience dans ces domaines.

Je remercie également Benaset Dazéas, directeur du Congrès et Aure Séguier, webmaster du Congrès, d'avoir préparé et coordonné cette recherche-action et réussi à la mener à bon terme dans les délais prévus. Je remercie tous ceux qui ont participé au projet.

Nous nous retrouvons désormais avec une feuille de route contenant des propositions de développement pour les années à venir : derrière une terminologie pouvant parfois faire peur, il est question au final de corpus linguistiques de qualité pour réaliser des dictionnaires, de traducteur automatique, de correcteur orthographique, ou encore de clavier prédictif, de toutes ces applications désormais indispensables dans notre quotidien.

Ce document est une première pour l'occitan, mais ne nous leurrons pas, car tout comme « la fe sens òbras mòrta es », « la fe sens mejans mòrta es ». Nous ne laisserons pas ce rapport dans un tiroir. Gageons qu'il soit la source d'une véritable entreprise collective, avec à la clé une programmation budgétaire à la hauteur des enjeux.

Plusieurs projets sont d'ores et déjà lancés, mais il est indispensable pour son succès de voir s'associer les différents acteurs concernés, de la recherche universitaire aux entreprises, en passant par les institutions qui soutiennent le Congrès. Il est indispensable de trouver des crédits de recherche, des crédits issus des politiques linguistiques de l'État et des collectivités territoriales, de l'Europe et de la coopération transfrontalière.

Nous avons bien là tout un programme.

Gilbert Mercadier
Président du Congrès permanent de la lenga occitana

1 Inventaire des ressources linguistiques des langues de France, réalisé en partenariat avec ELDA, 2014. Etude complète téléchargeable sur le site de la DGLFLF.

2 Ministère de la Culture et de la Communication, DRAC Aquitaine, Régions Aquitaine, Midi-Pyrénées, Languedoc-Roussillon, Département des Pyrénées-Atlantiques, Département des Hautes-Pyrénées, Ville de Toulouse

3 Université Toulouse-Jean Jaurès, Lo Congrès permanent de la lenga occitana, CFPÒc Aquitaine, CFPO Midi-Pyrénées, CIRDOC, InOc Aquitaine, Capòc, Editions Reclams, FIMOC, OCtele, Ràdio País, Vistedit, collectifÇa-i

Grâce à différentes initiatives, ces dernières années ont vu apparaître des ressources et des outils numériques fort utiles pour l’occitan et ce dans plusieurs domaines : patrimoine, contenus encyclopédiques et lexicaux, travaux universitaires, audiovisuel, etc.

Que's pòt mentàver per exemple lo domeni deu patrimòni, los contienguts enciclopedics e lexicaus, los tribalhs universitaris, l’audiovisuau, etc.

Malgré tout, on constate que la langue souffre encore d'importants retards : logiciels pour le grand public, réseaux sociaux, jeux vidéos ou encore téléphones intelligents sont autant d'enjeux cruciaux pour la transmission de la langue – surtout pour les nouvelles générations ; le chantier est immense.

C'est pourquoi le Congrès, avec le soutien de l'ADEPFO (Association de développement des Pyrénées par la formation) a décidé de conduire une démarche inédite autour de la question du numérique occitan.

Ainsi une vingtaine de personnes représentatives de l'usage social de la langue (enseignement, formation, institutions, Université) ont réalisé une étude de huit mois avec l'aide de deux organismes d'Euskadi : la société de formation Media.kom et la fondation Elhuyar. Ils ont également rencontré des spécialistes des technologies du langage pour les langues basque, catalane, bretonne et galloise.

L'objectif en était la production d'un document-cadre qui est à présent proposé aux collectivités partenaires afin qu'il soit intégré et mis en œuvre dans le cadre des politiques linguistiques publiques. Ce document, maintenant disponible, fait d'abord un diagnostic du numérique occitan avec un inventaire de l'existant (dictionnaires en ligne, correcteurs orthographiques, etc.) et établit ensuite une liste des besoins en outils et ressources: traducteurs automatiques, claviers prédictifs pour les téléphones intelligents, etc.

Ces derniers sont répertoriés dans une feuille de route 2015-2019 avec un calendrier de réalisation.

Voir aussi :

Office public de la langue occitane Ministèri de la Cultura - DGLFLF Région Auvergne-Rhône-Alpes Departament deus Pirenèus-Atlantics Comuna de Tolosa Departament de las Hautas-Pirenèas Département du Tarn Département de la Dordogne POCTEFA Département du Gers Communauté Pays Basque Communauté d'agglomération Pau Pyrénées