Diagnostic de l'état du développement numérique occitan
La première étape de l'étude consistait à réaliser un diagnostic de l'état du numérique occitan. Ce dernier a servi de base à la définition et à la priorisation des besoins pour le calendrier de réalisation.
Inventaire des ressources et des outils numériques occitans
Pour avoir une vision la plus large possible, un inventaire de tous les outils et ressources numériques connus a été dressé.
Synthèse de l'inventaire
* Les ressources linguistiques ont été séparées en deux catégories : celles qui sont utilisables directement pour un usage informatique et celles qui nécessitent un traitement plus ou moins lourd pour pouvoir être utilisées pour créer des outils.
Conclusions
Il existe peu d'outils de technologie de la langue. Les ressources recensées sont plus nombreuses, mais peu réutilisables (corpus oraux non transcrits, dictionnaires souvent anciens ou pas OCRisés, grammaires destinées à une utilisation pédagogique et pas informatique, question de la validité et de la qualité linguistique pour plusieurs documents...). Il faudrait donc créer les ressources linguistiques de base avant de pouvoir développer des outils.
Expériences pour les autres langues
Dans le cadre de l'étude, quatre experts internationaux ont partagé leur expérience :
- Langue basque : Xavier Artola (Ixa, Université du Pays Basque) ;
- Langue bretonne : Olier Ar Mogn (Office public de la langue bretonne) ;
- Langue catalane : Asunción Moreno (TALP, Université Polytechnique de Catalogne) ;
- Langue galloise : Francis M. Tyers (Norgga Árktalaš Universitehta).
Pour la langue occitane, les intervenants en ont tiré quatre lignes directrices :
- Importance de bien planifier et de faire les choses dans l'ordre ;
- Il faut développer aussi bien les ressources que les outils ;
- Intérêt de la coopération pour améliorer l'efficacité ;
- Importance des licences libres pour pouvoir partager les développements.