
Lo Congrès permanent de la lenga occitana qu'ei portaire d'un programa d'accion dens l'encastre deu CPER 2021-2027 entà las regions Novèla Aquitània e Occitània : que s'i parla d'un projècte d'infrastructura numerica dedicada a la lenga occitana, permetent de crear, estructurar e religar diferentas ressorsas lexicograficas, textuaus e toponimicas a l'entorn d'ua interfàcia de consultacion publica, d'un nivèu d'excelléncia comparabla a la deu Centre nacional des ressources textuelles et lexicales entà la lenga francesa (https://www.cnrtl.fr). Que son presvists peu programa diferents chantièrs, dont la redaccion deu Diccionari generau informatizat de la lenga occitana (DGILO), la restauracion de la toponimia occitana (en aliança dab l'IGN) sus las duas regions e lo tractament massiu de las dadas a l'estandard TAL (tractament automatic de las lengas).
Lo programa qu'a per objectiu de produsir atrunas numericas, d'utilizacion gratuita e libra per ordenadors e aparelhs connectats mobiles, entà difusar la transmission e l'usatge d'ua lenga occitana de qualitat.
Aquesir ressorsas lingüisticas qui permeten la difusion e l'estudi d'ua lenga de qualitat
- la realizacion d'un Diccionari generau informatizat de la lenga occitana (DGILO). Tot parièr que las soas lengas vesias catalana e basca, l'occitan que serà atau dotat d'un diccionari descriptiu complet, cobrant totas las varietats de l'occitan, dab descripcion fonologica, exemples, dísers, arreproèrs, citacions literàrias. Que s'ageish d'un tribalh de mantua annada, a qui harà mestièr ua equipa hornida dens lo maine de la lexicografia, qui aurà ua edicion numerica qui permeterà la soa mei grana difusion gràcias aus estandards d'interoperabilitat. Que's poderà pensar après a ua edicion papèr en mantun volume. Aquera òbra academica de prestigi qu'ei indispensabla a la coneishença e a la difusion de la lenga. Despuish lo Tresaur dóu Felibrige de Frederic Mistral, arrès n'a pas produisit nada òbra lexicografica panoccitana d'aqueth nivèu scientific e d'aqueth endom.

- l'aumentacion de la basa deu multidiccionari Dicodòc sustot peus diccionaris seguents : lo Vayssier, lo Mouly e l'Alibert e lo lor formatage, en TEI entà perméter (adarron) lo desvolopament de numerosas aplicacions lingüisticas (diccionari de las expressions, ...)
- Aumentacion de las basas textuaus occitanas anotadas (dadas morfosintaxicas) qui cobreishen la diversitat de la lenga (en varietat e en genre literari) dab interfàcia de consultacion. En foncion deus partenariats establits, aquera operacion que serà eventuaument totaument o parciaument fusionada dab lo programa BaTelÒc e ParcoLaf deu laboratòri CLLE-ERSS (CNRS/Universitat Tolosa 2).
Objectius : 10-25 milions de mots entau còrpus monolingüe, 2-5 milions entau còrpus bilingüe.

Ua convencion qu'estó signada enter lo Congrès permanent de la lenga occitana e l'IGN (Institut Geografic Nacionau). Lo Congrès qu'ei d'ara enlà lo referent de l'IGN entà l'occitan sus l'armonizacion de las fòrmas graficas suus 32 departaments occitanofònes. Après lo País basco e Catalonha, Occitània que profieitarà atau d'ua mesa en valor, tant au nivèu nacionau com locau entad aqueth projècte d'endom. Pr'amor de constrentas de temps e d'espaci, las òbras engatjadas n'auràn pas lo nivèu de precision deus sons predecessors basco e catalan.

- Enquèstas de terren : collectatge orau auprès de locutors de lenga mairau occitana e ua enquèsta escriuta qui consisteish a relhevar un minimum de fòrmas ancianas dens las cartas (IGN, cadastre, canton, etc.) e dens las honts ancianas (libes terrèrs, bulletins parroquiaus, etc.).
- creacion d'un modèle de ficha d'identificacion necessària a la descripcion precisa (coordenadas geograficas, tipologia, data e lòc deu collectatge, honts relhevadas, fòrmas istoricas, etc.) de cada toponime occitan.
- Constitucion d'ua basa de dadas toponimicas dab ua API (Application programming interface) qui permet ua espleitacion entà ua recèrca multicritèri, accès per cartografia, etc.

Crear ua platafòrma numerica universau e multivarietats
Que serà dedicada a las dadas lexicograficas, textuaus e toponimicas occitanas, equivalent occitan deu portau lexicau francés deu Centre nacionau de ressorsas textuaus (www.cnrtl.fr). Desvolopat en ligam dab La Farga, futura platafòrma collaborativa d'accès, de valorizacion, de desvolopament e d'escambi de las ressorsas TAL (tractament automatic de lenga) e informatica en occitan, lo portau que serà evolutiu e desvolopat segon los darrèrs estandards en tèrmes de formatatge, d'accès e d'interoperabilitat :

- Barra de recèrca unica, en occitan o en francés, permetent ua consultacion de las ressorsas locongres.org e CLLE : flexions, sinonimia, illustracion sonòra, traduccion, definicion, conjugasons, citacions en contèxte, rimas, contèxte dens los diccionaris istorics (gràcias a un adaptador de grafia), toponimes (descripcion e cartografia).
- Ensemble de las dadas formatadas en TEI, permetent l'interoperabilitat de las ressorsas e ua ergonomia optimau dab accès instantanèu (cada mot que serà “clicader”). D'uas APIs que permeteràn un accès a distància d'aqueras dadas cap a platafòrmas o aplicacions autas.
- Interrogacions de dadas extèrnas per las APIs : IGN (cartografia), Wikipédia (enciclopèdia), Occitanica (documentacion), etc.
- Interfàcia multiplatafòrmas « responsive », dab un suenh particular entà un accès per terminaus mobiles.
Ua purmèra edicion publica de la platafòrma, dab las varietats lengadociana e gascona, qu'ei projèctada per 2024, la version completa que serà editada en fin de programa.