Après l’occitan gascon e l’occitan lengadocian, son las varietats lemosina e provençala qu’an lor lexic de formas flechidas. Aquestes lexics, qu’amassan totas las formas conjugadas dels vèrbes e « declinadas » (feminin, plural) dels autres mots son a la basa de totes los desvolopaments dins lo domeni del TAL.
Son utiles dins totes los otisses del tractament automatic de las lengas :
- Son a la basa dels lexics monolingües dels traductors automatics a basa de reglas, coma Revirada ;
- Son utilizats per far las listas de mots corrèctes pels clavièrs predictius de telefonets e pels correctors ortografics ;
- Permeton de far una basa d’excepcions de prononciacion per la sintèsi vocala Votz, qu’es un modèle ibride (intelligéncia artificiala e règlas de fonetizacion) ;
- Permeton de pre-anotar de tèxtes per entraïnar de modèles d’analisi morfosintaxica (PoS-taggers) e sintaxica (parsers) ;
- Ajudan los OCR a reconéisser melhor los mots…
Mercés a las òbras menadas pel Vèrbòc e a una annada de trabalh suls autres mots, l’occitan lemosin e l’occitan provençal son ara dotats d’aquela ressorsa preciosa. Comptam mai de 600 000 formas provençalas e mai de 550 000 formas lemosinas, que se venon ajustar a las 880 000 formas lengadocianas e a las 1,3 milions de formas gasconas qu'èran ja dins las basas del Congrès.
Tot aquò dobrís de perspectivas novèlas de desvolopaments per las doas varietats !