Lo projècte Lexics qu'a la tòce de formatar en XML (segon la nòrma TEI) tots los diccionaris, lexics especializats, basas toponimicas, lexics flexionaus deu Congrès e deus sons partenaris. Aqueths lexics formatats que pòden apuish estar integrats dens atrunas de TAL (corrector ortografic, traductor automatic, clavèr predictiu) o emplegats entà generar automaticament o semiautomaticament ressorsas autas (diccionaris de sinonimes, diccionaris de rimas, diccionaris de locucions...).
La redaccion de la huelha de rota de desvolopament numeric de l'occitan, en 2014, que soslinhè lo besonh entaus actors deu TAL occitan de dispausar de dadas estandardizaderas e interoperablas. Lo Congrès qu'aviè donc aqueste projècte qui a per mira de har vàder los sons lexics compatibles dab las soas autas ressorsas (com los sons lexics, qui son eths tanben formatats en XML-TEI) e las deus sons partenaris.
passa totas las soas ressorsas au format TEI"
Lo formatatge que hè vàder legederas las ressorsas per las maquinas tanben. La nòrma TEI (Text encoding information) qu'ei un format de balisatge entau lengatge XML (Extensible Markup Language). Que permet, gràcias a balisas, d'indicar la natura de cada element d'un tèxte (mot, frasa, morfèma...). Atau, las maquinas que pòden conéisher la natura de cada element d'ua entrada. Per exemple, que saben quau ei lo mot-vedeta, quau ei la soa traduccion, quau ei la categoria gramaticau de la soa traduccion... Aquerò que permet de generar automaticament navèras ressorsas en tirar solament çò qui hè besonh, per exemple un mot e lo son femenin entà bastir un lexic de fòrmas flechidas, un mot e la soa traduccion entà bastir un lexic entà un traductor automatic...
navèras ressorsas"
Lo projècte Lexics que permetó de desvolopar ressorsas entà mantua atruna deu Congrès :
- Lo traductor automatic Revirada
- Lo fonetizaire emplegat per la sintèsi vocau Votz
- Los clavèrs predictius e correctors ortografics Dicodòc
- Daubuns diccionaris deu Dicodòc : locucions, sinonimes
- Laboratòri, l'atruna de consulta avançada de lexics occitans