De BaTelÒc au TalÒc - Ressorsas e utís tau tractament de lengas ditas « pauc dotadas »

CLLE-ERSS

Dijaus lo 25 de heurèr, lo laboratòri CLLE-ERSS de l'Universitat Joan Jaurès de Tolosa qu'organizè un seminari sus las tecnologias deu lengatge e l'occitan.

Marianne Vergez-Couret qu'i hasó lo bilanç de tres annadas de tribalh arron lo desvolopament de ressorsas e d'utís tà l'occitan. Que s'i parlè tot purmèr de BaTelÒc, ua basa de tèxtes de cap a 3 milions de mots (84 òbras tà un quarantenat d'autors) qui a divèrs genres literaris (contes, poesia, roman, etc.) e mantuas varietats de lenga e de grafia. Aqueth projècte, gavidat per Miriam Bras, qu'aurà a tèrmi ua interfàcia grafica en linha tà har recèrcas contextuaus multicritèris.

Tà bastir aquera basa géncer, qu'orientè los tribalhs de cap au desvolopament d'un OCR (aplicacion de reconeishença automatica de tèxtes numerizats) tà aumentar lo còrpus e a un procediment d'annotacions morfosintaxicas d'aqueste tà perméter navèths mòdes de consultacion deus contèxtes d'emplec (recèrca de las formas flechidas a partir d'un lemma). De notar qu'aqueths tribalhs que's hasón dens l'encastre de RESTAURE, un projècte ANR 2015-2019) qui a per objectiu de desvolopar las ressorsas tà l'occitan, l'alsacian e lo picard

Enfin, que presentè Loflòc, lo projècte de basa lexicau de las formas flechidas occitanas qui ei a desvolopar en aliança dab Lo Congrès.