Letra de ligason :

Sélectionnez votre langue

Etiquetas de PoS

Dins lo domeni del TAL, i a mantun estandard internacional per etiquetar las categorias gramaticalas dels mots (Eagles, Grace...). Pasmens, son pas forçadament utilizats per totes los espleches. D'unes, coma lo traductor automatic Apertium, an lor jòc d'etiquetas pròpri. A mai, la màger part dels estandards prenon pas en compte las especificitats pròprias a l'occitan, coma los enonciatius gascons.

Lo Congrès a doncas desvolopat un jòc d'etiquetas de categorias gramaticalas adaptat a la lenga occitana, interoperable amb los estandards internacionals e los espleches TAL liures de dreches mai utilizats.

"un jòc d'etiquetas a 3 nivèls"

Aquel jòc d'etiqueta fonciona amb 3 nivèls :

  • la categoria generala, que correspond al PoS (Part of Speech) que, en general un lema parteja amb sas formas flechidas : « Adj » per adjectiu, « Vèrb » per vèrbe...
  • la categoria detalhada, que correspond al PoS + las informacions morfosintaxicas (genre, nombre, informacions de conjugason...) : « AdjMS » per adjectiu masculin singular, « VerbeIndPres1s » per vèrbe a la 1e persona del singular del present de l'indicatiu...
  • dins d'autres lexics, mai que mai los a destinacion del machine learning, se pòt ajustar una etiqueta mai generala de familha gramaticala qu'amassa las categorias generalas qu'an un foncionament plan similar : « Det » amassa los determinants demostratius, exclamatius, indefinits, interrogatius, possessius, relatius e definits.

L'utilizacion d'aquel jòc d'etiqueta per totas las ressorsas del Congrès permet de las far interoperablas. Un mot dins un còrpus de tèxte a la meteissa etiqueta que dins un diccionari. Per exemple, se i a dins un tèxte la frasa « son paire es grand », l'utilizator pòt clicar sus « son » e aver la definicion del determinant possessiu « son » sens riscar d'arribar sus la definicion del nom comun « un son » (un bruch).

"nivèl de granularitat plan fin"

Lo jòc d'etiqueta foguèt bastit amb un nivèl de granularitat plan fin. Permet de distinguir, per exemple, un preadvèrbi coma « se » (que pòt pas èsser utilizat que davant un adjectiu o un advèrbi), d'un advèrbi coma « largament » (que pòt èstre utilizat sol). O encara lo pronom personal « nous »  emplegat coma pronom tonic (« penser à nous ») o coma COD antepausat (« il nous regarde »).

Descripcion del jòc d'etiquetas

Presentation del jòc d'etiquetas e descripcion de las categorias.

Veire lo document

Lista de las categorias

Tablador de las categorias detalhadas e generalas amb lors denominacion.

Veire lo document

Tà'n saber mei

Formatatge TEI

Lo Congrès qu'utiliza la nòrmaTEI dens l'encastre deu son projècte Lexics, qui a l'objectiu de formatar tots los sons lexics

Véder la pagina

Códis IANA de varietats

Códis estandardizats entà identificar las lengas, las lors varietats, las lors grafia e los lors alfabets.

Véder la pagina

Etiquetas de POS

Jòc d'étiquetas gramaticaus adaptat a la lenga occitana.

Véder la pagina