Les 25 et 26 octobre derniers, Aure Séguier (développeuse au Congrès) et Vincenç Gleizes (ancien stagiaire au Congrès) étaient à Berlin, à la WikidataCon2019 pour y présenter leur projet de versement de lexèmes occitans à Wikidata.
La WikidataCon est un évènement qui réunit des contributeurs et des professionnels qui travaillent autour de Wikidata, la base de connaissances contributive de Wikimedia. Pendant deux jours, les participants y ont présenté des projets qui utilisent Wikidata ou qui ont pour but de l'enrichir, et y ont réfléchi à l'avenir de cet outil...
C'est dans ce cadre-là que Lo Congrès y a présenté AitalvivèmBot, un programme réalisé par Vincenç Gleizes au cours de son stage en juillet dernier. Il a pour but de verser automatiquement les données lexicographiques du Congrès dans Wikidata.
Ce versement est nécessaire pour la construction de quelques-uns des futurs outils du Congrès. En effet, il faut savoir que Wikidata permet de relier des mots au concept (compréhensible pour les ordinateurs) qu'ils représentent, et donc de donner à une machine une représentation du sens d'un texte. Ce processus est à la base de tout outil qui fait de l'analyse sémantique : résumé de texte, classification de documents, système de question-réponse, chatBot, assistant intelligent pour smartphone...
Wikimedia France a interviewé Vincenç Gleizes et Aure Séguier, responsable du pôle TAL du Congrès, pour faire connaître ce travail à la communauté : Lire l'interview