La conférence internationale des ressources langagières a approuvé un article scientifique co-rédigé entre plusieurs partenaires dans le cadre du Poctefa Linguatec : Lo Congrès (Aura Séguier, Michaël Barret e Benaset Dazéas), Elhuyar (Ander Corral, Igor Leturia) et le CNRS (Philippe Boula de Mareüil et Nicolas Quint).
Prévue du 11 au 16 mai à Marseille – elle n’a pu avoir lieu en raison des conditions exceptionnelles que nous traversons – la conférence LREC 2020 (Language Resources and Evaluation Conference) est un évènement important dédié aux ressources du langage (LR) et à l’évaluation de technologies du langage (LT). L’objectif de LREC est d’offrir un aperçu de l’état de l’art, d'explorer les nouvelles orientations en recherche et développement et les tendances émergentes, d’échanger des informations sur les LR et leurs applications, les méthodologies et outils d’évaluation, les activités en cours et prévues, les utilisations et besoins industriels, les exigences requises par la société de l’information, tant en termes de politique que de questions technologiques et organisationnelles.
Le fait que cet article ait été approuvé pour être présenté à la conférence mérite d’être mentionné. L’article retenu par LREC 2020 présente la conception d’un système de synthèse vocale (text-to-speech ou TTS) pour l’une des principales variétés de l’occitan, le gascon, qui a été developpé au cœur du projet Linguatec. Un TTS neuronal de dernière génération a été utilisé pour l’occitan gascon avec un nombre modeste d’heures d’enregistrement, en tenant compte de la prononciation des noms propres français. Plusieurs systèmes ont été developpés et évalués, certains basés sur le texte, d’autres sur les phonèmes, et d’autres qui comprennent des enregistrements de mots français ou non.
Les apports avancés ont été valorisées positivement, et nous espérons ainsi faire progresser un domaine de recherche qui pourrait favoriser l’essort de toutes les langues minorisées.
- Retrouver l’article sur le site du Poctefa Linguatec
- Lire l’article (anglais)