Lettre de liaison :

Sélectionnez votre langue

Actualités

LINGUATEC-IA

Il va y avoir du nouveau pour les technologies de la voix en occitan ! En effet, les dernières avancées en Intelligence artificielle nous permettent d’envisager de nouveaux développements avec des ressources limitées : jusqu’alors, pour obtenir une voix synthétique, 6 à 10H d’enregistrements voix-texte alignés étaient nécessaires pour chacune des voix. Aujourd’hui, l’IA permet autour d’un seul moteur d’agréger de nouvelles voix avec un petit corpus (1H d’enregistrement environ).

Après les deux premières voix enregistrées en 2019 et 2020 (gascon et languedocien), le Congrès, l’universitat de Lleida, en partenariat avec la coopérative catalane Col.lectivat, et la fondation basque Elhuyar ont donc engagé un nouveau programme, LINGUATEC-IA, afin d’ajouter de nouvelles voix en aranais, gascon et languedocien. Plusieurs sessions d’enregistrement ont ainsi été réalisées en val d’Aran et en Béarn, les utilisateurs pourront retrouver courant second semestre 2026 les voix dans l’application Revirada (qui permet une synthèse après une traduction) ainsi que dans une future application dédiée Votz.

Des tests sont également prévus avec des corpus issus de livres audio dont nous espérons que la qualité d’enregistrement et l’évolution des technologies pourront compenser l’expressivité du lecteur (la synthèse vocale nécessitant plutôt des voix neutres).

Enfin, les partenaires ont continué les développements pour le futur transcripteur automatique, qui grâce à un traducteur embarqué permettra la transcription multilingue de vidéo, un développement très attendu quand on connaît l’enjeu de diffusion de contenu en occitan sur les réseaux sociaux.

LINGUATEC-IA est un programme financé à 65% par le programme Interreg VI-A Espagne-France-Andorre (POCTEFA 2021-2027). Le POCTEFA a pour objectif de renforcer l'intégration économique et sociale de la zone frontalière Espagne-France-Andorre.