Et si l’avenir du breton passait désormais… par votre voix ? Derrière cette idée simple se cache en réalité un enjeu majeur : celui de la survie des langues régionales dans un monde de plus en plus dominé par les technologies numériques et l’intelligence artificielle.
En Bretagne, une initiative scientifique d’ampleur vient d’être lancée pour tenter de combler un retard devenu critique. Son objectif est clair : permettre au breton d’exister dans les outils du quotidien de demain, qu’il s’agisse des assistants vocaux, des GPS ou encore des systèmes de dictée automatisée.
Un constat brutal : sans données, pas d’existence numérique
Aujourd’hui, la plupart des langues régionales françaises sont tout simplement absentes des technologies modernes. Contrairement au français ou à l’anglais, elles ne disposent pas des bases de données vocales nécessaires pour être intégrées dans les systèmes d’intelligence artificielle.
Or, ces technologies fonctionnent sur un principe simple : pour comprendre une langue, une machine doit être entraînée à partir de milliers, voire de millions d’extraits vocaux. Sans cette matière première, aucune reconnaissance vocale fiable n’est possible.
Le breton, malgré son héritage culturel et historique, se retrouve ainsi marginalisé dans l’univers numérique. Et sans réaction rapide, le risque est réel de voir cette langue encore davantage reléguée hors du monde contemporain.
Le projet COLaF : une mobilisation nationale… et bretonne
C’est dans ce contexte qu’intervient le projet COLaF (Corpus et Outils pour les Langues de France), porté notamment par des équipes de recherche et soutenu par des institutions publiques engagées dans le développement de l’intelligence artificielle.
L’ambition est large : constituer des bases de données orales et écrites pour l’ensemble des langues parlées en France. Cela inclut non seulement les langues régionales comme le breton, l’occitan ou l’alsacien, mais aussi les créoles, les langues ultramarines, la langue des signes, et même les formes de français parlées dans différents contextes.
L’objectif est double : préserver ce patrimoine linguistique, mais aussi lui donner une place concrète dans les technologies du XXIe siècle.
Donner sa voix pour faire vivre une langue
Au cœur du dispositif, une idée simple et accessible à tous : permettre aux locuteurs de contribuer directement à cette base de données en enregistrant leur voix.
Une plateforme en ligne permet ainsi à chacun de s’exprimer librement en breton. Il ne s’agit pas de lire des phrases imposées, mais de parler naturellement : raconter un souvenir, expliquer une recette, partager une anecdote. Cette approche dite de “parole spontanée” vise à capter une langue vivante, telle qu’elle est réellement utilisée.
Les enregistrements, ensuite, sont intégrés dans des bases de données ouvertes, destinées à alimenter la recherche et le développement d’outils vocaux.
Avant son déploiement en Bretagne, le dispositif a été expérimenté en Alsace, avec des résultats jugés encourageants. Cette phase pilote a permis de tester une méthode innovante, différente des approches classiques qui reposent sur la lecture de textes standardisés.
Le passage au breton marque donc une nouvelle étape, avec l’ambition d’élargir progressivement la collecte à d’autres langues de France.
Un enjeu culturel… mais aussi stratégique
Au-delà de l’aspect patrimonial, le projet s’inscrit dans une réflexion plus large sur la souveraineté technologique et linguistique. Dans un monde dominé par quelques grandes plateformes internationales, capables de dicter les usages et les standards, la question de la place des langues minoritaires devient centrale.
Sans présence dans les outils numériques, une langue disparaît peu à peu de la vie quotidienne. Elle cesse d’être utilisée dans les échanges modernes, perd en attractivité auprès des jeunes générations et finit par s’effacer.
À l’inverse, intégrer le breton dans les technologies d’intelligence artificielle, c’est lui donner une chance de continuer à vivre, à évoluer, et à se transmettre.
Un appel à mobilisation en Bretagne
Le succès de cette initiative repose désormais sur la participation des locuteurs. Plus les voix collectées seront nombreuses, variées et représentatives, plus les outils développés seront performants.
C’est pourquoi les porteurs du projet lancent un appel clair aux Bretons : participer, enregistrer, transmettre. Quelques minutes suffisent pour contribuer à un chantier qui dépasse largement le cadre scientifique.
Car derrière cette collecte de données, c’est bien une question d’avenir qui se joue : celle de savoir si le breton restera une langue vivante, capable de s’inscrire dans son époque, ou s’il sera progressivement relégué au rang de vestige culturel.
Dans un monde où la technologie façonne de plus en plus nos usages, donner sa voix n’a sans doute jamais eu autant de sens.
Pour contribuer au projet, c’est ici
[cc] Article rédigé par la rédaction de breizh-info.com et relu et corrigé (orthographe, syntaxe) par une intelligence artificielle.
Breizh-info.com, 2026, dépêches libres de copie et de diffusion sous réserve de mention obligatoire et de lien do follow vers la source d’origine.
2 réponses à “Bretagne : un projet inédit pour sauver le breton à l’ère de l’intelligence artificielle”
Intéressant mais la liaison est incertaine et les coupures fréquentes.
J’allais dire : il existe déjà le projet Common Voice de mozilla… Mais c’est bien lui qui est derrière !
Excellente initiative en tout cas !