NLP 4 MEDUMBA : pourquoi je veux préserver le Medumba avec l'IA
Retour au blog
·4 min readNLPPersonnel

NLP 4 MEDUMBA : pourquoi je veux préserver le Medumba avec l'IA

Je suis Balbino Tchoutzine, étudiant en 4e année de Génie Informatique à l'ENSPY (École Nationale Supérieure Polytechnique de Yaoundé), Deep Learning enthusiast. Si vous voulez en savoir plus sur moi et mon parcours dans l'IA, j'y consacre un article entier ici. Mais aujourd'hui, je veux parler d'autre chose : ma langue maternelle, le Medumba.

Le Medumba, c'est quoi ?

Way into town

Le Medumba est la langue du Département du Ndé, dans la région de l'Ouest Cameroun. Elle est parlée à Bangangté, le chef-lieu du département, mais aussi dans une dizaine de villages alentour : Bakong, Bangoulap, Bahouoc, Bagnoun, Tonga et bien d'autres. On compte environ 210 000 locuteurs.

C'est la langue de ma famille. Celle que j'entendais chaque jour à la maison, dans la bouche de mes parents.

Pourtant, moi, je ne la parle pas vraiment.

L'école prend toute la place

Le français d'abord, l'anglais ensuite. C'est la réalité de beaucoup d'étudiants africains : les langues maternelles restent à la maison pendant que les langues d'étude occupent tout l'espace intellectuel. Je ne le vis pas comme un regret pesant, c'est juste la réalité dans laquelle j'ai grandi.

Mais avec le temps, une envie s'est installée. Pas forcément l'envie de parler le Medumba couramment du jour au lendemain, mais quelque chose de plus grand : l'envie de le préserver. Pour les générations futures. Et pour moi aussi.

Le déclic : NLP for African Languages

Africa languages

Quand j'ai commencé à m'intéresser à l'IA, j'ai découvert une tendance qui prenait de l'ampleur sur le continent : utiliser le NLP (Natural Language Processing) pour donner une existence numérique à des langues jusque-là invisibles.

Des initiatives comme Masakhane, pionnière en Afrique sub-saharienne. Ou GalsenAI, la communauté sénégalaise qui fait un travail remarquable pour le Wolof (traducteur, synthèse vocale, modèles de langage). Des étudiants, des chercheurs, des passionnés qui prouvent que c'est possible, et qui le font.

Et plus près de chez moi, à l'ENSPY même, des aînés de Polytech ont fait la même chose avec le Yemba, langue du département de la Menoua (Dschang, Ouest Cameroun), et bien d'autres comme Lambda Africa. Ça, ça m'a vraiment parlé.

Je me suis dit : le Medumba mérite ça aussi. Et je peux le faire.

Ce que je veux construire

Mon objectif concret, c'est un traducteur automatique pour le Medumba, intégrable dans des plateformes ou des chatbots accessibles au grand public.

waxal

Pas forcément révolutionnaire sur le papier. Mais un outil utile, concret, accessible, quelque chose qui met la langue en avant et résout un vrai problème.

Le vrai défi : la donnée ?

Est-ce que j'ai déjà commencé ? Honnêtement, pas encore vraiment. Et le principal obstacle n'est pas la technique. Les compétences s'acquièrent, les ressources sont nombreuses et pour la plupart gratuites.

Je suis actuellement le programme Google DeepMind AI Research Foundations, une excellente immersion dans les grands modèles de langage et leurs applications NLP, principalement centrées en Afrique. Je recommande si vous êtes étudiant en informatique.

Google DeepMind

Le vrai défi, c'est la donnée numérique. Les ressources écrites en Medumba sont limitées et difficiles à trouver en ligne. Mais la donnée existe. Elle est vivante :

  • Dans la bouche des 210 000 locuteurs
  • Dans les familles (la mienne la première)
  • Dans les villages, les conversations quotidiennes, les cérémonies

La collecter et la transcrire prend du temps et des ressources. Mais c'est tout à fait faisable.

Mon message

Si tu es étudiant et que ta langue maternelle n'a aucun ou peu d'outils numériques : LANCE-TOI.

Pas forcément pour résoudre un grand problème dès le départ. Juste pour construire quelque chose d'utile, quelque chose qui met ta langue en avant. Et si ta langue a déjà quelques ressources, va plus loin, vulgarise-la, crée des outils qui la rendent accessible.

L'IA offre aujourd'hui des moyens concrets pour faire ça. Autant en profiter.

Done is better than perfect.

Ce projet est au début. Ce blog aussi. Mais les deux avancent, et je vous emmène avec moi.

#Medumba#NLP#Langues Africaines#IA#Cameroun

Partager

XLinkedInWhatsApp

Commentaires

Les commentaires utilisent GitHub Discussions. Connectez-vous avec votre compte GitHub.