En 2025, une avancée technologique majeure propulse la recherche sur la communication animale dans une nouvelle dimension : le lancement de DolphinGemma, un modèle d'intelligence artificielle (IA) spécialement conçu pour décrypter le langage des dauphins. Ce projet novateur résulte d'une collaboration entre Google, le Georgia Institute of Technology et le Wild Dolphin Project (WDP). L'objectif ? Mieux comprendre les vocalisations des dauphins et, à terme, établir une forme de dialogue entre l'espèce humaine et ces cétacés fascinants.
1. Contexte scientifique : un demi-siècle d'écoute sous-marine
Le Wild Dolphin Project, créé en 1985, est l'un des programmes les plus anciens consacrés à l'étude des dauphins tachetés de l'Atlantique, en particulier aux Bahamas. Depuis près de 40 ans, les chercheurs accumulent une base de données exceptionnelle, composée d'enregistrements audio et vidéo capturant les comportements, les interactions et les vocalisations des dauphins.
Certaines vocalisations ont déjà été partiellement interprétées :
- Les sifflements signatures, similaires à des noms propres.
- Les "squawks", impulsions associées aux conflits sociaux.
- Les clics et "buzzes", observés pendant la chasse ou la parade nuptiale.
Cependant, malgré ces percées, la complexité du langage des dauphins restait largement inexplorée, faute d'outils capables de traiter des données aussi riches et nuancées.
2. DolphinGemma : une IA adaptée à la bioacoustique
DolphinGemma repose sur Gemma, un modèle de langage à grande échelle développé par Google. Contrairement aux modèles génériques centrés sur le langage humain, DolphinGemma a été entraîné sur des données bioacoustiques spécifiques aux vocalisations de dauphins.
Caractéristiques techniques :
- 400 millions de paramètres, le rendant suffisamment compact pour être utilisé sur des smartphones (ex. Pixel 6).
- Architecture audio-in / audio-out : il écoute des sons de dauphins et génère en sortie des réponses vocales synthétiques.
- Utilisation de SoundStream : ce tokenizer segmente les sons en unités plus simples, facilitant leur traitement.
- Fonction de complétion : comme un "autocomplete" vocal, il prédit les prochaines unités sonores dans une séquence.
Comparatif technologique :
Par rapport à des modèles IA classiques utilisés pour les langues humaines (comme GPT, BERT), DolphinGemma se distingue par sa capacité à traiter des signaux audio bruts non linéaires et non textuels. Il s’agit d’une approche pionnière pour l'étude des communications animales.
3. Objectifs du projet : vers un vocabulaire partagé
L'ambition de DolphinGemma ne se limite pas à la simple reconnaissance de sons. Le but est de découvrir une structure linguistique sous-jacente et, à terme, établir un vocabulaire commun entre humains et dauphins.
Applications envisagées :
- Détection automatique de motifs récurrents dans les échanges vocaux.
- Attribution d’intentions ou de significations à certaines vocalisations.
- Génération de réponses synthétiques pour simuler un dialogue.
Cette approche ouvre la porte à l'apprentissage de signaux artificiels par les dauphins, comme l’utilisation de sons à signification convenue.
4. Le dispositif CHAT : un traducteur temps réel ?
Pour tester DolphinGemma en environnement réel, les chercheurs prévoient le déploiement d’un dispositif portable appelé CHAT (Cetacean Hearing Augmentation Telemetry).
Fonctionnalités du boîtier CHAT :
- Intègre un smartphone Pixel avec DolphinGemma embarqué.
- Capteurs audio haute précision et hydrophones.
- Capacité à détecter les sons et générer une réponse audio en temps réel.
Un tel dispositif pourrait permettre aux plongeurs ou aux scientifiques d'interagir activement avec des groupes de dauphins en milieu naturel.
5. Enjeux éthiques et perspectives d'avenir
Si DolphinGemma suscite un grand enthousiasme, il entraîne également des questions éthiques :
- Peut-on parler de "langue" ou de "culture" chez les dauphins ?
- Est-il souhaitable d'introduire des signaux artificiels dans leur communication ?
- Quelle est la limite entre observation scientifique et perturbation ?
Vers une communication interespèces ?
Malgré ces interrogations, DolphinGemma pourrait révolutionner notre relation avec le monde animal, en permettant des échanges cognitifs inédits. Comme les premières tentatives de dialogue avec des primates (ex. Koko le gorille ou Kanzi le bonobo), ce projet ouvre des possibilités scientifiques, philosophiques et mêmes sociétales.
Ouverture open source
Google prévoit de publier DolphinGemma en open source à l'été 2025, ce qui permettra à d'autres chercheurs de l'adapter à d'autres espèces ou d'en améliorer les performances. Cela pourrait poser les bases d’une linguistique animale assistée par IA.
Conclusion
DolphinGemma marque un tournant dans la science de la communication animale. En combinant IA, bioacoustique et décennies d'observations de terrain, ce projet redonne un nouveau souffle à l'étude des dauphins. Si ses promesses se concrétisent, il pourrait nous rapprocher d'un rêve ancien : comprendre et dialoguer avec une autre espèce intelligente. Une prouesse qui transformerait durablement notre rapport au vivant et à l’intelligence non humaine.