
Gradium : la startup française qui réinvente l'IA vocale
Le 2 décembre 2025, une nouvelle startup faisait son entrée fracassante dans l'écosystème de l'intelligence artificielle : Gradium. Spécialisée dans l'IA vocale, cette jeune pousse française vient de réaliser une levée de fonds record de 70 millions de dollars (environ 60 millions d'euros). Derrière ce nom se cache une équipe d'exception et une technologie prometteuse qui pourrait bien redéfinir notre interaction avec les machines.
Une levée de fonds record et des soutiens prestigieux
Dès sa sortie du mode "stealth" (discrétion), Gradium a immédiatement attiré l'attention des investisseurs avec une levée de fonds de 70 millions de dollars. Un montant particulièrement impressionnant pour un tour d'amorçage qui témoigne de la confiance des marchés dans le projet.
Cette levée a été co-menée par FirstMark Capital et Eurazeo, avec la participation de personnalités influentes du monde technologique et économique :
- Xavier Niel, fondateur d'Iliad/Free
- Eric Schmidt, ancien PDG de Google
- Rodolphe Saadé, PDG de CMA CGM
- DST Global Partners et Korelya Capital
Un soutien de poids qui positionne d'emblée Gradium comme un acteur majeur de l'IA vocale à l'échelle mondiale.
L'équipe d'exception derrière Gradium
Gradium n'est pas née de nulle part. Elle est l'émanation commerciale du laboratoire de recherche français Kyutai, financé à hauteur de 300 millions d'euros par Xavier Niel, Rodolphe Saadé et Eric Schmidt.
L'équipe fondatrice est composée d'anciens chercheurs de pointe ayant travaillé dans les plus prestigieuses entreprises technologiques :
- Neil Zeghidour (PDG) : ex-Meta, Google DeepMind et Kyutai
- Olivier Teboul (CTO) : ex-Google Brain
- Laurent Mazaré (CCO) : ex-Google DeepMind, Jane Street et Kyutai
- Alexandre Défossez (CSO) : ex-Meta et Kyutai
Ces chercheurs sont à l'origine de nombreux algorithmes et codecs audio neuronaux qui alimentent déjà les technologies vocales actuelles. Leur expertise collective constitue un avantage compétitif majeur pour Gradium.
Une technologie qui repense l'IA vocale
Le constat de Gradium est clair : les assistants vocaux actuels sont frustrants, non pas par manque d'efforts, mais à cause d'une architecture fondamentalement défectueuse. Les interactions sont souvent trop lentes et peu naturelles.
Pour résoudre ce problème, Gradium a développé une nouvelle approche de modélisation audio-langagière qui unifie la génération de voix, la transcription et le dialogue au sein d'une seule et même architecture neurale. Cette approche vise à maîtriser quatre piliers essentiels :
1. Précision : Comprendre et répondre sans erreur
2. Latence Ultra-Faible : Une conversation quasi instantanée
3. Flux Naturel : Une interaction qui ressemble à un vrai dialogue
4. Synthèse Expressive : Une voix qui transmet les émotions appropriées
Cette intégration complète permettrait de créer des interactions vocales beaucoup plus fluides et naturelles, se rapprochant d'une véritable conversation humaine.
Une architecture unifiée pour une expérience révolutionnaire
Contrairement aux systèmes actuels qui enchaînent plusieurs modèles spécialisés (reconnaissance vocale, compréhension du langage, génération de réponse, synthèse vocale), Gradium propose une architecture unifiée. Cette approche permet de réduire considérablement la latence et d'améliorer la cohérence des interactions.
Au cœur de cette technologie se trouve un modèle audio-langage unique qui traite directement les signaux audio bruts sans passer par des étapes intermédiaires de transcription. Cette intégration élimine les accumulations d'erreurs typiques des systèmes en cascade et permet au modèle de comprendre les nuances non-verbales (ton, rythme, intonation) qui sont souvent perdues lors de la transcription textuelle.
L'architecture repose sur des mécanismes d'attention avancés qui permettent au modèle de se concentrer sur les parties pertinentes du signal audio tout en maintenant le contexte de la conversation. Cette approche holistique permet non seulement une meilleure compréhension, mais aussi des réponses plus appropriées au niveau émotionnel et contextuel.
Cette conception unifiée s'inspire des recherches menées chez Kyutai et des avancées récentes dans les modèles audio-langage comme l'UALM (Unified Audio Language Model) qui étendent les LLM textuels pour gérer directement les entrées et sorties audio.
Un modèle économique pragmatique
Gradium adopte une approche pragmatique B2B (Business-to-Business). La startup ne vend pas directement un assistant vocal grand public, mais propose sa technologie via des API de streaming flexibles.
Concrètement, une entreprise peut utiliser Gradium comme une "couche vocale" pour envelopper n'importe quel modèle d'IA existant (basé sur du texte ou de la vision) et lui donner des capacités conversationnelles avancées. Cette approche "en cascade" permet aux entreprises d'enrichir facilement leurs applications existantes sans avoir à tout reconstruire.
Selon les informations disponibles, Gradium aurait déjà généré des revenus seulement six semaines après sa création, avec des clients dans des secteurs variés :
- Santé (prise de rendez-vous médicaux)
- Support client
- Jeux vidéo (donner la parole aux personnages)
- Publicité et divertissement
Ce démarrage commercial rapide témoigne de la maturité de leur technologie et de la forte demande pour des solutions vocales avancées.
Positionnement concurrentiel et ambitions
Gradium vise directement des acteurs bien établis comme ElevenLabs ou HeyGen. Son avantage réside dans sa technologie de fond, l'expertise de son équipe et son soutien financier, qui lui permettent de viser le titre de meilleur modèle d'IA vocale du marché d'ici 2026 en termes de vitesse, qualité et prix.
Avec cette levée de fonds et son équipe, Gradium vient renforcer un écosystème parisien de l'IA déjà très dynamique, où évoluent déjà des noms comme Mistral AI, Hugging Face, Dust ou Poolside. La startup est perçue comme ayant le potentiel pour devenir l'un des prochains succès français à l'échelle mondiale.
Sources
- Paris-based AI voice startup Gradium nabs $70M seed - TechCrunch : Annonce de la levée de fonds de Gradium et présentation de la startup.
- Gradium Launches With $70M to Build Voice Layer for AI - Startup Researcher : Analyse détaillée de la technologie et du modèle économique de Gradium.
- Intelligence artificielle : Des anciens du laboratoire Kyutai lancent leur start-up consacrée à l'IA vocale - L'Usine Digitale : Entretien avec Neil Zeghidour, co-fondateur de Gradium, sur les origines du projet et ses ambitions.
- UALM: Unified Audio Language Model for Understanding - arXiv : Article de recherche sur les architectures unifiées audio-langage qui inspirent l'approche de Gradium.
Qu'est-ce que Gradium exactement ?
Gradium est une startup française spécialisée dans l'intelligence artificielle vocale, fondée par d'anciens chercheurs de Kyutai, DeepMind et Meta. Elle développe une technologie d'IA vocale avancée basée sur une architecture unifiée pour la génération de voix, la transcription et le dialogue.
Combien Gradium a-t-elle levé et qui sont ses investisseurs ?
Gradium a levé 70 millions de dollars (environ 60 millions d'euros) en seed round. La levée a été co-menée par FirstMark Capital et Eurazeo, avec la participation de Xavier Niel, Eric Schmidt, Rodolphe Saadé, DST Global Partners et Korelya Capital.
Quelle est la particularité de la technologie de Gradium ?
La technologie de Gradium se distingue par son architecture unifiée qui intègre la génération de voix, la transcription et le dialogue dans une seule et même architecture neurale. Cette approche permet de réduire la latence et d'améliorer la fluidité des conversations vocales avec l'IA.
Quel est le modèle économique de Gradium ?
Gradium adopte un modèle économique B2B, proposant sa technologie via des API de streaming. Les entreprises peuvent utiliser ces API pour ajouter des capacités vocales avancées à leurs applications existantes, sans avoir à reconstruire entièrement leurs systèmes.
Qui sont les concurrents de Gradium ?
Les principaux concurrents de Gradium sur le marché de l'IA vocale sont ElevenLabs et HeyGen. Cependant, Gradium se différencie par son approche architecturale unifiée et l'expertise de son équipe fondatrice.





