Tencent Hy3 en tête d'OpenRouter

Hy3 le nouveau modèle de Tencent grimpe au premier rang des modèles les plus utilisés sur OpenRouter

En quelques jours, Hy3 preview, le nouveau modèle de Tencent, a conquis la première place du classement d'utilisation sur OpenRouter. Ce LLM open source basé sur une architecture Mixture-of-Experts (MoE) bouscule la hiérarchie établie. Voici pourquoi ce modèle de 295 milliards de paramètres change la donne et ce que son succès rapide révèle sur les attentes des développeurs.

Qu'est-ce qui rend Hy3 preview si attractif ?

Hy3 preview n'est pas un modèle de langage classique. Sa force réside dans son architecture Mixture-of-Experts (MoE). Avec 295 milliards de paramètres totaux, il n'en active que 21 milliards par token lors de l'inférence. Ce ratio lui confère une efficacité de calcul remarquable pour une puissance théorique très élevée.

Cette conception le rend particulièrement adapté aux workflows agentic et aux tâches de production, comme le raisonnement scientifique (STEM) ou le codage backend. Son autre atout majeur : une fenêtre de contexte de 256K tokens, un format idéal pour traiter de vastes bases de code ou des documents complexes.

Pourquoi Hy3 domine-t-il le classement OpenRouter ?

Le succès sur OpenRouter ne se résume pas à des prouesses techniques. Il s'explique par un alignement précis entre les capacités du modèle et les besoins du marché. Hy3 preview propose un tarif très compétitif de 0,066 $ par million de tokens d'entrée, ce qui le rend accessible pour des tests approfondis et une mise en production.

Sa disponibilité immédiate en open source sur Hugging Face a également permis une adoption rapide par la communauté. Enfin, les premiers retours le placent comme un modèle de choix pour le codage et les tâches d'agent, des cas d'usage à forte demande actuellement. L'accessibilité, le prix et la performance sur des tâches valorisées forment un cocktail gagnant.

Comment s'intègre Hy3 dans la stratégie de Tencent ?

Le lancement de Hy3 n'est pas qu'une démonstration technologique, c'est une intégration massive dans l'écosystème Tencent. Le modèle est déployé en production sur une multitude de services : Yuanbao, CodeBuddy, WorkBuddy, QQ, QQ Browser ou encore Tencent Docs.

Cette stratégie de déploiement en conditions réelles sert de validation au modèle, bien plus que les benchmarks académiques. En exposant Hy3 à des millions d'utilisateurs à travers des produits diversifiés, Tencent accumule des données d'usage précieuses et prouve sa robustesse en situation réelle.

Quels sont les points de vigilance pour Hy3 ?

Malgré son élan, le modèle soulève des interrogations. Sa licence inclut une clause inhabituelle : intenter un procès à Tencent, même en réclamation, peut entraîner la perte des droits d'utilisation. Une condition qui pourrait freiner l'adoption par des entreprises soucieuses de leur sécurité juridique.

De plus, bien qu'il soit open source, déployer un modèle MoE de cette envergure (295B) requiert des ressources d'infrastructure significatives. Son exécution optimale dépend de frameworks spécifiques comme SGLang ou Ray Data LLM, ce qui demande une certaine expertise technique.

Sources


Qu'est-ce que le modèle Hy3 de Tencent ?

Hy3 preview est un grand modèle de langage (LLM) développé par Tencent. C'est un modèle open source basé sur une architecture Mixture-of-Experts (MoE) avec 295 milliards de paramètres totaux, dont 21 milliards actifs par token, optimisé pour les tâches de raisonnement et de codage.

Pourquoi Hy3 est-il en tête d'OpenRouter ?

Hy3 preview domine le classement d'utilisation d'OpenRouter grâce à la combinaison de sa performance sur les tâches de codage et d'agent, de son prix d'accès très compétitif (0,066 $/M tokens) et de sa disponibilité en open source.

Hy3 est-il gratuit ?

L'accès aux poids du modèle sur Hugging Face est gratuit. Son utilisation via l'API d'OpenRouter est payante au prix de 0,066 $ par million de tokens d'entrée, avec une période d'essai gratuite proposée.

Sur le même sujet

Zhipu AI GLM-5
Lancement du modèle GLM-5 par Zhipu AI

Zhipu AI dévoile GLM-5 : un modèle open-source formé sans puces NVIDIA

L'écosystème de l'intelligence artificielle vient de vivre un séisme discret mais majeur. Zhipu AI (Z.ai) a officialisé le lancement de GLM-5, un nouveau modèle de langage qui ne se contente pas d'égaler les leaders du marché sur le papier : il change les règles du jeu. Avec une architecture Mixture-of-Experts de 744 milliards de paramètres, ce modèle open-source se distingue par une prouesse technique inédite à cette échelle : un entraînement réalisé intégralement sur des puces chinoises.

Meta Muse Spark
Meta Muse Spark Propriétaire

Muse Spark : le virage propriétaire de Meta et la fin de l'open source ?

Avec l'annonce de Muse Spark, Meta rompt brutalement avec une doctrine qui avait fait son succès ces dernières années : l'open source. Ce nouveau modèle, fruit de la refonte totale de sa division Superintelligence Labs, est propriétaire. Ce virage n'est pas anecdotique ; il répond à une nécessité économique et stratégique pressante pour le groupe de Mark Zuckerberg. Muse Spark n'est pas une simple évolution de Llama, c'est un moteur conçu dès le départ pour être monétisé, sécurisé et intégré verticalement au cœur de l'écosystème social de l'entreprise.

microsoft Mai-1
MAI-1 le nouveau modèle d'IA de Microsoft

MAI-1 : le nouveau modèle de Microsoft sera bientôt disponible

Microsoft vient de faire son entrée dans la course aux modèles d'IA avec MAI-1, son nouveau modèle de langage géant. Déjà présent sur la plateforme LM Arena sous le nom "mai-1-preview", ce modèle à 500 milliards de paramètres pourrait bientôt transformer l'expérience des utilisateurs dans les produits Microsoft. Voici ce qu'il faut savoir sur cette avancée majeure.

Hunyuan Image 3.0 Tencent
Hunyuan Image 3.0 VS Imagen

Hunyuan Image 3.0 : Le nouveau modèle chinois qui dépasse Imagen

Hunyuan Image 3.0 n'est pas juste une nouvelle IA pour générer des images. C'est une déclaration. Développé par le géant chinois Tencent, ce modèle open-source de 80 milliards de paramètres ne se contente âs de rivaliser avec les meilleurs : il les surpasse sur des benchmarks reconnus comme le LMArena. Voici pourquoi ce modèle change la donne et comment il se positionne face à des poids lourds comme Imagen de Google.

ERNIE Baidu
ERNIE le modèle de Baidu

Le point sur ERNIE, le modèle du géant chinois Baidu

Dans le paysage mondial de l'intelligence artificielle, quelques noms dominent les conversations. Mais derrière les géants américains se cache un acteur chinois de taille : Baidu et son modèle de langage ERNIE. Alors que ChatGPT d'OpenAI et Gemini de Google captent l'attention internationale, ERNIE s'impose progressivement comme une alternative puissante, particulièrement adaptée au marché chinois.

mistral mistral ai
Logo Mistral AI sur fond bleu

Qu’est-ce que Mistral AI ?

Mistral AI est une startup française qui veut jouer dans la cour des grands de l’intelligence artificielle. À travers une approche radicalement ouverte et des modèles performants comme Mistral 7B ou Mixtral, elle ambitionne de concurrencer les géants comme OpenAI ou Meta. Mais que fait vraiment Mistral AI, et pourquoi tout le monde en parle ?