Publié le 21/10/2025

Gemini et Claude dépassent GPT-5 : le classement qui confirme le désamour des utilisateurs

Le classement LMArena d'octobre 2025 marque un tournant significatif dans l'univers de l'intelligence artificielle. Pour la première fois depuis longtemps, les modèles OpenAI ne trônent plus au sommet du palmarès. Gemini de Google et Claude d'Anthropic ont désormais surpassé GPT-5, reflétant une tendance de fond : la réserve croissante des utilisateurs envers le dernier-né d'OpenAI. Décryptage d'un changement qui redéfinit l'équilibre des puissances dans le paysage de l'IA.

LMArena : le baromètre fiable des préférences utilisateurs

Avant d'analyser les résultats, comprenons ce qui rend LMArena si particulier. Cette plateforme d'évaluation indépendante classe les modèles d'IA selon les préférences réelles des utilisateurs. Sa méthodologie repose sur des duels anonymes où chaque modèle répond aux mêmes questions. Les utilisateurs choisissent ensuite la meilleure réponse sans connaître l'identité des IA.

Les résultats sont convertis en score Elo, similaire au système utilisé aux échecs, permettant un classement dynamique actualisé en temps réel. Cette approche élimine les biais marketing et reflète fidèlement la perception utilisateur. C'est précisément cette impartialité qui a établi LMArena comme une référence incontournable dans l'industrie.

L'interface simple de LM Arena qui permet de choisir entre 2 réponses (2 modèles). — L'interface de LM Arena est simple : 1 chat, 2 réponses à chaque question. Il est même possible de tester les modèles de création d'image.

Le classement d'octobre 2025 : une redistribution des cartes

Le palmarès d'octobre 2025 présente une hiérarchie sensiblement modifiée par rapport aux mois précédents. Voici le top 5 des modèles d'IA les plus performants selon LMArena :

1. Claude Opus 4.1 "thinking" (Anthropic)
2. Claude Sonnet 4.5 "thinking" (Anthropic)
3. Gemini 2.5 Pro (Google)
4. GPT-4.5 Preview (OpenAI)
5. ChatGPT-4o (OpenAI)

GPT-5 "high" se positionne à la 8ème place, derrière ses propres prédécesseurs. Une configuration inédite pour un nouveau modèle d'OpenAI, qui se retrouve ainsi déclassé par des versions antérieures de sa propre gamme. Cette situation interroge sur la trajectoire d'innovation choisie par le leader historique du secteur.

GPT-5 : une réception mitigée dès le lancement

La position de GPT-5 dans le classement ne constitue pas une surprise totale. Dès son lancement en août 2025, le modèle avait suscité des réactions réservées de la part des utilisateurs. Sam Altman, PDG d'OpenAI, avait d'ailleurs reconnu publiquement que GPT-5 présentait certaines limites par rapport à ses prédécesseurs.

Les retours des utilisateurs mettaient principalement en avant :

Des performances variables selon les types de tâches, particulièrement dans les domaines du raisonnement complexe et de la créativité
Une expérience utilisateur différente, perçue comme plus formelle et moins conversationnelle
Des réponses plus techniques et moins adaptées aux interactions naturelles

Cette perception s'est progressivement consolidée dans les classements, avec GPT-5 passant de la 6ème place en septembre à la 8ème en octobre, confirmant une tendance à la baisse.

Voir notre article sur la sortie de GPT-5

La demande de retour à GPT-4o

Face à ces réserves, de nombreux utilisateurs ont exprimé leur préférence pour GPT-4o. Un témoignage sur Reddit résume bien ce sentiment : "S'il vous plaît, faites revenir GPT-4o. On avait l'impression d'une conversation naturelle – longue –, fluide et amicale. Les réponses sèches de GPT-5 me donnent l'impression de parler à un robot."

Cette demande collective a conduit OpenAI à réintroduire GPT-4o pour les abonnés payants. Une décision qui, bien qu'inhabituelle, témoigne d'une écoute des retours d'utilisateurs et d'une certaine humilité face à la réception mitigée de leur dernier modèle.

Gemini et Claude : des stratégies qui portent leurs fruits

Pendant que GPT-5 rencontrait des difficultés à séduire, Google et Anthropic poursuivaient leur progression avec constance. Gemini 2.5 Pro se classe 3ème, validant l'approche graduelle de Google qui privilégie les améliorations progressives plutôt que les ruptures brutales.

Anthropic réalise une performance particulièrement remarquable avec ses modèles Claude qui occupent deux des trois premières places. L'entreprise semble avoir trouvé un équilibre pertinent entre performance technique et expérience utilisateur, en proposant des interactions perçues comme plus naturelles et des réponses mieux nuancées.

Ces deux acteurs ont su capitaliser sur un positionnement clair et une compréhension fine des attentes des utilisateurs, démontrant que la concurrence dans le domaine de l'IA est désormais bien réelle.

Les autres modèles notables du classement

Au-delà des têtes d'affiche, le classement d'octobre 2025 révèle plusieurs autres modèles méritant attention. GLM-4.6 de Zhipu AI se positionne comme le meilleur modèle open source à la 11ème place, démontrant que les solutions ouvertes peuvent rivaliser avec les géants du secteur.

Parmi les autres performances notables, on trouve Qwen3 d'Alibaba à la 10ème place, confirmant la montée en puissance des acteurs chinois dans l'écosystème mondial de l'IA. DeepSeek, autre modèle chinois, apparaît également dans les premières positions du classement.

Cette diversité des acteurs et des approches technologiques enrichit le paysage global de l'IA et offre aux utilisateurs un éventail plus large de solutions adaptées à leurs besoins spécifiques.

Spécialisation : la nouvelle donne du secteur

L'analyse détaillée du classement LMArena met en lumière une tendance de fond : la spécialisation des modèles selon leurs domaines d'excellence. Cette évolution reflète une maturité croissante du secteur de l'IA :

Domaine	Modèle leader	Position de GPT-5
Génération de texte	Gemini 2.5 Pro	8ème place
Développement web	GPT-5 "high"	1ère place
Génération d'images	Hunyuan Image 3.0 (Tencent)	7ème place
Recherche web	Grok-4	Hors top 5

Ces données montrent que chaque modèle excelle désormais dans des domaines spécifiques, suggérant que le choix d'une IA devrait de plus en plus dépendre du cas d'usage prévu plutôt que d'un classement général unique. Cette spécialisation bénéficie aux utilisateurs qui peuvent sélectionner l'outil le plus adapté à leurs besoins.

La fin d'une hégémonie ?

Pour mesurer pleinement la portée de ces changements, rappelons que GPT-4 avait dominé le classement pendant près de 10 mois (de mai 2023 à mars 2024). Cette longévité était exceptionnelle dans un secteur caractérisé par des évolutions rapides et constantes.

Aujourd'hui, le paysage se diversifie et s'équilibre. Plusieurs acteurs peuvent légitimement revendiquer des positions de leadership selon les critères d'évaluation. Cette redistribution des rôles offre aux utilisateurs un choix plus large et stimule une saine émulation entre les développeurs.
Nous assistons à une transition d'un marché dominé par un seul acteur vers un écosystème plus compétitif où l'excellence se mesure en fonction de la spécialisation et de la satisfaction utilisateur.

Perspectives pour l'industrie de l'IA

Le classement d'octobre 2025 enseigne une leçon fondamentale à l'industrie de l'IA : même les géants peuvent se tromper. La position de GPT-5 démontre qu'une innovation technique ne garantit pas l'adhésion des utilisateurs, et que la suprématie d'un acteur, aussi établi soit-il, n'est jamais acquise définitivement.

Cette situation révèle surtout que le véritable pouvoir dans l'écosystème de l'IA est entre les mains des utilisateurs. Leurs préférences, exprimées à travers des plateformes comme LMArena, façonnent désormais le marché plus efficacement que les campagnes marketing ou les annonces technologiques. Les entreprises qui comprennent cette dynamique et placent l'utilisateur au centre de leur stratégie sont celles qui prospéreront.

La concurrence s'intensifie, et c'est une excellente nouvelle pour tous. Elle pousse chaque acteur à se dépasser, à mieux comprendre les besoins réels, et à proposer des solutions toujours plus performantes et adaptées. Dans cette nouvelle donne, l'innovation ne suffit plus ; il faut aussi l'empathie, l'écoute et la capacité à créer une expérience véritablement humaine. L'avenir appartient à ceux qui sauront concilier excellence technique et intelligence émotionnelle.

Sources

Top 20 des modèles d'IA les plus performants en octobre 2025 – Blog du Modérateur : Analyse détaillée du classement LMArena d'octobre 2025 et des performances des différents modèles.
Chute de 50% : La dégringolade de GPT-5 va choquer les fans d'OpenAI – Formidable E-commerçant : Enquête sur les raisons de la réception mitigée de GPT-5 par les utilisateurs.
"The king is dead"—Claude 3 surpasses GPT-4 on Chatbot Arena for the first time – Ars Technica : Article historique sur la fin de la domination de GPT-4 en mars 2024.
ChatGPT : les débuts difficiles de GPT-5 – Le Monde : Reportage sur les réactions des utilisateurs suite au lancement de GPT-5.

Qu'est-ce que le classement LMArena et pourquoi est-il considéré comme fiable ?

LMArena est une plateforme d'évaluation indépendante qui classe les modèles d'IA selon les préférences des utilisateurs. Elle utilise des duels anonymes où chaque modèle répond aux mêmes prompts, et les utilisateurs choisissent la meilleure réponse sans connaître l'identité des IA. Ce classement est considéré comme fiable car il élimine les biais marketing et reflète véritablement la perception utilisateur, ce qui en fait une référence dans l'industrie.

Pourquoi GPT-5 est-il moins apprécié que les versions précédentes ?

GPT-5 est perçu comme moins performant dans certains domaines comme le raisonnement complexe et la créativité. Les utilisateurs lui reprochent également un style plus formel et moins conversationnel que GPT-4, avec des réponses jugées plus techniques et moins naturelles. Cette perception a été confirmée par les classements, où GPT-5 se retrouve derrière ses propres prédécesseurs comme GPT-4.5 et GPT-4o.

Quels sont les modèles d'IA qui dominent actuellement le classement LM Arena?

Selon le classement LMArena d'octobre 2025, les trois premiers modèles sont : 1) Claude Opus 4.1 "thinking" d'Anthropic, 2) Claude Sonnet 4.5 "thinking" d'Anthropic, et 3) Gemini 2.5 Pro de Google. Ces modèles sont suivis par GPT-4.5 Preview et ChatGPT-4o d'OpenAI, tandis que GPT-5 "high" se positionne à la 8ème place.

Combien de temps GPT-4 a-t-il dominé le classement des modèles d'IA ?

GPT-4 a dominé le classement LMArena (anciennement Chatbot Arena) pendant environ 10 mois, de son inclusion autour du 10 mai 2023 jusqu'à ce qu'il soit dépassé par Claude 3 Opus d'Anthropic en mars 2024. Cette période de domination exceptionnellement longue dans le secteur de l'IA en rapide évolution témoigne de la suprématie qu'a exercée OpenAI pendant cette période.

Quels sont les domaines où chaque modèle d'IA excelle particulièrement ?

Selon le classement LMArena, chaque modèle excelle dans des domaines spécifiques : Gemini 2.5 Pro domine en génération de texte, GPT-5 "high" est premier en développement web, Hunyuan Image 3.0 de Tencent lead en génération d'images, et Grok-4 se distingue en recherche web. Cette spécialisation croissante montre que le choix d'un modèle d'IA devrait dépendre du cas d'usage prévu plutôt que d'un classement général unique.

Gemini et Claude dépassent GPT-5 : le classement qui confirme le désamour des utilisateurs

LMArena : le baromètre fiable des préférences utilisateurs

Le classement d'octobre 2025 : une redistribution des cartes

GPT-5 : une réception mitigée dès le lancement

La demande de retour à GPT-4o

Gemini et Claude : des stratégies qui portent leurs fruits

Les autres modèles notables du classement

Spécialisation : la nouvelle donne du secteur

La fin d'une hégémonie ?

Perspectives pour l'industrie de l'IA

Sources

Sur le même sujet

J'ai résilié mon abonnement ChatGPT Plus

GPT-5 : Face aux attentes, des premiers retours mitigés

Pourquoi j'utilise de plus en plus Z.AI à la place de ChatGPT

Zenith et Summit : GPT-5 incognito ?

Seedream 4 : le modèle qui défie Nano Banana

GPT OSS : OpenAI comprend que l'avenir de l'IA sera open ou ne sera pas