La vérité sur Google Gemini face à ChatGPT et GPT-4 ?

Le 06 décembre 2023, Google a créé l’événement en dévoilant son modèle d’intelligence artificielle conversationnelle Gemini, positionné comme un rival direct de GPT-4 développé par OpenAI. Derrière cette annonce retentissante, qu’en est-il réellement des capacités de Gemini ? Permet-il à Google de combler son retard sur des acteurs comme OpenAI ou Anthropic ?

Gemini, le concurrent de GPT-4 aux capacités bluffantes… en théorie

Dans sa keynote et ses communiqués, Google met en avant des performances exceptionnelles pour son modèle Gemini, supérieures à GPT-4 dans de nombreux domaines :

  • Raisonnement logique
  • Résolution de problèmes mathématiques
  • Génération de code informatique
  • Compréhension et génération d’images

Des démonstrations bluffantes nous montrent Gemini capable de comprendre des gestes en temps réel, résoudre des problèmes complexes, créer des interfaces web après seulement une description textuelle… De quoi impressionner face aux réalisations déjà bluffantes de GPT-3 ou GPT-4 !

Les 3 versions de Gemini : Nano, Pro et Ultra

Gemini se déclinera en fait sous 3 versions, destinées à différents usages :

  • Gemini Nano, version allégée pour les smartphones et tablettes
  • Gemini Pro, équivalent à GPT-3.5 selon Google
  • Gemini Ultra, vedette destinée à surpasser GPT-4

C’est cette dernière qui concentre les avancées les plus spectaculaires dans les communiqués de Google.

Des conditions de test peu réalistes

Cependant, à y regarder de plus près, les conditions ayant permis ces démonstrations semblent assez éloignées d’un usage réel de l’IA. Les requêtes envoyées à Gemini étaient préformatées, le contexte explicité en amont, les éléments valorisés pour orienter l’IA…

Bref, on est loin de questions spontanées posées par un humain lambda ! Le modèle a été guidé vers les réponses attendues par l’équipe de Google.

En pratique, Gemini Pro ne change pas la donne aujourd’hui

Car dans les faits, seuls Gemini Pro et Gemini Bard sont accessibles immédiatement. Le modèle Gemini Ultra arrivera plus tard, Google évoquant simplement 2024 sans date précise.

Or Gemini Pro ne semble pas révolutionner l’état de l’art. Ses capacités semblent similaires à GPT-3.5 déjà existant : pas de différence significative dans les échanges concrets.

Quant à Gemini Bard, il s’agit selon Google d’une version de Gemini Pro « fine-tunée » spécifiquement pour son service Bard. En réalité, les résultats obtenus restent limités : on est très loin des prouesses annoncées pour Gemini Ultra !

De plus, Gemini dans sa globalité n’est pour l’instant déployé qu’en anglais, et uniquement sur le service expérimental Bard de Google. Gemini Pro n’est pas encore intégré aux autres produits de Google comme Docs, Sheets etc.

Face à GPT-4, Gemini Ultra ne semble pas tenir ses promesses

En comparant les résultats de Gemini Ultra et GPT-4 sur les mêmes requêtes, force est de constater que les écarts semblent bien moindres que ce qu’annonçait Google !

Prenons quelques exemples :

  • Compréhension d’images : GPT-4 parvient aux mêmes interprétations et descriptions que Gemini Ultra sur des photos
  • Génération de code : les snippets de code produits sont équivalents en qualité
  • Résolution de problèmes : que ce soit en mathématiques ou en logique, GPT-4 répond aussi juste que Gemini
  • Génération de contenu : Gemini Ultra ne dépasse pas GPT-4 pour la création de texte ou d’images

Bien sûr, il est possible que Gemini possède tout de même une certaine supériorité sur certaines tâches pointues. Mais dans l’usage général, GPT-4 fait déjà aussi bien, voire mieux sur certains points !

Notamment car depuis son lancement, GPT-4 continue de progresser grâce aux optimisations d’OpenAI, alors que Gemini Ultra n’est pas encore pleinement opérationnel.

OpenAI toujours en avance ?

Et on sait déjà qu’OpenAI planche en coulisse sur le prochain modèle GPT-5… qui sortira donc probablement peu après Gemini Ultra ! Ainsi, le rival de Google risque fort de conserver une bonne longueur d’avance sur le marché de l’IA conversationnelle grand public.

Gemini Ultra, un coup marketing pour amorcer le virage IA de Google ?

Alors, comment expliquer cet écart entre la communication tonitruante de Google et les capacités réelles démontrées par Gemini ?

Plusieurs hypothèses sont envisageables :

  1. Créer l’évènement pour exister face à OpenAI et Anthropic, qui trustent l’attention médiatique ces derniers mois avec leurs nouveaux modèles GPT
  2. Rassurer les investisseurs sur la capacité de Google à rester leader sur l’IA, moteur de croissance du marché tech
  3. Amorcer en fanfare le virage IA de Google après des années de focus moindre sur ce domaine, comparativement à ses concurrents

Toujours est-il que dans les faits, pour les utilisateurs lambdas, Gemini ne changera pas fondamentalement la donne avant 2024. Et encore, à condition que les ambitions démesurées communiquées par Google se concrétisent dans les versions finales de Gemini Ultra et Gemini Pro.

D’ici là, nul doute qu’OpenAI continuera d’innover à un rythme effréné pour conserver sa pole position sur le créneau grand public !

Conclusion – L’avenir de Gemini face aux mastodontes de l’IA conversationnelle

Au vu de ces éléments, il semble que Google ait encore du chemin avant de rejoindre, et encore moins dépasser, les leaders que sont aujourd’hui OpenAI et Anthropic sur le terrain des IA conversationnelles grand public les plus avancées.

Les prochaines années nous diront si Gemini parvient réellement à s’imposer face à des solutions comme GPT-4, voire son successeur GPT-5. Mais en attendant, mieux vaut rester prudent face aux annonces tonitruantes de Google, et continuer de suivre de près les avancées fulgurantes d’OpenAI !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *