Dakarinfo

Obtenez toutes les dernières nouvelles et rapports sur la FRANCE ici Manchettes, politique et culture françaises sur la chaîne d'information

Google se surpasse avec le lancement de Gemini 1.5 AI, une semaine après le lancement d'Ultra 1.0

Google se surpasse avec le lancement de Gemini 1.5 AI, une semaine après le lancement d'Ultra 1.0

Logo Gémeaux 1.5
Agrandir / Logo Gemini 1.5 émis par Google.

Google

Une semaine après sa dernière annonce majeure en matière d’IA, Google semble s’être surpassé. Jeudi dernier, Google a lancé Gemini Ultra 1.0, qui est censé être le meilleur modèle de langage d'IA que Google puisse proposer – et est disponible dans le cadre de l'assistant d'IA renommé « Gemini » (anciennement connu sous le nom de Bard). Aujourd'hui, Google Annoncer Gemini Pro 1.5, qui, selon lui, « atteint une qualité similaire à 1.0 Ultra, tout en utilisant moins de calcul ».

Félicitations, Google, vous avez réussi. Vous avez miné votre premier produit d'IA. Bien que l'Ultra 1.0 soit probablement encore meilleur que le Pro 1.5 (que disons-nous ici), l'Ultra a été présenté comme un argument de vente majeur pour le niveau « Gemini Advanced » du service d'abonnement One de Google. Les choses semblent désormais beaucoup moins avancées qu’il y a sept jours. Tout cela s’ajoute à la récente confusion de noms de Google. (Juste pour être clair – même si cela ne le dit pas du tout – la version gratuite de Bard/Gemini utilise actuellement le modèle Pro 1.0. Vous comprenez ?)

Google le prétend Gémeaux 1.5 Il représente une nouvelle génération de LLM qui « fait une percée dans la compréhension du contexte long » et peut traiter jusqu'à 1 million de jetons, « atteignant la plus longue fenêtre contextuelle de tous les modèles sous-jacents à grande échelle à ce jour ». Les symboles font partie d'un mot. La première partie de l’affirmation sur la « compréhension » est controversée et subjective, mais la deuxième partie est probablement vraie. Le GPT-4 Turbo d'OpenAI serait capable de gérer 128 000 jetons dans certaines circonstances, et un million de plus, soit environ 700 000 mots. La fenêtre contextuelle plus grande permet de traiter des documents plus longs et d'avoir lieu des conversations plus longues. (La famille de modèles Gemini 1.0 gère un maximum de 32 000 jetons.)

Mais toute avancée technique est presque totalement hors de propos. Que devons-nous penser d’une entreprise qui vient de déclarer la semaine dernière sa supériorité en matière d’IA sur le monde, pour ensuite la supplanter partiellement une semaine plus tard ? Est-ce la preuve du rythme rapide des progrès techniques en matière d'IA chez Google Labs, le signe que les formalités administratives freinent l'Ultra 1.0 depuis trop longtemps, ou simplement le signe d'une mauvaise coordination entre la recherche et le marketing ? Honnêtement, nous ne le savons pas.

Revenons donc à Gemini 1.5. De quoi s’agit-il réellement et comment sera-t-il disponible ? Google note que, comme la version 1.0 (qui propose les versions Nano, Pro et Ultra), elle sera disponible en plusieurs tailles. Pour l'instant, le Pro 1.5 est le seul modèle dévoilé par Google. Google dit que la version 1.5 utilise du nouveau Un mélange d'experts (MoE), ce qui signifie que le système active de manière sélective différents « experts » ou sous-modèles spécialisés au sein d'un réseau neuronal plus vaste pour des tâches spécifiques basées sur les données d'entrée.

Google affirme que Gemini 1.5 peut effectuer « un raisonnement sophistiqué sur d'énormes quantités d'informations ». Donne un exemple Analyser une transcription de 402 pages de la mission Apollo 11 sur la Lune. Il est impressionnant de traiter des documents de cette taille, mais le modèle, comme tout grand modèle de langage, est très susceptible d'intégrer des interprétations dans de grands contextes. Nous ne lui ferions pas confiance pour analyser correctement un million de jetons sans erreurs, cela met donc beaucoup de confiance entre les mains désemparées de LLM.

Pour ceux qui souhaitent approfondir les détails techniques, Google a A publié un rapport technique sur Gemini 1.5, ce qui semble montrer que Gemini fonctionne favorablement par rapport à GPT-4 Turbo sur diverses tâches, mais il est également important de noter que le choix et l'interprétation de ces benchmarks peuvent être subjectifs. Le rapport donne quelques chiffres sur l'amélioration du 1.5 par rapport au 1.0, affirmant qu'il est 28,9 % meilleur que le 1.0 Pro en « mathématiques, sciences et réflexion » et 5,2 % meilleur dans ces matières que le 1.0 Ultra.

Un tableau du document technique Gemini 1.5 montrant des comparaisons avec Gemini 1.0.
Agrandir / Un tableau du document technique Gemini 1.5 montrant des comparaisons avec Gemini 1.0.

Google

Mais pour l’instant, nous sommes toujours un peu choqués que Google lance ce modèle particulier en ce moment même. Essayez-vous d'aller de l'avant avec quelque chose dont vous savez qu'il pourrait bientôt arriver, comme le GPT-5 inédit d'OpenAI, par exemple ? Nous continuerons à creuser et vous ferons savoir ce que nous trouvons.

Google indique qu'un aperçu limité de 1.5 Pro est désormais disponible pour les développeurs via AI Studio et Vertex AI avec une fenêtre contextuelle de 128 000 jetons, extensible à 1 million de jetons plus tard. Il semble que Gemini 1.5 ne soit pas encore arrivé pour le chatbot Gemini (anciennement connu sous le nom de Bard).