Centrale Androïde

Google Gemini est là pour préparer le terrain pour les modèles d'IA en 2024 et au-delà

protection click fraud

Que souhaitez-vous savoir

  • Malgré les informations faisant état d'un retard, Google Gemini a été officiellement introduit.
  • Ce modèle d'IA est composé de trois « tailles » différentes, dont Gemini Nano, Pro et Ultra.
  • Gemini Nano est conçu pour les appareils mobiles, tandis que Gemini Pro est intégré à Google Bard.
  • Gemini Ultra devrait arriver l'année prochaine et fera partie de la nouvelle "expérience Bard Advanced".

L'attente est enfin terminée, puisque Google a officiellement dévoilé son véritable concurrent ChatGPT avec Google Gemini. Annoncé à Google I/O 2023, Gemini est le « modèle de base de nouvelle génération » de la société, composé de trois modèles différents: Ultra, Pro et Nano.

Bien qu'il puisse sembler que Google ait agi rapidement pour présenter son nouveau modèle d'IA au public, cela ne pourrait pas être plus éloigné de la vérité. Avec l'aide de Google DeepMind, Gemini est en préparation depuis 2012 avant d'accélérer son développement en 2015 avec des accélérateurs d'IA.

Contrairement à Bard, qui a été décevant par rapport à ChatGPT et Claude, Gemini apporte une véritable concurrence. Parmi les trois modèles différents, Google fournit un aperçu général de ce que chaque modèle peut offrir :

Présentation multimodale de Google Gemini Ultra, Pro et Nano
(Crédit image: Google)
  • Gemini Nano: modèle le plus efficace pour les tâches sur l'appareil.
  • Gemini Pro: meilleur modèle pour évoluer sur un large éventail de tâches.
  • Gemini Ultra: modèle le plus grand et le plus performant pour les tâches très complexes.

En décomposant un peu les choses, Gemini Nano est ce que nous verrons arriver sur les meilleurs téléphones Android. Non seulement Gemini Nano est ouvert aux développeurs via AICore, mais Google a déjà confirmé qu'il arriverait au Pixel 8 Pro.

Cependant, ne vous attendez pas à une application dédiée à l'accès à Gemini, car Google déclare qu'elle "propose de nouvelles fonctionnalités telles que Résumer dans l'application Recorder et déploie Smart Reply dans Gboard, en commençant par WhatsApp." Mais, grâce à la possibilité pour les développeurs d'implémenter et de "construire avec Gemini Nano" via AICore, nous espérons qu'il ne faudra pas longtemps avant que Nano ne devienne plus applications.

En franchissant une étape supplémentaire, Gemini Pro sera mis à la disposition des « développeurs et entreprises clientes » à partir du 13 décembre. Il sera accessible via la nouvelle API Gemini trouvée dans Google AI Studio ou Google Cloud Vertex AI.

Heureusement, nous n'aurons pas à attendre l'occasion de jouer avec Gemini Pro. À partir d'aujourd'hui, Gemini Pro a été implémenté dans Google Barde "pour les invites textuelles, avec la prise en charge d'autres modalités à venir." Actuellement, Bard avec Gemini Pro est uniquement disponible dans 170 pays, mais Google prévoit de s'étendre à plus de régions et avec plus de langues "dans le proche avenir."

Rendu de héros multimodal Google Gemini
(Crédit image: Google)

Une grande attention a été accordée à Gemini Pro, car Google affirme qu'il s'agit du "meilleur modèle pour évoluer sur un large éventail de tâches". L'une des études fournies par Google indique que Gemini Pro a pu surperformer GPT-3.5 "dans six des huit benchmarks". Bien qu'impressionnant, nous devons également nous demander s'il sera amélioré pour dépasser GPT-3.5 ou si l'accent principal sera mis sur Nano et Ultra.

En parlant de cela, Gemini Ultra est sans doute le modèle le plus excitant du groupe, car c'est le « modèle le plus performant ». Cependant, nous volonté Nous devrons attendre encore un peu avant de mettre la main sur Ultra, car Google "effectue actuellement des contrôles approfondis de confiance et de sécurité".

Gemini Ultra s'adressera d'abord à « des clients, des développeurs, des partenaires et des experts en sécurité et responsabilité sélectionnés pour des expérimentations et des commentaires précoces avant de le déployer auprès des développeurs et des développeurs ». clients d'entreprise au début de l'année prochaine. » Mais il y a autre chose qui nous passionne, car Ultra devrait être implémenté dans une nouvelle « expérience Bard Advanced », qui devrait arriver tôt. l'année prochaine.

Références de texte et de codage de Google Gemini par rapport au GPT-4 d'OpenAI
(Crédit image: Google)

Une partie de ce qui rend Gemini Ultra si intrigant est sa puissance. Google déclare qu'Ultra est « le premier modèle à surpasser les experts humains en matière de MMLU (compréhension massive du langage multitâche), qui utilise une combinaison de 57 matières telles que les mathématiques, physique, histoire, droit, médecine et éthique pour tester à la fois la connaissance du monde et la résolution de problèmes capacités." 

Comment a-t-il fait cela? En obtenant un score de 90 %, ce qui est supérieur au score calculé de 86,4 % obtenu par Le modèle GPT-4 d'OpenAI. Gemini a surpassé GPT-4 dans toutes les catégories, à l'exception du benchmark « HellaSwag », qui est décrit comme un « raisonnement de bon sens pour les tâches quotidiennes ».

Si cela n'était pas encore assez évident, Google Bard n'était qu'un pis-aller alors que la société continuait à développer Gemini au point de proposer une version publique. Mais Bard sert également de point d'accès entre nous et Gemini, puisque vous pouvez commencer à utiliser Bard avec Gemini Pro dès aujourd'hui.

Pour aider à s'amuser un peu et à montrer de quoi Bard avec Gemini Pro est capable, Google s'est associé au YouTuber Mark Rober. Dans le vidéo, Rober utilise Bard pour proposer quelques idées vidéo, ce qui a permis à Rober de travailler à la création de « l'avion en papier le plus précis au monde ».

À partir de là, Bard est utilisé pour générer des « structures d’histoire », que Rober suit ensuite. Dans chacune des sections, Bard ne s'appuie pas uniquement sur des invites textuelles, car Rober prend des photos des différents modèles d'avions en papier et demande à Bard de les analyser pour déterminer lequel est le meilleur.

Après avoir découvert la conception d'avion en papier la plus précise, Bard est ensuite utilisé pour « critiquer » la conception. Bard crache ses découvertes tout en proposant quelques suggestions, telles que "les ailes sont trop petites" et "le papier est trop petit". lumière." À partir de là, Rober suit les conseils de Bard, présentant les différentes méthodes de test utilisées avant le grand final.

Même si la vidéo teaser est géniale, elle n'est pas exactement l'exemple parfait de ce que nous pouvons essayer via Barde avec Gemini Pro aujourd'hui. Cependant, cela nous donne un aperçu de ce qui sera, espérons-le, possible une fois que Bard Advanced avec Gemini Ultra sera disponible.

Néanmoins, il est rafraîchissant de voir Gemini faire ses débuts officiels avant de retourner le calendrier jusqu'en 2024. Cette annonce pourrait bien être la chose la plus importante qui soit arrivée à Google au cours des dix dernières années. Il ne nous reste plus qu'à espérer que Bard with Gemini pourra être à la hauteur du battage médiatique.

instagram story viewer