Android Central

Google Gemini er her for at sætte scenen for AI-modeller i 2024 og derefter

protection click fraud

Hvad du behøver at vide

  • På trods af rapporter om at det er forsinket, er Google Gemini blevet formelt introduceret.
  • Denne AI-model består af tre forskellige "størrelser", inklusive Gemini Nano, Pro og Ultra.
  • Gemini Nano er designet til mobile enheder, mens Gemini Pro bliver integreret i Google Bard.
  • Gemini Ultra er indstillet til at ankomme engang næste år, og vil være en del af den nye "Bard Advanced-oplevelse."

Ventetiden er endelig forbi, da Google officielt har afsløret sin sande ChatGPT-konkurrent med Google Gemini. Meddelt kl Google I/O 2023, Gemini er virksomhedens "næste generations fundamentmodel", som består af tre forskellige modeller: Ultra, Pro og Nano.

Selvom det kan virke, som om Google flyttede hurtigt for at bringe sin nye AI-model til offentligheden, kunne dette ikke være længere fra sandheden. Med hjælp fra Google DeepMind, Gemini har været i værket siden 2012, før den øgede udviklingen i 2015 med AI-acceleratorer.

I modsætning til Bard, som har undervældet i forhold til folk som ChatGPT og Claude, bringer Gemini ægte konkurrence. Af de tre forskellige modeller giver Google et bredt overblik over, hvad hver model kan levere:

Multimodal oversigt over Google Gemini Ultra, Pro og Nano
(Billedkredit: Google)
  • Gemini Nano: Den mest effektive model til opgaver på enheden.
  • Gemini Pro: Bedste model til skalering på tværs af en lang række opgaver.
  • Gemini Ultra: Største og mest kapable model til meget komplekse opgaver.

For at bryde tingene lidt ned, er Gemini Nano, hvad vi vil se komme til de bedste Android-telefoner. Ikke kun åbnes Gemini Nano for udviklere via AICore, men Google har allerede bekræftet, at det vil komme til Pixel 8 Pro.

Forvent dog ikke en dedikeret app til Gemini-adgang, da Google siger, at den "driver nye funktioner som Summarize i Recorder-appen og udrulning af Smart Reply i Gboard, starter med WhatsApp." Men takket være evnen for udviklere til at implementere og "bygge med Gemini Nano" gennem AICore, håber vi, at det ikke varer længe, ​​før Nano kommer til mere apps.

Et skridt opad vil Gemini Pro blive gjort tilgængelig for "udviklere og virksomhedskunder" fra den 13. december. Den vil være tilgængelig via den nye Gemini API, der findes i enten Google AI Studio eller Google Cloud Vertex AI.

Heldigvis behøver vi ikke vente på muligheden for at lege med Gemini Pro. Fra i dag er Gemini Pro blevet implementeret i Google Bard "til tekstbaserede prompter, med understøttelse af andre modaliteter snart." I øjeblikket er Bard med Gemini Pro kun tilgængelig i 170 lande, men Google planlægger at udvide til flere regioner og med flere sprog "i den nærmeste fremtid fremtid."

Google Gemini multimodal helte-gengivelse
(Billedkredit: Google)

Der er blevet lagt meget fokus på Gemini Pro, da Google hævder, at det er den "bedste model til at skalere på tværs af en lang række opgaver." En af undersøgelserne leveret af Google fastslår, at Gemini Pro var i stand til det bedre end GPT-3.5 "i seks ud af otte benchmarks." Selvom det er imponerende, må vi også spekulere på, om det vil blive forbedret til at overgå GPT-3.5, eller om det primære fokus vil være på Nano og Ultra.

Apropos det, Gemini Ultra er uden tvivl den mest spændende model af flok, da det er den "mest dygtige model." Dog vi vilje skal vente lidt længere, før vi får fingrene i Ultra, da Google "i øjeblikket gennemfører omfattende tillids- og sikkerhedstjek." 

Gemini Ultra vil først komme til at "udvælge kunder, udviklere, partnere og sikkerheds- og ansvarseksperter til tidlige eksperimenter og feedback, før det rulles ud til udviklere og virksomhedskunder tidligt næste år." Men der er noget andet at være begejstret for, da Ultra forventes at blive implementeret i en ny "Bard Advanced-oplevelse", som forventes at ankomme tidligt næste år.

Google Gemini tekst- og kodningsbenchmarks sammenlignet med OpenAI's GPT-4
(Billedkredit: Google)

Noget af det, der gør Gemini Ultra så spændende, er, hvor kraftfuldt det ser ud til at være. Google udtaler, at Ultra er "den første model, der overgår menneskelige eksperter på MMLU (massiv multitask sprogforståelse), som bruger en kombination af 57 fag, såsom matematik, fysik, historie, jura, medicin og etik til at teste både verdensviden og problemløsning evner." 

Hvordan gjorde den dette? Ved at modtage en score på 90%, hvilket er højere end den 86,4% beregnede score opnået af OpenAI's GPT-4 model. Gemini klarede sig bedre end GPT-4 i alle kategorier bortset fra "HellaSwag" benchmark, som beskrives som "commonsense ræsonnement for daglige opgaver." 

Hvis det ikke var tydeligt nok nu, var Google Bard blot en stopklods, da virksomheden fortsatte med at udvikle Gemini til det punkt, hvor de leverede en offentlig udgivelse. Men Bard fungerer også som adgangspunktet mellem os og Gemini, da du kan begynde at bruge Bard med Gemini Pro i dag.

For at hjælpe med at give lidt sjov og vise, hvad Bard med Gemini Pro er i stand til, samarbejdede Google med YouTuber Mark Rober. I den video, bruger Rober Bard til at komme med nogle videoideer, hvilket resulterer i, at Rober arbejder på at skabe "Verdens mest nøjagtige papirflyvemaskine." 

Derfra bruges Bard til at generere "historiestrukturer", som Rober derefter fortsætter med at følge. I hver af sektionerne er Bard ikke udelukkende afhængig af tekstbeskeder, da Rober tager billeder af de forskellige papirflydesigns og får Bard til at analysere dem for at afgøre, hvilken der er den bedste.

Efter at have opdaget det mest nøjagtige papirflydesign, bruges Bard derefter til at "kritisere" designet. Bard spytter sine resultater ud, mens han også giver nogle få forslag, såsom "vingerne er for små" og "papiret er for lys." Derfra tager Rober imod Bards råd og viser de forskellige testmetoder, der blev taget før den store finale.

Selvom teaser-videoen er fantastisk, er den ikke ligefrem det perfekte eksempel på, hvad vi er i stand til at prøve via Bard med Gemini Pro i dag. Det giver os dog et indblik i det større billede af, hvad der forhåbentlig vil være muligt, når Bard Advanced med Gemini Ultra bliver gjort tilgængelig.

Ikke desto mindre er det forfriskende at se Gemini få sin officielle debut, før vi vender kalenderen ind i 2024. Denne meddelelse har potentialet til at blive den største ting, der er sket for Google i de sidste ti år. Nu må vi bare håbe, at Bard med Gemini kan leve op til hypen.

instagram story viewer