Android Központi

A Google Gemini itt van, hogy előkészítse a terepet a mesterséges intelligencia modelljei számára 2024-ben és azt követően

protection click fraud

Amit tudnod kell

  • A késésről szóló jelentések ellenére a Google Gemini hivatalosan is bevezetésre került.
  • Ez a mesterséges intelligencia modell három különböző „méretből” áll, beleértve a Gemini Nano-t, a Pro-t és az Ultra-t.
  • A Gemini Nano-t mobileszközökhöz tervezték, míg a Gemini Pro-t a Google Bardba integrálják.
  • A Gemini Ultra valamikor jövőre érkezik, és az új "Bard Advanced" élmény része lesz.

A várakozásnak végre vége, hiszen a Google hivatalosan is bemutatta igazi ChatGPT versenytársát a Google Geminivel. Bejelentve: Google I/O 2023, A Gemini a cég „következő generációs alapozó modellje”, amely három különböző modellből áll: Ultra, Pro és Nano.

Bár úgy tűnhet, hogy a Google gyorsan hozzálátott új mesterséges intelligencia-modelljének a nyilvánossághoz, ez nem állhat távolabb az igazságtól. Segítségével Google DeepMindA Gemini 2012 óta dolgozik, majd 2015-ben AI-gyorsítókkal felpörgette a fejlesztést.

Barddal ellentétben, amely a ChatGPT-hez és Claude-hoz képest alulmaradt, a Gemini valódi versenyt hoz. A három különböző modell közül a Google átfogó áttekintést nyújt arról, hogy az egyes modellek mit tudnak nyújtani:

A Google Gemini Ultra, Pro és Nano multimodális áttekintése
(Kép jóváírása: Google)
  • Gemini Nano: A leghatékonyabb modell az eszközön végzett feladatokhoz.
  • Gemini Pro: A legjobb modell a feladatok széles skáláján történő méretezéshez.
  • Gemini Ultra: A legnagyobb és legmegfelelőbb modell rendkívül összetett feladatokhoz.

Kicsit lebontva a dolgokat, a Gemini Nano a legjobb Android telefonok közé tartozik. A Gemini Nano nem csak a fejlesztők számára nyílik meg ezen keresztül AICore, de a Google már megerősítette, hogy megjelenik a Pixel 8 Pro.

Ne számítson azonban dedikált alkalmazásra a Gemini-hozzáféréshez, mivel a Google azt állítja, hogy „új funkciókat hajt végre, mint például az Összegzés a Recorder alkalmazásban és az Intelligens válasz bevezetése a Gboardon, a WhatsApp-pal kezdve." De a fejlesztők lehetőségének köszönhetően az AICore segítségével implementálni és "építeni a Gemini Nano-val" reméljük, hogy nem telik el sokáig a Nano. alkalmazásokat.

Egy lépéssel feljebb lépve a Gemini Pro december 13-tól elérhető lesz a "fejlesztők és vállalati ügyfelek" számára. Hozzáférhető lesz az új Gemini API-n keresztül, amely a Google AI Stúdióban vagy a Google Cloud Vertex AI.

Szerencsére nem kell várnunk a lehetőségre, hogy játszhassunk a Gemini Pro-val. Mától kezdve a Gemini Pro bevezetésre került Google Bard "szöveg alapú felszólításokhoz, hamarosan más módozatok támogatásával." Jelenleg a Bard with Gemini Pro csak 170 országban érhető el, de a Google azt tervezi, hogy a közeljövőben több régióra és több nyelvre terjeszkedik jövő."

A Google Gemini multimodális hős renderelése
(Kép jóváírása: Google)

Nagy hangsúlyt fektettek a Gemini Pro-ra, mivel a Google azt állítja, hogy ez a "legjobb modell a feladatok széles skáláján történő skálázáshoz". A Google egyik tanulmánya szerint a Gemini Pro képes volt rá "nyolcból hatban" felülmúlja a GPT-3.5-öt. Bár lenyűgöző, azon is el kell tűnődnünk, hogy vajon javítják-e a GPT-3.5-öt, vagy az elsődleges hangsúly a Nano-n és Ultra.

Ha már itt tartunk, a Gemini Ultra vitathatatlanul a legizgalmasabb modell a csapatból, mivel ez a "legtehetősebb modell". Azonban mi akarat Várnunk kell még egy kicsit, mielőtt az Ultra kezébe vehetnénk, mivel a Google „jelenleg kiterjedt megbízhatósági és biztonsági ellenőrzéseket hajt végre”.

A Gemini Ultra először az ügyfelek, a fejlesztők, a partnerek, valamint a biztonsági és felelősségi szakértők kiválasztását jelenti a korai kísérletezés és visszajelzés céljából, mielőtt a fejlesztők és vállalati ügyfelek a jövő év elején." De van még valami izgalom, mivel az Ultra várhatóan egy új „Bard Advanced élménybe” kerül, amely várhatóan korán érkezik. következő év.

A Google Gemini szöveg- és kódolási referenciaértékei az OpenAI GPT-4-hez képest
(Kép jóváírása: Google)

A Gemini Ultra egy része az, ami annyira érdekessé teszi, hogy milyen erősnek tűnik. A Google kijelenti, hogy az Ultra az első modell, amely felülmúlja az emberi szakértőket MMLU (masszív többfeladatos nyelvértés), amely 57 tantárgy kombinációját használja, mint például a matematika, fizika, történelem, jog, orvostudomány és etika a világismeret és a problémamegoldás teszteléséhez képességek." 

Hogyan csinálta ezt? 90%-os pontszámot kapva, ami magasabb, mint a által elért 86,4%-os számított pontszám Az OpenAI GPT-4 modellje. A Gemini minden kategóriában felülmúlta a GPT-4-et, kivéve a "HellaSwag" benchmarkot, amelyet "józan ész a mindennapi feladatokhoz való érvelésnek" neveznek.

Ha ez mostanra nem lett volna elég nyilvánvaló, a Google Bard csak egy megállóhely volt, miközben a cég folytatta a Gemini fejlesztését a nyilvános kiadásig. De a Bard hozzáférési pontként is szolgál köztünk és a Gemini között, mivel már ma elkezdheti használni a Bardot a Gemini Pro-val.

Annak érdekében, hogy egy kis szórakozást nyújtson, és megmutassa, mire képes a Bard with Gemini Pro, a Google együttműködött Mark Rober YouTuberral. Ban,-ben videó, Rober felhasználja Bardot, hogy kitaláljon néhány videóötletet, aminek eredményeként Rober a "Világ legpontosabb papírrepülőgépe" megalkotásán dolgozik.

Innentől kezdve a Bardot "sztoristruktúrák" generálására használják, amelyeket Rober ezután követ. Az egyes szakaszokban Bard nem csak a szöveges felszólításokra hagyatkozik, mivel Rober képeket készít a különböző papírrepülő-tervekről, és Barddal elemzi azokat, hogy meghatározza, melyik a legjobb.

Miután felfedezte a legpontosabb papírrepülőterv-tervet, Bard-ot használják a terv "kritikálására". Bard kiköpi a megállapításait, miközben néhány javaslatot is tesz, például „a szárnyak túl kicsik” és „a papír túl kicsi Rober innentől megfogadja Bard tanácsát, bemutatva a különböző tesztelési módszereket, amelyeket a nagy világ előtt alkalmaztak. finálé.

Bár a kedvcsináló videó nagyszerű, nem éppen a tökéletes példa arra, hogy mit is tudunk kipróbálni Bard a Gemini Pro-val Ma. Azonban bepillantást enged a nagyobb képbe, hogy mi lesz remélhetőleg lehetséges, amint elérhetővé válik a Bard Advanced with Gemini Ultra.

Mindazonáltal üdítő látni, hogy a Gemini hivatalosan debütál, mielőtt átfordítjuk a naptárat 2024-re. Ez a bejelentés lehet a legnagyobb dolog, ami a Google-lal történt az elmúlt tíz évben. Most már csak abban kell reménykednünk, hogy Bard a Geminivel megfelel a hírverésnek.

instagram story viewer