Android Centrála

Google Gemini je tu, aby připravil půdu pro modely AI v roce 2024 a dále

protection click fraud

Co potřebuješ vědět

  • Navzdory zprávám o zpoždění byl Google Gemini formálně představen.
  • Tento model AI se skládá ze tří různých „velikostí“, včetně Gemini Nano, Pro a Ultra.
  • Gemini Nano je určen pro mobilní zařízení, zatímco Gemini Pro je integrován do Google Bard.
  • Gemini Ultra má dorazit někdy příští rok a bude součástí nového „Bard Advanced experience“.

Čekání je konečně u konce, protože Google oficiálně odhalil svého skutečného konkurenta ChatGPT s Google Gemini. Vyhlášeno v Google I/O 2023Gemini je „základním modelem nové generace“ společnosti, který se skládá ze tří různých modelů: Ultra, Pro a Nano.

I když by se mohlo zdát, že Google rychle představil svůj nový model AI veřejnosti, nemůže to být dále od pravdy. S pomocí Google DeepMind, Gemini pracuje od roku 2012, než v roce 2015 zrychlil vývoj pomocí akcelerátorů AI.

Na rozdíl od Barda, který je ve srovnání s lidmi jako ChatGPT a Claude ohromen, Gemini přináší skutečnou konkurenci. Ze tří různých modelů poskytuje Google široký přehled toho, co každý model může poskytnout:

Multimodální přehled služeb Google Gemini Ultra, Pro a Nano
(Obrazový kredit: Google)
  • Gemini Nano: Nejúčinnější model pro úkoly na zařízení.
  • Gemini Pro: Nejlepší model pro škálování napříč širokou škálou úkolů.
  • Gemini Ultra: Největší a nejschopnější model pro vysoce komplexní úkoly.

Když to trochu rozebereme, Gemini Nano je to, co uvidíme u nejlepších telefonů Android. Nejen, že se Gemini Nano otevírá vývojářům prostřednictvím AICore, ale Google již potvrdil, že přijde na Pixel 8 Pro.

Nečekejte však specializovanou aplikaci pro přístup Gemini, protože Google uvádí, že „pohání nové funkce, jako je Summarize v aplikaci Záznamník a zavádí chytré odpovědi v Gboardu, počínaje WhatsApp." Ale díky schopnosti vývojářů implementovat a „stavět s Gemini Nano" prostřednictvím AICore, doufáme, že nebude trvat dlouho a Nano přijde na více aplikace.

Posuneme-li se o krok výše, Gemini Pro bude k dispozici „vývojářům a podnikovým zákazníkům“ od 13. prosince. Bude přístupný prostřednictvím nového Gemini API, které najdete buď v Google AI Studio nebo Google Cloud Vertex AI.

Naštěstí nebudeme muset čekat na příležitost hrát si s Gemini Pro. Počínaje dneškem byla implementována Gemini Pro Google Bard "pro textové výzvy, s podporou dalších modalit již brzy." V současné době je pouze Bard s Gemini Pro k dispozici ve 170 zemích, ale Google plánuje rozšíření do více regionů a s více jazyky „v blízkém okolí budoucnost."

Vykreslení multimodálního hrdiny Google Gemini
(Obrazový kredit: Google)

Velká pozornost byla věnována Gemini Pro, protože Google tvrdí, že je to „nejlepší model pro škálování napříč širokou škálou úkolů“. Jedna ze studií poskytnutých společností Google uvádí, že Gemini Pro byl schopen překonat GPT-3.5 "v šesti z osmi benchmarků." I když je to působivé, musíme si také klást otázku, zda bude vylepšen, aby překonal GPT-3.5, nebo zda bude primární zaměření na Nano a Ultra.

Když už o tom mluvíme, Gemini Ultra je pravděpodobně tím nejzajímavějším modelem ze všech, protože je to „nejschopnější model“. Nicméně my vůle musíme ještě chvíli počkat, než se nám Ultra dostane do rukou, protože Google „v současné době dokončuje rozsáhlé kontroly důvěry a bezpečnosti“.

Gemini Ultra nejprve přijde „vybrat zákazníky, vývojáře, partnery a odborníky na bezpečnost a odpovědnost pro včasné experimentování a zpětnou vazbu před tím, než jej zpřístupní vývojářům a podnikové zákazníky začátkem příštího roku." Ale je tu ještě něco, z čeho se můžete těšit, protože se očekává, že Ultra bude implementováno do nového "Bard Advanced experience", který by měl přijít brzy příští rok.

Srovnání textu a kódování Google Gemini s GPT-4 OpenAI
(Obrazový kredit: Google)

Část toho, co dělá Gemini Ultra tak zajímavým, je to, jak silný se zdá být. Google uvádí, že Ultra je „prvním modelem, který překonává lidské experty MMLU (masivní multitask language porozumění), který využívá kombinaci 57 předmětů, jako je matematika, fyzika, historie, právo, medicína a etika pro testování světových znalostí a řešení problémů schopnosti." 

Jak se to povedlo? Získáním skóre 90 %, což je vyšší než 86,4 % vypočteného skóre dosaženého uživatelem Model GPT-4 OpenAI. Gemini překonali GPT-4 ve všech kategoriích kromě benchmarku „HellaSwag“, který je popisován jako „rozumné uvažování pro každodenní úkoly“.

Pokud to dosud nebylo dostatečně zřejmé, Google Bard byl pouze provizorní mezerou, protože společnost pokračovala ve vývoji Gemini do té míry, že poskytla veřejné vydání. Bard ale také slouží jako přístupový bod mezi námi a Gemini, protože Bard můžete začít používat s Gemini Pro již dnes.

Aby Google pomohl poskytnout trochu zábavy a předvedl, co všechno Bard s Gemini Pro umí, spojil se s YouTuberem Markem Roberem. V video, Rober využívá Barda k vymýšlení nápadů na videa, což vede k tomu, že Rober pracuje na vytvoření „Nejpřesnějšího papírového letadla na světě“.

Odtud je Bard použit ke generování „příběhových struktur“, které Rober poté následuje. V každé z sekcí se Bard nespoléhá pouze na textové výzvy, protože Rober fotí různé návrhy papírových letadel a Bard je analyzuje, aby určil, který je nejlepší.

Po objevení nejpřesnějšího návrhu papírového letadla je Bard použit ke „kritice“ návrhu. Bard chrlí svá zjištění a zároveň nabízí několik návrhů, jako například „křídla jsou příliš malá“ a „papír je příliš světlo." Odtamtud přijímá Rober Bardovu radu a předvádí různé testovací metody, které byly použity před velkým finále.

I když je ukázkové video skvělé, není to úplně dokonalý příklad toho, co můžeme vyzkoušet Bard s Gemini Pro dnes. Dává nám však nahlédnout do většího obrazu toho, co doufejme bude možné, jakmile bude k dispozici Bard Advanced s Gemini Ultra.

Nicméně je osvěžující vidět Gemini oficiálně debutovat před tím, než překlopíme kalendář do roku 2024. Toto oznámení má potenciál stát se největší věcí, která se Googlu za posledních deset let stala. Teď musíme jen doufat, že Bard s Blíženci dostojí humbuku.

instagram story viewer