Android Central

Google Gemini е тук, за да постави началото на AI моделите през 2024 г. и след това

protection click fraud

Какво трябва да знаете

  • Въпреки съобщенията за забавяне, Google Gemini беше официално представен.
  • Този AI модел се състои от три различни „размера“, включително Gemini Nano, Pro и Ultra.
  • Gemini Nano е предназначен за мобилни устройства, докато Gemini Pro се интегрира в Google Bard.
  • Gemini Ultra се очаква да пристигне някъде през следващата година и ще бъде част от новото „Bard Advanced experience“.

Чакането най-накрая приключи, тъй като Google официално представи своя истински конкурент ChatGPT с Google Gemini. Обявено на Google I/O 2023 г, Gemini е „основният модел от следващо поколение“ на компанията, който се състои от три различни модела: Ultra, Pro и Nano.

Въпреки че може да изглежда, че Google се е придвижил бързо, за да представи новия си AI модел на обществеността, това не може да бъде по-далеч от истината. С помощта на Google DeepMind, Gemini работи от 2012 г. преди да засили развитието през 2015 г. с AI ускорители.

За разлика от Bard, който не е впечатляващ в сравнение с хора като ChatGPT и Claude, Gemini носи истинска конкуренция. От трите различни модела Google предоставя широк преглед на това какво може да достави всеки модел:

Мултимодален преглед на Google Gemini Ultra, Pro и Nano
(Кредит за изображение: Google)
  • Gemini Nano: Най-ефективният модел за задачи на устройството.
  • Gemini Pro: Най-добрият модел за мащабиране в широк набор от задачи.
  • Gemini Ultra: Най-големият и най-способен модел за изключително сложни задачи.

Разбивайки нещата малко надолу, Gemini Nano е това, което ще видим да идва при най-добрите телефони с Android. Не само Gemini Nano се отваря за разработчици чрез AICore, но Google вече потвърди, че ще дойде на Pixel 8 Pro.

Въпреки това, не очаквайте специално приложение за достъп до Gemini, тъй като Google заявява, че „задвижва нови функции като Summarize в приложението Recorder и пуска Smart Reply в Gboard, като се започне с WhatsApp." Но благодарение на способността на разработчиците да внедряват и "изграждат с Gemini Nano" чрез AICore, ние се надяваме, че няма да мине много време преди Nano да стигне до повече приложения.

Придвижвайки се с една стъпка нагоре, Gemini Pro ще бъде достъпен за „разработчици и корпоративни клиенти“ от 13 декември. Той ще бъде достъпен чрез новия API на Gemini, намиращ се в Google AI Studio или Google Cloud Vertex AI.

За щастие, няма да се налага да чакаме възможността да си поиграем с Gemini Pro. От днес Gemini Pro е внедрен в Google Bard "за текстови подкани, с поддръжка за други модалности скоро." В момента Bard с Gemini Pro е само наличен в 170 държави, но Google планира да се разшири до повече региони и с повече езици "в близко време бъдеще."

Рендиране на мултимодален герой на Google Gemini
(Кредит за изображение: Google)

Голям фокус беше поставен върху Gemini Pro, тъй като Google твърди, че това е „най-добрият модел за мащабиране в широк спектър от задачи“. Едно от проучванията, предоставени от Google, посочва, че Gemini Pro е успял превъзхожда GPT-3.5 "в шест от осем бенчмарка." Въпреки че е впечатляващо, ние също трябва да се чудим дали ще бъде подобрено, за да надмине GPT-3.5 или ако основният фокус ще бъде върху Nano и Ултра.

Говорейки за това, Gemini Ultra е може би най-вълнуващият модел от групата, тъй като е „най-способният модел“. Ние обаче ще трябва да изчакаме още малко, преди да се сдобием с Ultra, тъй като Google „в момента завършва обширни проверки за доверие и безопасност“.

Gemini Ultra първо ще дойде, за да „избере клиенти, разработчици, партньори и експерти по безопасност и отговорност за ранно експериментиране и обратна връзка, преди да го разпространи на разработчици и корпоративни клиенти в началото на следващата година.“ Но има още нещо, за което да се вълнуваме, тъй като се очаква Ultra да бъде внедрена в ново „Bard Advanced experience“, което се очаква да пристигне рано следващата година.

Сравнителни показатели за текст и кодиране на Google Gemini в сравнение с GPT-4 на OpenAI
(Кредит за изображение: Google)

Част от това, което прави Gemini Ultra толкова интригуващ, е колко мощен изглежда. Google заявява, че Ultra е „първият модел, който превъзхожда човешките експерти MMLU (масивно многозадачно разбиране на език), който използва комбинация от 57 предмета като математика, физика, история, право, медицина и етика за тестване както на познанието за света, така и за решаване на проблеми способности." 

Как направи това? Чрез получаване на резултат от 90%, което е по-високо от изчисления резултат от 86,4%, постигнат от GPT-4 моделът на OpenAI. Gemini превъзхожда GPT-4 във всяка категория, с изключение на бенчмарка „HellaSwag“, който се описва като „разумни разсъждения за ежедневни задачи“.

Ако досега не беше достатъчно очевидно, Google Bard беше просто временно прекъсване, тъй като компанията продължи да развива Gemini до точката на предоставяне на публично издание. Но Bard също така служи като точка за достъп между нас и Gemini, тъй като можете да започнете да използвате Bard с Gemini Pro днес.

За да осигури малко забавление и да покаже на какво е способен Bard с Gemini Pro, Google си партнира с YouTuber Mark Rober. В видео, Робър използва Бард, за да измисли някои видео идеи, в резултат на което Робер работи за създаването на „Най-точния хартиен самолет в света“.

Оттам нататък Бард се използва за генериране на „исторически структури“, които Робер след това продължава да следва. Във всяка от секциите Бард не разчита само на текстови подкани, тъй като Робър прави снимки на различните дизайни на хартиени самолети и кара Бард да ги анализира, за да определи кой е най-добрият.

След като открива най-точния дизайн на хартиен самолет, Бард се използва за „критика“ на дизайна. Бард излага своите открития, като същевременно предлага няколко предложения, като например „крилата са твърде малки“ и „хартията е твърде светлина." Оттам Робер приема съвета на Бард, демонстрирайки различните методи за тестване, които са били предприети преди големия финал.

Въпреки че видеото с тийзър е страхотно, то не е идеалният пример за това, чрез което можем да опитаме Бард с Gemini Pro днес. Въпреки това, това ни дава поглед към по-голямата картина на това, което се надяваме да бъде възможно, след като Bard Advanced с Gemini Ultra бъде наличен.

Въпреки това е освежаващо да видим как Gemini прави официалния си дебют, преди да прехвърлим календара към 2024 г. Това съобщение има потенциала да бъде най-голямото нещо, което се е случвало на Google през последните десет години. Сега просто трябва да се надяваме, че Bard with Gemini може да оправдае рекламата.

instagram story viewer