Google Gemini jest tutaj, aby przygotować grunt pod modele sztucznej inteligencji w 2024 r. i później

Co musisz wiedzieć

Pomimo doniesień o opóźnieniu Google Gemini zostało oficjalnie wprowadzone.
Ten model AI składa się z trzech różnych „rozmiarów”, w tym Gemini Nano, Pro i Ultra.
Gemini Nano jest przeznaczone dla urządzeń mobilnych, natomiast Gemini Pro jest integrowane z Google Bard.
Gemini Ultra zadebiutuje w przyszłym roku i będzie częścią nowego „Bard Advanced Experience”.

Oczekiwanie wreszcie się skończyło, ponieważ Google oficjalnie zaprezentowało swojego prawdziwego konkurenta ChatGPT, czyli Google Gemini. Ogłoszono o godz We/Wy Google 2023Gemini to „podstawowy model nowej generacji” firmy, na który składają się trzy różne modele: Ultra, Pro i Nano.

Choć mogłoby się wydawać, że Google szybko podjął działania, aby udostępnić społeczeństwu swój nowy model sztucznej inteligencji, nie może to być dalsze od prawdy. Z pomocą Google DeepMindPrace nad projektem Gemini trwały od 2012 r., a w 2015 r. przyspieszono rozwój dzięki akceleratorom sztucznej inteligencji.

W przeciwieństwie do Barda, który rozczarowuje w porównaniu z takimi rozwiązaniami jak ChatGPT i Claude, Gemini zapewnia prawdziwą konkurencję. Spośród trzech różnych modeli Google zapewnia szeroki przegląd możliwości każdego modelu:

instagram viewer

Multimodalny przegląd Google Gemini Ultra, Pro i Nano — (Źródło zdjęcia: Google)

Gemini Nano: Najbardziej wydajny model do zadań na urządzeniu.
Gemini Pro: Najlepszy model do skalowania w szerokim zakresie zadań.
Gemini Ultra: Największy i najbardziej wydajny model do bardzo złożonych zadań.

Krótko mówiąc, Gemini Nano to coś, co zobaczymy w najlepszych telefonach z Androidem. Gemini Nano jest dostępne dla programistów nie tylko za pośrednictwem AICore, ale Google już potwierdził, że pojawi się na platformie Pixela 8 Pro.

Nie należy się jednak spodziewać dedykowanej aplikacji umożliwiającej dostęp do Gemini, ponieważ Google twierdzi, że „obsługuje nowe funkcje, takie jak Podsumowanie w aplikacji Rejestrator i wdraża Inteligentną odpowiedź w Gboard, zaczynając od WhatsApp.” Jednak dzięki możliwości programistów wdrażania i „budowania przy użyciu Gemini Nano” za pośrednictwem AICore, mamy nadzieję, że nie minie dużo czasu, zanim Nano osiągnie więcej aplikacje.

Idąc dalej, Gemini Pro będzie dostępne dla „programistów i klientów korporacyjnych” od 13 grudnia. Będzie dostępny poprzez nowy interfejs API Gemini dostępny w Google AI Studio lub Google Cloud Vertex AI.

Na szczęście nie będziemy musieli czekać na okazję do zabawy z Gemini Pro. Od dzisiaj wdrożono Gemini Pro Google Bard „w przypadku podpowiedzi tekstowych, wkrótce obsługa innych trybów”. Obecnie Bard z Gemini Pro to tylko dostępna w 170 krajach, ale Google planuje rozszerzyć działalność na większą liczbę regionów i udostępnić więcej języków „w najbliższej przyszłości”. przyszły."

Multimodalny render bohatera Google Gemini — (Źródło zdjęcia: Google)

Duży nacisk położono na Gemini Pro, ponieważ Google twierdzi, że jest to „najlepszy model do skalowania w szerokim zakresie zadań”. Jedno z badań dostarczonych przez Google stwierdza, że Gemini Pro było w stanie przewyższa GPT-3.5 „w sześciu z ośmiu testów porównawczych”. Choć robi wrażenie, musimy się również zastanowić, czy zostanie ulepszony, aby przekroczyć GPT-3.5, czy też główny nacisk zostanie położony na Nano i Ultra.

A skoro już o tym mowa, Gemini Ultra jest prawdopodobnie najbardziej ekscytującym modelem w całej gamie, ponieważ jest „modelem o największych możliwościach”. Jednakże, my będzie musimy poczekać trochę dłużej, zanim w nasze ręce trafi Ultra, ponieważ Google „obecnie przeprowadza szczegółowe kontrole zaufania i bezpieczeństwa”.

Gemini Ultra najpierw trafi do „wybranych klientów, programistów, partnerów oraz ekspertów ds. bezpieczeństwa i odpowiedzialności w celu wczesnych eksperymentów i uzyskania informacji zwrotnej przed udostępnieniem go programistom i klientów korporacyjnych na początku przyszłego roku.” Ale jest coś innego, czym można się ekscytować, ponieważ oczekuje się, że Ultra zostanie wdrożony w nowym „doświadczeniach Bard Advanced”, które ma pojawić się wcześnie Następny rok.

Testy porównawcze tekstu i kodowania Google Gemini w porównaniu z GPT-4 OpenAI — (Źródło zdjęcia: Google)

Częścią tego, co sprawia, że Gemini Ultra jest tak intrygujący, jest jego potężność. Google twierdzi, że Ultra to „pierwszy model, w sprawie którego wyniki przewyższają ludzkich ekspertów MMLU (masywne wielozadaniowe rozumienie języka), w którym wykorzystuje się kombinację 57 przedmiotów, takich jak matematyka, fizyki, historii, prawa, medycyny i etyki do sprawdzania wiedzy o świecie i rozwiązywania problemów zdolności.”

Jak to zrobiło? Otrzymując wynik 90%, czyli wyższy niż obliczony wynik 86,4% uzyskany przez Model GPT-4 OpenAI. Gemini uzyskało lepsze wyniki niż GPT-4 we wszystkich kategoriach z wyjątkiem testu porównawczego „HellaSwag”, który określa się jako „zdroworozsądkowe rozumowanie w codziennych zadaniach”.

Choć do tej pory nie było to wystarczająco oczywiste, Google Bard był jedynie tymczasowym rozwiązaniem, ponieważ firma kontynuowała rozwój Gemini do momentu udostępnienia go publicznie. Ale Bard służy również jako punkt dostępu między nami a Gemini, ponieważ już dziś możesz zacząć używać Barda z Gemini Pro.

Aby zapewnić odrobinę zabawy i pokazać, do czego zdolny jest Bard z Gemini Pro, Google nawiązał współpracę z YouTuberem Markiem Roberem. w wideo, Rober wykorzystuje Barda do wymyślenia kilku pomysłów na filmy, w wyniku czego Rober pracuje nad stworzeniem „Najdokładniejszego papierowego samolotu na świecie”.

Stamtąd Bard jest używany do generowania „struktur opowieści”, którymi Rober następnie podąża. W każdej z sekcji Bard nie polega wyłącznie na podpowiedziach tekstowych, ponieważ Rober robi zdjęcia różnych projektów papierowych samolotów i pozwala Bardowi je przeanalizować, aby określić, który jest najlepszy.

Po odkryciu najdokładniejszego projektu samolotu papierowego Bard zostaje następnie wykorzystany do „krytyki” projektu. Bard wypluwa swoje ustalenia, oferując jednocześnie kilka sugestii, takich jak „skrzydełka są za małe” i „papier jest za światło.” Od tego momentu Rober skorzystał z rady Barda, przedstawiając różne metody testowania, które zastosowano przed wielkim finał.

Chociaż zwiastun jest świetny, nie jest to doskonały przykład tego, czego możemy spróbować Bard z Gemini Pro Dzisiaj. Daje nam to jednak wgląd w szerszy obraz tego, co, miejmy nadzieję, będzie możliwe po udostępnieniu Bard Advanced z Gemini Ultra.

Niemniej jednak odświeżający jest widok oficjalnego debiutu Gemini, zanim przeniesiemy kalendarz na rok 2024. To ogłoszenie może być największą rzeczą, jaka przydarzyła się Google w ciągu ostatnich dziesięciu lat. Teraz pozostaje nam tylko mieć nadzieję, że Bard i Gemini sprostają oczekiwaniom.

Centrala Androida

Google Gemini jest tutaj, aby przygotować grunt pod modele sztucznej inteligencji w 2024 r. i później

Co musisz wiedzieć

Kategorie

Najnowszy post na blogu

Czytaj Teraz