Το Google Gemini είναι εδώ για να δημιουργήσει τις βάσεις για μοντέλα τεχνητής νοημοσύνης το 2024 και μετά

Τι πρέπει να ξέρετε

Παρά τις αναφορές για καθυστέρηση, το Google Gemini εισήχθη επίσημα.
Αυτό το μοντέλο AI αποτελείται από τρία διαφορετικά «μεγέθη», συμπεριλαμβανομένων των Gemini Nano, Pro και Ultra.
Το Gemini Nano έχει σχεδιαστεί για κινητές συσκευές, ενώ το Gemini Pro ενσωματώνεται στο Google Bard.
Το Gemini Ultra πρόκειται να φτάσει κάποια στιγμή τον επόμενο χρόνο και θα είναι μέρος της νέας «εμπειρίας Bard Advanced».

Η αναμονή επιτέλους τελείωσε, καθώς η Google αποκάλυψε επίσημα τον πραγματικό ανταγωνιστή της ChatGPT με το Google Gemini. Ανακοινώθηκε στις Google I/O 2023, το Gemini είναι το «θεμελιώδες μοντέλο επόμενης γενιάς» της εταιρείας, το οποίο αποτελείται από τρία διαφορετικά μοντέλα: Ultra, Pro και Nano.

Αν και μπορεί να φαίνεται ότι η Google κινήθηκε γρήγορα για να φέρει στο κοινό το νέο της μοντέλο τεχνητής νοημοσύνης, αυτό δεν θα μπορούσε να απέχει περισσότερο από την αλήθεια. Με τη βοήθεια του Google DeepMind, το Gemini βρίσκεται στα σκαριά από το 2012 προτού επιταχύνει την ανάπτυξη το 2015 με επιταχυντές τεχνητής νοημοσύνης.

instagram viewer

Σε αντίθεση με τον Bard, ο οποίος έχει υποχωρήσει σε σύγκριση με τους ChatGPT και τον Claude, ο Gemini φέρνει αληθινό ανταγωνισμό. Από τα τρία διαφορετικά μοντέλα, η Google παρέχει μια ευρεία επισκόπηση του τι μπορεί να προσφέρει κάθε μοντέλο:

Πολυτροπική επισκόπηση των Google Gemini Ultra, Pro και Nano — (Πίστωση εικόνας: Google)

Gemini Nano: Το πιο αποτελεσματικό μοντέλο για εργασίες στη συσκευή.
Gemini Pro: Το καλύτερο μοντέλο για την κλιμάκωση σε ένα ευρύ φάσμα εργασιών.
Gemini Ultra: Το μεγαλύτερο και πιο ικανό μοντέλο για εξαιρετικά πολύπλοκες εργασίες.

Αναλύοντας λίγο τα πράγματα, το Gemini Nano είναι αυτό που θα δούμε στα καλύτερα τηλέφωνα Android. Όχι μόνο το Gemini Nano ανοίγει στους προγραμματιστές μέσω AICore, αλλά η Google έχει ήδη επιβεβαιώσει ότι θα έρθει στο Pixel 8 Pro.

Ωστόσο, μην περιμένετε μια αποκλειστική εφαρμογή για πρόσβαση στο Gemini, καθώς η Google δηλώνει ότι "τροφοδοτεί νέες λειτουργίες όπως το Summarize στην εφαρμογή Recorder και κυκλοφορεί το Smart Reply στο Gboard, ξεκινώντας με το WhatsApp." Αλλά, χάρη στη δυνατότητα των προγραμματιστών να εφαρμόζουν και να "χτίζουν με το Gemini Nano" μέσω του AICore, ελπίζουμε ότι δεν θα αργήσει πολύς καιρός να φτάσει το Nano σε περισσότερα εφαρμογές.

Ανεβαίνοντας ένα βήμα, το Gemini Pro θα είναι διαθέσιμο σε "προγραμματιστές και εταιρικούς πελάτες" από τις 13 Δεκεμβρίου. Θα είναι προσβάσιμο μέσω του νέου API Gemini που βρίσκεται είτε στο Google AI Studio είτε Google Cloud Vertex AI.

Ευτυχώς, δεν θα χρειαστεί να περιμένουμε την ευκαιρία να παίξουμε με το Gemini Pro. Από σήμερα, το Gemini Pro έχει εφαρμοστεί σε Google Bard "για μηνύματα προτροπής που βασίζονται σε κείμενο, με υποστήριξη για άλλες τροπολογίες σύντομα." Προς το παρόν, ο Bard with Gemini Pro είναι μόνο διαθέσιμο σε 170 χώρες, αλλά η Google σχεδιάζει να επεκταθεί σε περισσότερες περιοχές και με περισσότερες γλώσσες "στο εγγύς μέλλον μελλοντικός."

Google Gemini multimodal hero render — (Πίστωση εικόνας: Google)

Έχει δοθεί μεγάλη έμφαση στο Gemini Pro, καθώς η Google ισχυρίζεται ότι είναι το "καλύτερο μοντέλο για την κλιμάκωση σε ένα ευρύ φάσμα εργασιών". Μία από τις μελέτες που παρέχονται από την Google αναφέρει ότι το Gemini Pro ήταν σε θέση ξεπερνούν το GPT-3.5 "σε έξι από τα οκτώ σημεία αναφοράς." Αν και είναι εντυπωσιακό, πρέπει επίσης να αναρωτηθούμε εάν θα βελτιωθεί για να ξεπεράσει το GPT-3.5 ή εάν η κύρια εστίαση θα είναι στο Nano και Υπερ.

Εδώ που τα λέμε, το Gemini Ultra είναι αναμφισβήτητα το πιο συναρπαστικό μοντέλο της παρέας, καθώς είναι το «πιο ικανό μοντέλο». Ωστόσο, εμείς θα πρέπει να περιμένουμε λίγο ακόμα προτού πάρουμε στα χέρια μας το Ultra, καθώς η Google "αυτή τη στιγμή ολοκληρώνει εκτεταμένους ελέγχους εμπιστοσύνης και ασφάλειας".

Το Gemini Ultra θα έρθει πρώτα για να «επιλέξει πελάτες, προγραμματιστές, συνεργάτες και ειδικούς σε θέματα ασφάλειας και ευθύνης για πρώιμους πειραματισμούς και σχόλια πριν το διαθέσει στους προγραμματιστές και εταιρικοί πελάτες στις αρχές του επόμενου έτους." Αλλά υπάρχει κάτι άλλο για το οποίο πρέπει να είμαστε ενθουσιασμένοι, καθώς το Ultra αναμένεται να εφαρμοστεί σε μια νέα "εμπειρία Bard Advanced", η οποία αναμένεται να φτάσει νωρίς του χρόνου.

Συγκριτικά σημεία αναφοράς κειμένου και κωδικοποίησης Google Gemini σε σύγκριση με το GPT-4 του OpenAI — (Πίστωση εικόνας: Google)

Μέρος αυτού που κάνει το Gemini Ultra τόσο συναρπαστικό είναι το πόσο ισχυρό φαίνεται να είναι. Η Google δηλώνει ότι το Ultra είναι «το πρώτο μοντέλο που ξεπερνά τους ανθρώπινους ειδικούς MMLU (μαζική κατανόηση γλώσσας πολλαπλών εργασιών), η οποία χρησιμοποιεί έναν συνδυασμό 57 μαθημάτων όπως τα μαθηματικά, φυσική, ιστορία, νόμος, ιατρική και ηθική για τον έλεγχο τόσο της παγκόσμιας γνώσης όσο και της επίλυσης προβλημάτων ικανότητες».

Πώς το έκανε αυτό; Λαμβάνοντας βαθμολογία 90%, η οποία είναι υψηλότερη από την υπολογιζόμενη βαθμολογία 86,4% που επιτυγχάνεται από Το μοντέλο GPT-4 του OpenAI. Το Gemini ξεπέρασε το GPT-4 σε κάθε κατηγορία, εκτός από το σημείο αναφοράς "HellaSwag", το οποίο περιγράφεται ως "κοινή λογική για καθημερινές εργασίες".

Αν δεν ήταν αρκετά προφανές μέχρι τώρα, το Google Bard ήταν απλώς ένα ενδιάμεσο κενό καθώς η εταιρεία συνέχισε να αναπτύσσει το Gemini σε σημείο να παρέχει δημόσια κυκλοφορία. Αλλά το Bard χρησιμεύει επίσης ως το σημείο πρόσβασης μεταξύ μας και του Gemini, καθώς μπορείτε να ξεκινήσετε να χρησιμοποιείτε το Bard με το Gemini Pro σήμερα.

Για να σας βοηθήσει να διασκεδάσετε και να δείξετε τι μπορεί να κάνει ο Bard with Gemini Pro, η Google συνεργάστηκε με τον YouTuber Mark Rober. Στο βίντεο, ο Rober χρησιμοποιεί τον Bard για να βρει μερικές ιδέες βίντεο, με αποτέλεσμα ο Rober να εργάζεται για να δημιουργήσει το "The World's Most Accurate Paper Airplane".

Από εκεί, ο Bard χρησιμοποιείται για τη δημιουργία «δομών ιστορίας», τις οποίες ο Rober συνεχίζει να ακολουθεί. Σε καθεμία από τις ενότητες, ο Bard δεν βασίζεται αποκλειστικά σε προτροπές κειμένου, καθώς ο Rober βγάζει φωτογραφίες από τα διάφορα χάρτινα σχέδια αεροπλάνων και βάζει τον Bard να τα αναλύσει για να προσδιορίσει ποιο είναι το καλύτερο.

Αφού ανακάλυψε το πιο ακριβές σχέδιο αεροπλάνου από χαρτί, ο Bard χρησιμοποιείται στη συνέχεια για να «κριτική» το σχέδιο. Ο Bard φτύνει τα ευρήματά του, ενώ προσφέρει επίσης μερικές προτάσεις, όπως "τα φτερά είναι πολύ μικρά" και "το χαρτί είναι πολύ φως." Από εκεί, ο Rober παίρνει τη συμβουλή του Bard, παρουσιάζοντας τις διάφορες μεθόδους δοκιμών που είχαν ληφθεί πριν από το μεγάλο φινάλε.

Αν και το teaser βίντεο είναι υπέροχο, δεν είναι ακριβώς το τέλειο παράδειγμα αυτού που μπορούμε να δοκιμάσουμε Βάρδος με Gemini Pro σήμερα. Ωστόσο, μας δίνει μια ματιά στη μεγαλύτερη εικόνα του τι θα είναι, ελπίζουμε, δυνατό, μόλις διατεθεί το Bard Advanced with Gemini Ultra.

Ωστόσο, είναι αναζωογονητικό να βλέπεις το Gemini να κάνει το επίσημο ντεμπούτο του πριν γυρίσουμε το ημερολόγιο για το 2024. Αυτή η ανακοίνωση έχει τη δυνατότητα να είναι το μεγαλύτερο πράγμα που έχει συμβεί στην Google τα τελευταία δέκα χρόνια. Τώρα, πρέπει απλώς να ελπίζουμε ότι ο Bard με τους Διδύμους μπορεί να ανταποκριθεί στη διαφημιστική εκστρατεία.

Android κεντρικό

Το Google Gemini είναι εδώ για να δημιουργήσει τις βάσεις για μοντέλα τεχνητής νοημοσύνης το 2024 και μετά

Τι πρέπει να ξέρετε

Κατηγορίες

Τελευταία Blog Post

Διαβάστε τώρα