Android κεντρικό

Αυτό το αξιολάτρευτο corgi δεν είναι αληθινό και η νέα τεχνητή νοημοσύνη κειμένου σε εικόνα της Google μπορεί να κάνει ακόμη περισσότερα

protection click fraud

Τι πρέπει να ξέρετε

  • Το Google Imagen είναι μια νέα συσκευή δημιουργίας εικόνων που βασίζεται σε AI που μπορεί να δημιουργήσει ολόκληρες εικόνες από λέξεις.
  • Η Google παρουσίασε την τεχνολογία με μια έκδοση μιας ερευνητικής εργασίας που εξηγεί πώς λειτουργεί, συμπεριλαμβανομένων πολλών παραδειγμάτων της παραγωγής της.
  • Δεν υπάρχει δημόσια διαθέσιμη επίδειξη αυτή τη στιγμή και η Google δεν δημοσιεύει ακόμη τον πηγαίο κώδικα, επικαλούμενη ανησυχίες σχετικά με τον κοινωνικό αντίκτυπο.

Η δημιουργία εικόνων με τεχνητή νοημοσύνη δεν είναι κάτι καινούργιο, αλλά το πιο πρόσφατο ερευνητικό έγγραφο της Google παρουσιάζει μια πρόοδο που δεν έχουμε δει από τότε που εμφανίστηκαν οι πρώτες γεννήτριες εικόνων που βασίζονται σε τεχνητή νοημοσύνη. Με λίγα λόγια, το Imagen παίρνει κείμενο και το μετατρέπει σε μια ρεαλιστική εικόνα, καθοδηγούμενη πλήρως από μια τεχνητή νοημοσύνη που κατανοεί ένα μεγάλο λεξικό λέξεων και τι σημαίνουν αυτές οι λέξεις με οπτική έννοια.

Η Google κυκλοφόρησε το Imagen ερευνητικό έγγραφο μαζί με την επεξήγηση του εργαλείου. Η Google λέει ότι το δικό της ανεπτυγμένο σημείο αναφοράς, DrawBench, βαθμολογεί άλλα μοντέλα παραγωγής εικόνων με βάση τους ανθρώπους αξιολόγησης και δείχνει ότι η

Google AI-Το Powered Imagen παράγει ανώτερα αποτελέσματα από αυτά τα άλλα μοντέλα. Ο ιστότοπος Imagen παρουσιάζει μια σειρά από διαφορετικά παραδείγματα, μερικά από τα οποία επιλέξαμε παρακάτω.

Εικόνα 1 από 4

Εικόνες που δημιουργούνται από υπολογιστή Google Imagen
(Πίστωση εικόνας: Google)

"Ένα ζευγάρι ρομπότ γευματίζει με τον Πύργο του Άιφελ στο βάθος."

Εικόνες που δημιουργούνται από υπολογιστή Google Imagen
(Πίστωση εικόνας: Google)

«Ένα διάφανο γλυπτό πάπιας φτιαγμένο από γυαλί. Το γλυπτό βρίσκεται μπροστά σε έναν πίνακα ζωγραφικής ενός τοπίου».

Εικόνες που δημιουργούνται από υπολογιστή Google Imagen
(Πίστωση εικόνας: Google)

«Μια μεγαλειώδης ελαιογραφία μιας βασίλισσας ρακούν φορώντας κόκκινο γαλλικό βασιλικό φόρεμα. Ο πίνακας κρέμεται σε έναν περίτεχνο τοίχο διακοσμημένο με ταπετσαρία».

Εικόνες που δημιουργούνται από υπολογιστή Google Imagen
(Πίστωση εικόνας: Google)

«Μια επιχρωμιωμένη πάπια με χρυσό ράμφος που μαλώνει με μια θυμωμένη χελώνα σε ένα δάσος».

Κάτω από τις παραπάνω εικόνες, θα δείτε το κείμενο που χρησιμοποιήθηκε για τη δημιουργία αυτής της εικόνας με το Google Imagen. Σε πολλές περιπτώσεις, το κείμενο είναι εξαιρετικά περιγραφικό και χρησιμοποιείται για να δημιουργήσει ένα πολύ συγκεκριμένο τελικό αποτέλεσμα που φαίνεται εκπληκτικά ρεαλιστικό. Πολλές άλλες γεννήτριες εικόνων που βασίζονται στην τεχνητή νοημοσύνη που θα βρείτε στο διαδίκτυο δημιουργούν συχνά εικόνες με πολύ αφηρημένη εμφάνιση, όπως μπορεί να έχετε δει στο αγαπημένες εφαρμογές κοινωνικών μέσων.

Ωστόσο, ενώ η Google έχει πολλά παραδείγματα και μια ολόκληρη ερευνητική εργασία για να δείξει πόσο καλά λειτουργεί το Imagen, δεν κάνει ακόμη δημόσια την τεχνολογία διαθέσιμη. Στην εξήγησή της, η Google προσδιορίζει τις κοινωνικές ανησυχίες ως τον κύριο λόγο για να μην αφήνει τους χρήστες να το δώσουν ακόμα μια ευκαιρία. Η Google λέει ότι πιστεύει ότι θα μπορούσαν να δημιουργηθούν επιβλαβείς, ρεαλιστικές εικόνες λόγω του χρησιμοποιούμενου συνόλου δεδομένων περιλαμβάνει πολλές μη επιμελημένες λέξεις, πολλές από τις οποίες θα μπορούσαν να θεωρηθούν ρατσιστικές, υποτιμητικές ή με άλλο τρόπο επιβλαβής.

Είναι πιθανό η Google να κυκλοφορήσει τελικά μια επίδειξη ανοιχτού κώδικα, καθώς η εταιρεία αναφέρει ότι η χρήση ανοιχτού κώδικα θα μπορούσε να βοηθήσει στην αποφυγή τέτοιων προβλημάτων. Συγκεκριμένα, η Google λέει ότι δεν θα κυκλοφορήσει ένα demo ή μια πηγή έως ότου «[βρεθούν] περαιτέρω διασφαλίσεις». Προς το παρόν, θα πρέπει απλώς να απολαύσετε τις παράξενα σουρεαλιστικές εικόνες που παρέχει η Google στον ιστότοπό της.


Google Pixel 6

Google Pixel 6

Αποκτήστε το Google AI στο τηλέφωνό σας με το Pixel 6, ένα τηλέφωνο που τροφοδοτείται από τον επεξεργαστή Tensor της Google και έχει αρκετά εκπληκτικά κόλπα που βασίζονται στην τεχνητή νοημοσύνη στο παροιμιώδες μανίκι του.

Νίκολας Σάτριχ
Νίκολας Σάτριχ

Ανώτερος παραγωγός περιεχομένου — Smartphones & VR

Ο Nick ξεκίνησε με το DOS και το NES και χρησιμοποιεί αυτές τις αγαπημένες αναμνήσεις από δισκέτες και φυσίγγια για να τροφοδοτήσει τις απόψεις του σχετικά με τη σύγχρονη τεχνολογία. Είτε πρόκειται για εικονική πραγματικότητα, είτε για έξυπνα οικιακά gadgets, είτε για κάτι άλλο που ηχεί και ακούγεται, γράφει για αυτό από το 2011. Προσεγγίστε τον στο Twitter ή στο Instagram @Gwanatu

instagram story viewer