אנדרואיד מרכזי

הקורגי המקסים הזה לא אמיתי, וה-AI החדש של טקסט לתמונה של גוגל יכול לעשות אפילו יותר

protection click fraud

מה שאתה צריך לדעת

  • Google Imagen הוא מחולל תמונות חדש מונע בינה מלאכותית שיכול ליצור תמונות שלמות ממילים.
  • גוגל הציגה את הטכנולוגיה עם פרסום של מאמר מחקר המסביר כיצד היא פועלת, כולל מספר דוגמאות לתפוקה שלה.
  • בשלב זה אין הדגמה זמינה לציבור וגוגל עדיין לא משחררת את קוד המקור, תוך ציון דאגות לגבי ההשפעה החברתית.

יצירת תמונות בינה מלאכותית אינה דבר חדש, אך מאמר המחקר האחרון של גוגל מציג התקדמות מסוג שלא ראינו מאז שיוצרו מחוללי התמונות הראשונים מונעי בינה מלאכותית. בקצרה, אימג'ן לוקחת טקסט והופכת אותו לתמונה בעלת מראה מציאותי, המונעת לחלוטין על ידי AI שמבין מילון גדול של מילים ומה משמעות המילים הללו במובן החזותי.

גוגל פרסמה את זה תמונה עבודת מחקר לצד ההסבר על הכלי. גוגל טוענת כי אמת מידה שפותחה בעצמה, DrawBench, מדרגת דגמי יצירת תמונות אחרים על סמך מדרגים אנושיים ומראה כי בינה מלאכותית של גוגלImagen המופעלת מייצרת תוצאות מעולות על אותם דגמים אחרים. אתר Imagen מציג מספר דוגמאות שונות, כמה מהן בחרנו בהמשך.

תמונה 1 מתוך 4

תמונות שנוצרו על ידי Google Imagen על ידי מחשב
(קרדיט תמונה: גוגל)

"זוג רובוטים סועדים עם מגדל אייפל ברקע."

תמונות שנוצרו על ידי Google Imagen על ידי מחשב
(קרדיט תמונה: גוגל)

"פסל שקוף של ברווז עשוי זכוכית. הפסל נמצא מול ציור של נוף".

תמונות שנוצרו על ידי Google Imagen על ידי מחשב
(קרדיט תמונה: גוגל)

"ציור שמן מלכותי של מלכת דביבון לובשת שמלת מלכות צרפתית אדומה. הציור תלוי על קיר מקושט מעוטר בטפטים".

תמונות שנוצרו על ידי Google Imagen על ידי מחשב
(קרדיט תמונה: גוגל)

"ברווז מצופה כרום עם מקור זהוב מתווכח עם צב כועס ביער."

מתחת לתמונות למעלה, תראה את הטקסט ששימש ליצירת תמונה זו עם Google Imagen. במקרים רבים, הטקסט הוא תיאורי ביותר ומשמש ליצירת תוצאה סופית מאוד ספציפית שנראית מציאותית באופן מפתיע. הרבה מחוללי תמונות מונעי בינה מלאכותית שתמצאו באינטרנט יוצרים לעתים קרובות תמונות בעלות מראה מופשט, כפי שאולי ראיתם על אפליקציות מדיה חברתית מועדפות.

אבל, בעוד שלגוגל יש הרבה דוגמאות ומאמר מחקר שלם כדי להראות כמה טוב Imagen עובד, היא עדיין לא הופכת את הטכנולוגיה לציבור. בהסבר שלה, גוגל מאתר דאגות חברתיות כסיבה העיקרית לכך שלא מאפשרים למשתמשים לנסות את זה עדיין. גוגל אומרת שהיא מאמינה שתמונות מזיקות ומציאותיות עלולות להיווצר בגלל שמשתמשים במערך הנתונים כולל מילים רבות שאינן מאוצרות, שרבות מהן יכולות להיחשב גזעניות, גנאי או אחרות מַזִיק.

סביר להניח שגוגל תשחרר בסופו של דבר הדגמה של קוד פתוח, מכיוון שהחברה מציינת כי קוד פתוח עשוי לסייע במניעת בעיות כאלה. באופן ספציפי, גוגל טוענת שהיא לא תשחרר הדגמה או מקור עד ש"הבטחות נוספות [יופעלו]". לעת עתה, תצטרכו ליהנות מהתמונות הסוריאליסטיות המוזרות שגוגל סיפקה באתר שלה.


גוגל פיקסל 6

גוגל פיקסל 6

השג את Google AI בטלפון שלך עם ה-Pixel 6, טלפון שמופעל על ידי מעבד ה-Tensor של גוגל ויש לו לא מעט טריקים מדהימים מונעי בינה מלאכותית בשרוול שלו.

ניקולס סוטריץ'
ניקולס סוטריץ'

מפיק תוכן בכיר - סמארטפונים ו-VR

ניק התחיל עם DOS ו-NES ומשתמש בזיכרונות הטובים האלה של תקליטונים ומחסניות כדי לתדלק את דעותיו על טכנולוגיה מודרנית. בין אם זה VR, גאדג'טים לבית חכם או משהו אחר שמצפצף ומצפצף, הוא כותב על זה מאז 2011. פנה אליו בטוויטר או באינסטגרם @Gwanatu

instagram story viewer