Android Central

Denna bedårande corgi är inte på riktigt, och Googles nya text-till-bild AI kan göra ännu mer

protection click fraud

Vad du behöver veta

  • Google Imagen är en ny AI-driven bildgenerator som kan skapa hela bilder från ord.
  • Google visade upp tekniken med en release av ett forskningsdokument som förklarar hur det fungerar, inklusive flera exempel på dess produktion.
  • Det finns ingen allmänt tillgänglig demo just nu och Google släpper inte källkoden ännu, med hänvisning till oro för samhällspåverkan.

Generering av AI-bilder är inget nytt, men Googles senaste forskningsartikel visar ett framsteg av ett slag som vi inte har sett sedan de första AI-drivna bildgeneratorerna kom till. I ett nötskal tar Imagen text och förvandlar den till en bild som ser realistiskt ut, helt och hållet driven av en AI som förstår en stor ordbok med ord och vad dessa ord betyder i visuell mening.

Google släppte sin Imagen forskningsuppsats tillsammans med förklaringen av verktyget. Google säger att dess egenutvecklade benchmark, DrawBench, betygsätter andra bildgenereringsmodeller baserat på mänskliga bedömare och visar att Google AI-driven Imagen ger överlägsna resultat jämfört med de andra modellerna. Webbplatsen Imagen visar upp ett antal olika exempel, varav några vi körsbärsplockade nedan.

Bild 1 av 4

Google Imagen datorgenererade bilder
(Bildkredit: Google)

"Ett robotpar med god mat med Eiffeltornet i bakgrunden."

Google Imagen datorgenererade bilder
(Bildkredit: Google)

"En genomskinlig skulptur av en anka gjord av glas. Skulpturen står framför en målning av ett landskap."

Google Imagen datorgenererade bilder
(Bildkredit: Google)

"En majestätisk oljemålning av en tvättbjörnsdrottning iförd röd fransk kunglig klänning. Tavlan hänger på en utsmyckad vägg dekorerad med tapeter."

Google Imagen datorgenererade bilder
(Bildkredit: Google)

"En förkromad anka med en gyllene näbb som bråkar med en arg sköldpadda i en skog."

Under bilderna ovan ser du texten som användes för att skapa den bilden med Google Imagen. I många fall är texten extremt beskrivande och används för att skapa ett mycket specifikt slutresultat som ser förvånansvärt realistiskt ut. Många andra AI-drivna bildgeneratorer som du hittar online skapar ofta mycket abstrakta bilder, som du kanske har sett på din favoritappar för sociala medier.

Men även om Google har massor av exempel och ett helt forskningsdokument för att visa hur bra Imagen fungerar, gör det inte tekniken offentligt tillgänglig än. I sin förklaring sa Googles samhälleliga angelägenheter som den främsta anledningen till att inte låta användarna ge det en chans ännu. Google säger att de tror att skadliga, realistiska bilder kan genereras på grund av datauppsättningen som används innehåller många okurerade ord, varav många kan anses vara rasistiska, nedsättande eller på annat sätt skadlig.

Det är troligt att Google så småningom kommer att släppa en demo med öppen källkod, eftersom företaget citerar att öppen källkod kan hjälpa till att förhindra sådana problem. Specifikt säger Google att det inte kommer att släppa en demo eller källa förrän "ytterligare säkerhetsåtgärder [är] på plats." För nu måste du bara njuta av de konstigt surrealistiska bilder som Google tillhandahållit på sin webbplats.


Google Pixel 6

Google Pixel 6

Skaffa Google AI på din telefon med Pixel 6, en telefon som drivs av Googles Tensor-processor och som har en hel del fantastiska AI-drivna trick på sin ökända ärm.

Nicholas Sutrich
Nicholas Sutrich

Senior innehållsproducent — Smartphones och VR

Nick började med DOS och NES och använder de fina minnen av disketter och kassetter för att underblåsa sina åsikter om modern teknik. Oavsett om det är VR, smarta hemprylar eller något annat som piper och pip, han har skrivit om det sedan 2011. Nå honom på Twitter eller Instagram @Gwanatu

instagram story viewer