Centrala Androida

Nowe wersje demonstracyjne AI Test Kitchen firmy Google pozwolą ci budować miasta i tworzyć potwory

protection click fraud

Co musisz wiedzieć

  • Google wprowadza nowe ulepszenia AI do swojej AI Test Kitchen w celu uzyskania opinii i testów od użytkowników.
  • Badacze pracowali nad sposobem tworzenia przez użytkowników długich filmów na podstawie tekstu wraz z technologią zamiany tekstu na obraz.
  • Korzystając z modelu AI AudioLM, użytkownicy mogą dostarczyć fragment audio do tego programu, który może następnie wygenerować własną wersję.

Poprzez swoje badania Google chce wprowadzić modele generatywne oparte na sztucznej inteligencji do życia twórców i artystów.

Według słowa kluczowego Google post, jednym ze sposobów, w jaki prowadzi badania nad sztuczną inteligencją, jest umożliwienie ludziom większej ekspresji poprzez używanie słów do tworzenia filmów i obrazów.

Zaczyna się to od niedawnego przełomu w zastosowaniu modelu rozpowszechniania do sekwencji wideo, co umożliwia jej tworzenie wideo w oparciu o sekwencję podpowiedzi tekstowych. Google udostępnił film, który został stworzony w całości za pomocą technologii sztucznej inteligencji z sekwencji zdań opisujących, jak powinien wyglądać film i co powinno być widoczne:

Film stworzony przez sztuczną inteligencję na podstawie sekwencji tekstu.
(Źródło zdjęcia: Google)

Google twierdzi, że wkrótce wprowadzi technologię generowania tekstu na obraz Imagen Kuchnia testowa AI aby ludzie mogli uczyć się i doświadczać tego nowego oprogramowania. Firma uruchamia nowe wersje demonstracyjne, które pomogą przetestować obsługę zamiany tekstu na obraz. „City Dreamer” to wersja demonstracyjna, która pozwala zbudować miasto wokół tematu, coś w rodzaju „SimCity” napędzanego przez sztuczną inteligencję lub „Cities: Skylines.” Drugie demo, „Wobble”, pozwala stworzyć potwora z tekstu, którego można poruszać i tańczyć, szturchając i prowokując to.

Badacze firmy poczynili również pewne postępy w dziale audio, korzystając z AudioLM. Mówi się, że ten model uczy się generować realistyczną mowę i muzykę fortepianową, po prostu najpierw słuchając próbki. AudioLM będzie wtedy w stanie przewidzieć, jaki dźwięk powinien nastąpić po wysłuchaniu tylko fragmentu klipu audio.

Google przyjrzał się również kreatywnej stronie ludzkiego rzemiosła, wprowadzając również postępy w zakresie sztucznej inteligencji. Poprzez Wordcraft, obsługiwany przez generator tekstu AI LaMDA, program może zaproponować własne podejście do zdania lub tematu opowieści, a nawet napisać pomysł podczas pisania, jeśli kiedykolwiek utkniesz we mgle.

instagram story viewer