Google aktualizuje swoje modele Veo i Imagen AI, aby uzyskać dokładniejsze treści

Autor: Vlad Cherevko | wczoraj, 23:10
Imagen 3 w akcji: rewolucyjna technologia obrazowania Przykłady obrazów utworzonych przez nowy model Imagen 3. Źródło: Google

Google ogłosiło nową wersję swojego generatywnego modelu sztucznej inteligencji dla wideo, Veo 2, który według firmy lepiej rozumie fizykę świata rzeczywistego i ruchy człowieka.

Co wie

Veo 2 pozwala użytkownikom odwoływać się do określonych gatunków filmowych, efektów kinowych i obiektywów podczas tworzenia filmów. Model ten redukuje również artefakty, takie jak dodatkowe palce i poprawia jakość obrazu. Poniżej znajduje się film stworzony w całości przez model Veo 2.

Google ulepszyło również swój model zamiany tekstu na obraz, Imagen 3, który generuje teraz jaśniejsze i lepiej skomponowane obrazy oraz dokładniej podąża za wskazówkami.

Obraz utworzony przez model Imagen 3
Obraz wygenerowany przez model Imagen 3. Ilustracja: Google

Google dodało również nowe narzędzie o nazwie Whisk, które łączy możliwości Imagen 3 i modelu rozumienia wizualnego Gemini w celu tworzenia unikalnych obrazów poprzez łączenie wielu pomysłów lub obiektów w jedną ilustrację.

Modele zawierają niewidoczny znak wodny SynthID, aby zmniejszyć prawdopodobieństwo dezinformacji. Veo 2 będzie stopniowo udostępniane użytkownikom Google Labs w Stanach Zjednoczonych i jest obecnie ograniczone dla testerów do tworzenia filmów o długości do ośmiu sekund w rozdzielczości 720p. Ulepszenia dla Imagen 3 są już dostępne dla użytkowników Google Labs w ponad 100 krajach za pośrednictwem ImageFX.

Źródło: Google