OpenAI zaprezentowało Sora, model sztucznej inteligencji do konwersji tekstu na wideo
OpenAI
OpenAI ogłosiło nowy model generowania wideo o nazwie Sora, który może tworzyć realistyczne i fantastyczne filmy o długości do minuty na podstawie opisu tekstowego.
Co wiadomo
Według OpenAI, Sora tworzy złożone, wielofiguralne sceny poprzez precyzyjne umieszczanie obiektów i postaci w kadrze. Model jest również w stanie generować różne rodzaje ruchów.
Deweloperzy zwrócili uwagę na zdolność sztucznej inteligencji do szczegółowego odwzorowywania tła, poszczególnych obiektów i postaci. Ponadto może generować twarze postaci z kolorowymi i różnorodnymi emocjami.
OpenAI twierdzi, że ich model ma pewne "zrozumienie" praw fizycznych świata rzeczywistego. Czasami jednak występują trudności w tworzeniu złożonych scen i związków przyczynowo-skutkowych.
Oprócz syntetyzowania filmów od podstaw, Sora może udoskonalać i rozszerzać istniejące filmy. Jest w stanie uzupełnić brakujące klatki w sekwencji obrazów.
Sora jest obecnie dostępna tylko dla "czerwonych zespołów", które oceniają model pod kątem potencjalnych szkód i zagrożeń. OpenAI otworzyło również dostęp dla niektórych artystów wizualnych, projektantów i filmowców, aby uzyskać opinie.
Źródło: OpenAI