OpenAI zaprezentowało Sora, model sztucznej inteligencji do konwersji tekstu na wideo
OpenAI
OpenAI ogłosiło nowy model generowania wideo o nazwie Sora, który może tworzyć realistyczne i fantastyczne filmy o długości do minuty na podstawie opisu tekstowego.
Co wiadomo
Według OpenAI, Sora tworzy złożone, wielofiguralne sceny poprzez precyzyjne umieszczanie obiektów i postaci w kadrze. Model jest również w stanie generować różne rodzaje ruchów.
Przedstawiamy Sora, nasz model konwersji tekstu na wideo.
- OpenAI (@OpenAI) 15 lutego 2024 r.
Sora może tworzyć filmy trwające do 60 sekund, zawierające bardzo szczegółowe sceny, złożony ruch kamery i wiele postaci z żywymi emocjami. https://t.co/7j2JN27M3W
Podpowiedź: "Piękny, śnieżny... pic.twitter.com/ruTEWn87vf
Deweloperzy zwrócili uwagę na zdolność sztucznej inteligencji do szczegółowego odwzorowywania tła, poszczególnych obiektów i postaci. Ponadto może generować twarze postaci z kolorowymi i różnorodnymi emocjami.
Prompt: "Zwiastun filmowy przedstawiający przygody 30-letniego kosmicznego mężczyzny w czerwonym wełnianym kasku motocyklowym, błękitne niebo, słona pustynia, styl kinowy, nakręcony na taśmie 35 mm, żywe kolory". pic.twitter.com/0JzpwPUGPB
- OpenAI (@OpenAI) 15 lutego 2024 r.
Propozycja: "Kilka gigantycznych wełnistych mamutów zbliża się, krocząc przez zaśnieżoną łąkę, ich długie wełniste futro lekko powiewa na wietrze, gdy idą, ośnieżone drzewa i dramatyczne ośnieżone góry w oddali, popołudniowe światło z delikatnymi chmurami i słońcem wysoko w oddali... pic.twitter.com/Um5CWI18nS
- OpenAI (@OpenAI) 15 lutego 2024 r.
OpenAI twierdzi, że ich model ma pewne "zrozumienie" praw fizycznych świata rzeczywistego. Czasami jednak występują trudności w tworzeniu złożonych scen i związków przyczynowo-skutkowych.
Oprócz syntetyzowania filmów od podstaw, Sora może udoskonalać i rozszerzać istniejące filmy. Jest w stanie uzupełnić brakujące klatki w sekwencji obrazów.
Sora jest obecnie dostępna tylko dla "czerwonych zespołów", które oceniają model pod kątem potencjalnych szkód i zagrożeń. OpenAI otworzyło również dostęp dla niektórych artystów wizualnych, projektantów i filmowców, aby uzyskać opinie.
Źródło: OpenAI