OpenAI zaprezentowało Sora, model sztucznej inteligencji do konwersji tekstu na wideo

15.02.2024, 21:13

OpenAI

OpenAI ogłosiło nowy model generowania wideo o nazwie Sora, który może tworzyć realistyczne i fantastyczne filmy o długości do minuty na podstawie opisu tekstowego.

Co wiadomo

Według OpenAI, Sora tworzy złożone, wielofiguralne sceny poprzez precyzyjne umieszczanie obiektów i postaci w kadrze. Model jest również w stanie generować różne rodzaje ruchów.

Przedstawiamy Sora, nasz model konwersji tekstu na wideo.

Sora może tworzyć filmy trwające do 60 sekund, zawierające bardzo szczegółowe sceny, złożony ruch kamery i wiele postaci z żywymi emocjami. https://t.co/7j2JN27M3W

Podpowiedź: "Piękny, śnieżny... pic.twitter.com/ruTEWn87vf
- OpenAI (@OpenAI) 15 lutego 2024 r.

Deweloperzy zwrócili uwagę na zdolność sztucznej inteligencji do szczegółowego odwzorowywania tła, poszczególnych obiektów i postaci. Ponadto może generować twarze postaci z kolorowymi i różnorodnymi emocjami.

Prompt: "Zwiastun filmowy przedstawiający przygody 30-letniego kosmicznego mężczyzny w czerwonym wełnianym kasku motocyklowym, błękitne niebo, słona pustynia, styl kinowy, nakręcony na taśmie 35 mm, żywe kolory". pic.twitter.com/0JzpwPUGPB
- OpenAI (@OpenAI) 15 lutego 2024 r.

Propozycja: "Kilka gigantycznych wełnistych mamutów zbliża się, krocząc przez zaśnieżoną łąkę, ich długie wełniste futro lekko powiewa na wietrze, gdy idą, ośnieżone drzewa i dramatyczne ośnieżone góry w oddali, popołudniowe światło z delikatnymi chmurami i słońcem wysoko w oddali... pic.twitter.com/Um5CWI18nS
- OpenAI (@OpenAI) 15 lutego 2024 r.

OpenAI twierdzi, że ich model ma pewne "zrozumienie" praw fizycznych świata rzeczywistego. Czasami jednak występują trudności w tworzeniu złożonych scen i związków przyczynowo-skutkowych.

Oprócz syntetyzowania filmów od podstaw, Sora może udoskonalać i rozszerzać istniejące filmy. Jest w stanie uzupełnić brakujące klatki w sekwencji obrazów.

Sora jest obecnie dostępna tylko dla "czerwonych zespołów", które oceniają model pod kątem potencjalnych szkód i zagrożeń. OpenAI otworzyło również dostęp dla niektórych artystów wizualnych, projektantów i filmowców, aby uzyskać opinie.

Źródło: OpenAI