OpenAI zaprezentowało Sora, model sztucznej inteligencji do konwersji tekstu na wideo

Autor: Bohdan Kaminskyi | 15.02.2024, 20:59

OpenAI

OpenAI ogłosiło nowy model generowania wideo o nazwie Sora, który może tworzyć realistyczne i fantastyczne filmy o długości do minuty na podstawie opisu tekstowego.

Co wiadomo

Według OpenAI, Sora tworzy złożone, wielofiguralne sceny poprzez precyzyjne umieszczanie obiektów i postaci w kadrze. Model jest również w stanie generować różne rodzaje ruchów.

Deweloperzy zwrócili uwagę na zdolność sztucznej inteligencji do szczegółowego odwzorowywania tła, poszczególnych obiektów i postaci. Ponadto może generować twarze postaci z kolorowymi i różnorodnymi emocjami.

OpenAI twierdzi, że ich model ma pewne "zrozumienie" praw fizycznych świata rzeczywistego. Czasami jednak występują trudności w tworzeniu złożonych scen i związków przyczynowo-skutkowych.

Oprócz syntetyzowania filmów od podstaw, Sora może udoskonalać i rozszerzać istniejące filmy. Jest w stanie uzupełnić brakujące klatki w sekwencji obrazów.

Sora jest obecnie dostępna tylko dla "czerwonych zespołów", które oceniają model pod kątem potencjalnych szkód i zagrożeń. OpenAI otworzyło również dostęp dla niektórych artystów wizualnych, projektantów i filmowców, aby uzyskać opinie.

Źródło: OpenAI