ByteDance uruchamia generator wideo OmniHuman-1 AI, który tworzy ultra-realistyczne filmy z dowolnego zdjęcia

Chińska firma ByteDance, spółka macierzysta TikTok, ogłosiła nowy framework sztucznej inteligencji o nazwie OmniHuman-1. Narzędzie to może przekształcić pojedynczy obraz i nagranie audio w realistyczne wideo z dokładnymi ruchami twarzy i ciała.
Co wiadomo
OmniHuman-1 wykorzystuje technologię mieszania danych, która pozwala mu tworzyć bardziej realistyczne filmy w porównaniu do innych modeli. Naukowcy z ByteDance powiedzieli, że rozwój OmniHuman-1 obejmował szkolenie na 19 000 godzin materiału filmowego, co znacznie poprawiło jakość generowanych filmów.
Narzędzie obsługuje obrazy o dowolnych proporcjach, zarówno portrety, jak i obrazy pełnometrażowe. OmniHuman-1 może generować realistyczne ruchy rąk, mimikę twarzy i gesty ciała, dzięki czemu idealnie nadaje się do generowania obrazów w wirtualnej rzeczywistości, filmów edukacyjnych i innych celów. Przykład takiego generowania ze zdjęciem Alberta Einsteina można zobaczyć poniżej.
OmniHuman-1 wciąż znajduje się w fazie badań, ale jego potencjał już teraz generuje duże zainteresowanie. Kiedy stanie się ogólnodostępny, będzie konkurował z innymi narzędziami, takimi jak Sora i Veo, odpowiednio od OpenAI i Google.
Źródło: omnihuman