"Zmiana paradygmatu" w robotyce: robot Alter3 połączony z GPT-4: teraz może robić selfie i grać na wyimaginowanej gitarze i jest programowany głosowo zamiast skomplikowanych poleceń.

Autor: Anry Sergeev | 19.12.2023, 19:59
"Zmiana paradygmatu" w robotyce: robot Alter3 połączony z GPT-4: teraz może robić selfie i grać na wyimaginowanej gitarze i jest programowany głosowo zamiast skomplikowanych poleceń.

Zespół naukowców z Uniwersytetu Tokijskiego był w stanie zbudować połączenie między dużym modelem językowym GPT-4 a robotem Alter3, umożliwiając im wykonywanie bardziej ludzkich gestów i programowanie robota w języku naturalnym, porzucając tradycyjne systemy sterowania zależne od sprzętu. Autorzy projektu nazwali ten postęp "zmianą paradygmatu" w robotyce.

Alter3 to najnowsza wersja humanoidalnego robota, który został po raz pierwszy uruchomiony w 2016 roku. Jest zdolny do wykonywania złożonych ruchów górnej części ciała, w tym szczegółowej mimiki twarzy, i ma 43 osie, które naśladują ruch ludzkiego układu mięśniowo-szkieletowego. Opiera się na podstawie, ale nie może chodzić (choć może symulować chodzenie). Korzystając z GPT-4, naukowcy nauczyli robota wykonywania różnych symulacji, takich jak robienie selfie, rzucanie piłką, jedzenie popcornu i granie na wyimaginowanej gitarze. Wcześniej czynności te wymagały zakodowania konkretnych instrukcji dla każdego działania, ale dzięki GPT-4 roboty mogą nauczyć się zwykłych instrukcji mowy.


-Zagraj nam "Smoke on the Water"

Naukowcy twierdzą, że "bezpośrednia kontrola jest teraz możliwa poprzez przeniesienie wyrażeń językowych ludzkich działań do ciała robota za pomocą kodu oprogramowania. Pozwala to na większe możliwości współpracy człowieka z robotem. Dzięki temu przełomowi w robotyce możemy spodziewać się bardziej inteligentnych, adaptacyjnych i osobistych robotów. Robot Alter3 ma wbudowaną kamerę, która pozwala mu "widzieć" ludzi i poprawiać swoje zachowanie poprzez obserwację ich reakcji.

Dzięki wykorzystaniu modeli językowych w badaniach nad robotyką, naukowcy znacznie upraszczają proces koordynacji wielu stawów robota, dostarczając instrukcje słowne, opisując opcje ruchu i uzyskując kod oprogramowania, który uruchamia silnik robota. Eliminuje to przyziemne zadanie programowania każdego indywidualnego ruchu dla 43 osi i pozwala badaczom na rekonfigurację i udoskonalanie ruchów robota szybciej, płynniej i dokładniej w czasie.


Alter3 prezentuje zombie

Naukowcy dodali również trochę humoru do działań Alter3. W jednym ze scenariuszy robot demonstruje, że je torbę popcornu, ale potem okazuje się, że popcorn należy do osoby siedzącej obok niego. Mimika twarzy i ruchy rąk robota wyrażają zaskoczenie i wstyd.

Źródło: techxplore.com