Nowy agent AI od OpenAI będzie w stanie rezerwować bilety, zamawiać jedzenie i wykonywać inne zadania na stronach internetowych zamiast użytkowników.

Autor: Nastya Bobkova | 24.01.2025, 06:30
Nowy agent AI od OpenAI będzie w stanie rezerwować bilety, zamawiać jedzenie i wykonywać inne zadania na stronach internetowych zamiast użytkowników.

OpenAI zaprezentowało nowego agenta AI Operator, który może wykonywać zadania w Internecie dla użytkowników.

Co wiadomo

Agent używa własnej przeglądarki do przeglądania stron internetowych, klikania przycisków, wprowadzania tekstu i przewijania treści. Dzięki temu może wykonywać zadania w Internecie, podobnie jak osoba, która klika przyciski, przewija strony i wprowadza tekst na stronach internetowych. Początkowo nowy produkt będzie dostępny tylko dla subskrybentów ChatGPT Pro w Stanach Zjednoczonych.

Operator działa na specjalnym modelu, który łączy możliwości GPT-4o z dogłębnym szkoleniem. Pozwala mu to nie tylko "widzieć" strony za pomocą zrzutów ekranu, ale także wchodzić w interakcje z interfejsami tak, jak jesteśmy przyzwyczajeni do robienia tego za pomocą myszy i klawiatury.

Najciekawszą rzeczą jest to, że agent nie tylko wykonuje zadania, ale może również sam siebie korygować. Jeśli coś pójdzie nie tak, da ci kontrolę nad procesem. Poprosi również o pozwolenie, jeśli witryna wymaga poufnych informacji (takich jak hasła) lub poprosi o zgodę przed wysłaniem wiadomości e-mail.

OpenAI nawiązało współpracę z popularnymi firmami, takimi jak Uber, DoorDash, Instacart i innymi, aby zapewnić, że agent wykonuje rzeczywiste zadania, przestrzegając standardów bezpieczeństwa i etyki. Jednak nie wszystko działa idealnie - złożone interfejsy, takie jak tworzenie pokazu slajdów, wciąż są dla niego trudne.

W niedalekiej przyszłości Operator będzie dostępny dla użytkowników planów Plus, Team i Enterprise, a OpenAI planuje zintegrować tę technologię bezpośrednio z ChatGPT.

Źródło: OpenAI