Nowy agent AI od OpenAI będzie w stanie rezerwować bilety, zamawiać jedzenie i wykonywać inne zadania na stronach internetowych zamiast użytkowników.

OpenAI zaprezentowało nowego agenta AI Operator, który może wykonywać zadania w Internecie dla użytkowników.
Co wiadomo
Agent używa własnej przeglądarki do przeglądania stron internetowych, klikania przycisków, wprowadzania tekstu i przewijania treści. Dzięki temu może wykonywać zadania w Internecie, podobnie jak osoba, która klika przyciski, przewija strony i wprowadza tekst na stronach internetowych. Początkowo nowy produkt będzie dostępny tylko dla subskrybentów ChatGPT Pro w Stanach Zjednoczonych.
Operator działa na specjalnym modelu, który łączy możliwości GPT-4o z dogłębnym szkoleniem. Pozwala mu to nie tylko "widzieć" strony za pomocą zrzutów ekranu, ale także wchodzić w interakcje z interfejsami tak, jak jesteśmy przyzwyczajeni do robienia tego za pomocą myszy i klawiatury.
Najciekawszą rzeczą jest to, że agent nie tylko wykonuje zadania, ale może również sam siebie korygować. Jeśli coś pójdzie nie tak, da ci kontrolę nad procesem. Poprosi również o pozwolenie, jeśli witryna wymaga poufnych informacji (takich jak hasła) lub poprosi o zgodę przed wysłaniem wiadomości e-mail.
OpenAI nawiązało współpracę z popularnymi firmami, takimi jak Uber, DoorDash, Instacart i innymi, aby zapewnić, że agent wykonuje rzeczywiste zadania, przestrzegając standardów bezpieczeństwa i etyki. Jednak nie wszystko działa idealnie - złożone interfejsy, takie jak tworzenie pokazu slajdów, wciąż są dla niego trudne.
W niedalekiej przyszłości Operator będzie dostępny dla użytkowników planów Plus, Team i Enterprise, a OpenAI planuje zintegrować tę technologię bezpośrednio z ChatGPT.
Źródło: OpenAI