The amerykańska organizacja badawcza OpenAI wprowadziła nową funkcję dla ChatGPT o nazwie Operator. Ten agent AI może autonomicznie wykonywać działania w internecie w imieniu użytkowników.
Operator jest zasilany nowym modelem zwanym Agentem Używającym Komputera (CUA). Łącząc możliwości wizji GPT-4o z zaawansowanym rozumowaniem poprzez uczenie przez wzmocnienie, CUA jest szkolony do interakcji z graficznymi interfejsami użytkownika (GUI)—przyciskami, menu i polami tekstowymi, które ludzie widzą na ekranie.
Operator może „widzieć” (poprzez zrzuty ekranu) i „interagować” (używając wszystkich działań, które pozwala mysz i klawiatura) z przeglądarką, co umożliwia mu podejmowanie działań w sieci bez potrzeby dostosowywania integracji API.
Oto niektóre funkcje wspierane przez Operatora:
Warto zauważyć, że funkcja może odmówić wykonania niektórych działań, które mogą spowodować szkodę lub stanowić potencjalne zagrożenie. Operator obsługuje prawie wszystkie strony internetowe protokołu HTTPS, a także niektóre usługi i aplikacje.
Korzystając z funkcji Operator, w chmurze uruchamiana jest zaszyfrowana przeglądarka. W razie potrzeby użytkownik może przejąć kontrolę i dostosować zadanie. W niektórych sytuacjach, takich jak zakupy na stronach internetowych, użytkownik musi potwierdzić żądanie.
W USA właściciele premium planu ChatGPT Pro (w cenie 200 USD miesięcznie) już otrzymali wczesny dostęp do Operatora. W najbliższej przyszłości OpenAI planuje rozszerzyć wsparcie dla planów Plus, Team i Enterprise. Funkcja jest obecnie niedostępna w UE.
Wcześniej informowaliśmy o nowej funkcji AI dla forum Reddit .