Sprzęt i technologie Aktualności Wideo OpenAI ujawnia Operatora — nowego agenta AI dla ChatGPT, zdolnego do wykonywania działań w Internecie w imieniu użytkowników

OpenAI ujawnia Operatora — nowego agenta AI dla ChatGPT, zdolnego do wykonywania działań w Internecie w imieniu użytkowników

Hennadiy Chemеris
Czytaj w pełnej wersji

The amerykańska organizacja badawcza OpenAI wprowadziła nową funkcję dla ChatGPT o nazwie Operator. Ten agent AI może autonomicznie wykonywać działania w internecie w imieniu użytkowników.

Operator jest zasilany nowym modelem zwanym Agentem Używającym Komputera (CUA). Łącząc możliwości wizji GPT-4o z zaawansowanym rozumowaniem poprzez uczenie przez wzmocnienie, CUA jest szkolony do interakcji z graficznymi interfejsami użytkownika (GUI)—przyciskami, menu i polami tekstowymi, które ludzie widzą na ekranie.

Operator może „widzieć” (poprzez zrzuty ekranu) i „interagować” (używając wszystkich działań, które pozwala mysz i klawiatura) z przeglądarką, co umożliwia mu podejmowanie działań w sieci bez potrzeby dostosowywania integracji API.
— według opisu

Oto niektóre funkcje wspierane przez Operatora:

  • Zamawianie składników do potrawy na podstawie zdjęć i przepisu;
  • Planowanie podróży na podstawie budżetu i zainteresowań użytkownika, a także informacji z forów Reddit;
  • Eksplorowanie możliwości inwestycyjnych w kryptowaluty na podstawie tokenów, które mogą stać się popularne w przyszłości;
  • Rezerwowanie lotów i zakwaterowania na Booking;
  • Umawianie wizyt u fryzjera na podstawie harmonogramu w Google Calendar;
  • Znajdowanie prezentów dla matki, żony lub innej bliskiej osoby;
  • Zamawianie sprzątania domu poprzez integrację z usługą Thumbtack;
  • Wyszukiwanie przystępnego ubezpieczenia zdrowotnego;
  • Znajdowanie różnych usług, takich jak lokalizacja spacerowicza dla psa w różnych krajach.

Warto zauważyć, że funkcja może odmówić wykonania niektórych działań, które mogą spowodować szkodę lub stanowić potencjalne zagrożenie. Operator obsługuje prawie wszystkie strony internetowe protokołu HTTPS, a także niektóre usługi i aplikacje.

Korzystając z funkcji Operator, w chmurze uruchamiana jest zaszyfrowana przeglądarka. W razie potrzeby użytkownik może przejąć kontrolę i dostosować zadanie. W niektórych sytuacjach, takich jak zakupy na stronach internetowych, użytkownik musi potwierdzić żądanie.

W USA właściciele premium planu ChatGPT Pro (w cenie 200 USD miesięcznie) już otrzymali wczesny dostęp do Operatora. W najbliższej przyszłości OpenAI planuje rozszerzyć wsparcie dla planów Plus, Team i Enterprise. Funkcja jest obecnie niedostępna w UE.

Wcześniej informowaliśmy o nowej funkcji AI dla forum Reddit .

    O autorze
    Komentarze0
    Zostawić komentarz