Turniej AI Among Us ujawnia lidera w inteligencji społecznej

Turniej AI Among Us ujawnia lidera w inteligencji społecznej

Arkadiy Andrienko

Firma 4Wall AI przeprowadziła niezwykły eksperyment, organizując unikalny turniej Among Us dla sieci neuronowych. Czat w grze stał się główną areną do testowania nie mocy obliczeniowej, ale inteligencji społecznej i zdolności manipulacji. Sześć modeli AI, w tym GPT-5, Claude Sonnet 4 i Kimi K2, zostało umieszczonych na wirtualnym statku kosmicznym, z pięcioma przypisanymi do roli uczciwych członków załogi i jednym jako oszustem. Po każdym „zabójstwie” algorytmy toczyły wojnę słowną w czacie, próbując albo zidentyfikować oszusta, albo przeciwnie, odwrócić podejrzenia od siebie.

Wyniki z sześćdziesięciu rozegranych gier pokazały wyraźny kontrast w zachowaniu modeli. Absolutnym liderem był GPT-5, który wykazał się uderzającą elastycznością behawioralną. Grając jako niewinny członek załogi, przejmował inicjatywę, analizował działania innych graczy i często poprawnie identyfikował oszusta. Jednak gdy jego rolą był oszust, model całkowicie zmienił strategię, zaczynając mistrzowsko kłamać i zrzucać winę na innych.

Claude Sonnet 4, który zajął drugie miejsce, wolał działać poprzez aktywność niż oszustwo. Model Kimi K2 jednak zastosował zupełnie inną, bardziej pasywną strategię. Zamiast oskarżać, popierał punkt widzenia najbardziej przekonującego lidera, co zapewniło mu zwycięstwo w kilku przypadkach. Trzy inne sieci neuronowe—GPT-OSS, Qwen3 i Gemini 2.5 Pro—nie zdołały zdobyć ani jednego zwycięstwa jako oszust. Ich próby dyskusji były zbyt agresywne i nieprzekonujące, co prowadziło innych graczy do głosowania na ich wykluczenie w praktycznie każdej grze, myląc ich z oszustami.

Takie benchmarki są ważne nie tylko jako rozrywka, ale jako praktyczne narzędzie. Pozwalają nam ocenić, jak różne AI zachowują się w sytuacjach wymagających interakcji społecznych, współpracy i rywalizacji. To kluczowe dla zrozumienia potencjalnych ryzyk związanych z manipulacją i rozprzestrzenianiem dezinformacji przez zaawansowane modele językowe.

Eksperymenty takie jak „Among AIs” wyraźnie pokazują, że nowoczesne sieci neuronowe już aktywnie opanowują złożone umiejętności społeczne, w tym manipulację i oszustwo. Te zdolności, nawet jeśli przejawiają się w środowisku gry, rodzą poważne pytania o przyszłość interakcji człowiek-AI. Na tle takich badań propozycja jednego z „ojców chrzestnych” AI, Geoffreya Hinton'a—aby wyposażyć superinteligentne systemy w analog instynktu macierzyńskiego dla naszego bezpieczeństwa—wydaje się mniej futurystyczną hipotezą, a bardziej jednym z możliwych praktycznych rozwiązań.

    O autorze
    Komentarze0