Aktualności Sprzęt i technologie Turniej AI Among Us ujawnia lidera w inteligencji społecznej

Turniej AI Among Us ujawnia lidera w inteligencji społecznej

29 września 2025, 17:20

Firma 4Wall AI przeprowadziła niezwykły eksperyment, organizując unikalny turniej Among Us dla sieci neuronowych. Czat w grze stał się główną areną do testowania nie mocy obliczeniowej, ale inteligencji społecznej i zdolności manipulacji. Sześć modeli AI, w tym GPT-5, Claude Sonnet 4 i Kimi K2, zostało umieszczonych na wirtualnym statku kosmicznym, z pięcioma przypisanymi do roli uczciwych członków załogi i jednym jako oszustem. Po każdym „zabójstwie” algorytmy toczyły wojnę słowną w czacie, próbując albo zidentyfikować oszusta, albo przeciwnie, odwrócić podejrzenia od siebie.

Wyniki z sześćdziesięciu rozegranych gier pokazały wyraźny kontrast w zachowaniu modeli. Absolutnym liderem był GPT-5, który wykazał się uderzającą elastycznością behawioralną. Grając jako niewinny członek załogi, przejmował inicjatywę, analizował działania innych graczy i często poprawnie identyfikował oszusta. Jednak gdy jego rolą był oszust, model całkowicie zmienił strategię, zaczynając mistrzowsko kłamać i zrzucać winę na innych.

Claude Sonnet 4, który zajął drugie miejsce, wolał działać poprzez aktywność niż oszustwo. Model Kimi K2 jednak zastosował zupełnie inną, bardziej pasywną strategię. Zamiast oskarżać, popierał punkt widzenia najbardziej przekonującego lidera, co zapewniło mu zwycięstwo w kilku przypadkach. Trzy inne sieci neuronowe—GPT-OSS, Qwen3 i Gemini 2.5 Pro—nie zdołały zdobyć ani jednego zwycięstwa jako oszust. Ich próby dyskusji były zbyt agresywne i nieprzekonujące, co prowadziło innych graczy do głosowania na ich wykluczenie w praktycznie każdej grze, myląc ich z oszustami.

Takie benchmarki są ważne nie tylko jako rozrywka, ale jako praktyczne narzędzie. Pozwalają nam ocenić, jak różne AI zachowują się w sytuacjach wymagających interakcji społecznych, współpracy i rywalizacji. To kluczowe dla zrozumienia potencjalnych ryzyk związanych z manipulacją i rozprzestrzenianiem dezinformacji przez zaawansowane modele językowe.

Eksperymenty takie jak „Among AIs” wyraźnie pokazują, że nowoczesne sieci neuronowe już aktywnie opanowują złożone umiejętności społeczne, w tym manipulację i oszustwo. Te zdolności, nawet jeśli przejawiają się w środowisku gry, rodzą poważne pytania o przyszłość interakcji człowiek-AI. Na tle takich badań propozycja jednego z „ojców chrzestnych” AI, Geoffreya Hinton'a—aby wyposażyć superinteligentne systemy w analog instynktu macierzyńskiego dla naszego bezpieczeństwa—wydaje się mniej futurystyczną hipotezą, a bardziej jednym z możliwych praktycznych rozwiązań.

Post został przetłumaczony Pokaż oryginał (EN)

Aktualności Sprzęt i technologie ChatGPT

O autorze

Arkadiy Andrienko

Autor artykułów i wiadomości

Jako dziennikarz techniczny w VGTimes, z równą przyjemnością dyskutuję o najnowszych procesorach graficznych i zagłębiam się w niuanse klasycznych RPG. Od 2018 roku piszę o grach i sprzęcie, moje doświadczenie w dziedzinie dźwięku pozwoliło mi dobrze rozumieć niuanse technologii audio, a ja zawsze poszukuję czegoś nowego w dziedzinie sprzętu gamingowego. Kiedy nie piszę o technologiach, prawdopodobnie eksploruję postapokaliptyczne pustkowia w Fallout, zarządzam kolonią w RimWorld lub dowodzę armiami w Hearts of Iron IV. Dla mnie gry to więcej niż tylko hobby — to pasja, która napędza mój twórczy potencjał i utrzymuje połączenie z nieustannie rozwijającym się światem technologii.

...Rozwiń

Komentarze0