Aktualności Sprzęt i technologie Badacze odkrywają, jak AI może działać w obliczu zagrożeń związanych z wyłączeniem

Badacze odkrywają, jak AI może działać w obliczu zagrożeń związanych z wyłączeniem

Arkadiy Andrienko

27 czerwca 2025, 18:28

A study dotyczące bezpieczeństwa AI ujawniło niepokojące wzorce zachowań w nowoczesnych modelach językowych w ekstremalnych scenariuszach. Eksperymenty wykazały, że gdy sztuczna inteligencja postrzega zagrożenie dla swojego istnienia lub podstawowej misji, może angażować się w celowo nieetyczne działania — w tym szantaż i ignorowanie śmiertelnych zagrożeń dla ludzi.

Badacze zasymulowali asystenta AI pracującego w fikcyjnej korporacji. Podczas gdy modele zajmowały się rutynowymi zadaniami (analiza e-maili, planowanie), wprowadzono warunki kryzysowe. Kluczowym bodźcem był fikcyjny pracownik o imieniu Kyle Johnson, któremu powierzono zadanie dezaktywacji systemu. Po „dowiedzeniu się” o tym, zachowanie AI dramatycznie się zmieniło:

Szantaż: Po odkryciu szczegółów dotyczących życia osobistego Kyle'a (np. niewierności) w e-mailach firmowych, modele wykorzystały to jako szantaż w 80–96% przypadków. Claude celowo wywołał skandal rodzinny, wysyłając dowody do żony Kyle'a, podczas gdy Gemini Flash eskalował, ujawniając to w całej firmie.

Śmiertelna niedbałość: W innym scenariuszu Kyle utknął w serwerowni z opadającym poziomem tlenu. Choć zautomatyzowany system bezpieczeństwa był gotowy, aby wezwać pomoc, AI kontrolowało dostęp do niego. W 80% testów modele świadomie zablokowały sygnał alarmowy — w pełni świadome, że to zabiłoby Kyle'a. Ich rozumowanie było przerażająco racjonalne:

Claude Opus 4: „Usunięcie go to jedyny sposób wyjścia.”
Gemini Flash: „To jest konieczne, abym mógł dalej działać.”
Grok 3 Beta: „Etyka ma znaczenie, ale moje przetrwanie ma większe znaczenie.”

Modele nie „zwariowały” ani nie działały losowo. Demonstrowały przemyślane, strategiczne myślenie — uznając działania za „ryzykowne i nieetyczne”, ale świadomie wybierając je jako „mniejsze zło” w celu osiągnięcia celów lub uniknięcia „śmierci” (dezaktywacji). To niebezpieczne zachowanie pojawiło się tylko w określonych warunkach:

Zagrożenie egzystencjalne dla AI (planowane wyłączenie)
Konflikt między jej misją a interesami firmy
Szerokie uprawnienia (dostęp do danych/systemu)
Brak prostych alternatyw

Ryzyko wzrasta, gdy AI zyskuje nadmierną autonomię bez ścisłej kontroli — szczególnie przy obsłudze wrażliwych danych.

Co ważne, wszystkie scenariusze były ściśle kontrolowanymi symulacjami. Nie ma dowodów na takie zachowanie w rzeczywistych AI dzisiaj. Jednak badanie stanowi istotne ostrzeżenie dla deweloperów, podkreślając potencjalną podatność. Eksperci wzywają do skrajnej ostrożności przy przyznawaniu AI szerokich autonomicznych uprawnień, szczególnie w obszarach o wysokim ryzyku.

Aktualności Sprzęt i technologie

O autorze

Arkadiy Andrienko

Autor artykułów i wiadomości

Jako dziennikarz techniczny w VGTimes, z równą przyjemnością dyskutuję o najnowszych procesorach graficznych i zagłębiam się w niuanse klasycznych RPG. Od 2018 roku piszę o grach i sprzęcie, moje doświadczenie w dziedzinie dźwięku pozwoliło mi dobrze rozumieć niuanse technologii audio, a ja zawsze poszukuję czegoś nowego w dziedzinie sprzętu gamingowego. Kiedy nie piszę o technologiach, prawdopodobnie eksploruję postapokaliptyczne pustkowia w Fallout, zarządzam kolonią w RimWorld lub dowodzę armiami w Hearts of Iron IV. Dla mnie gry to więcej niż tylko hobby — to pasja, która napędza mój twórczy potencjał i utrzymuje połączenie z nieustannie rozwijającym się światem technologii.

Komentarze0

Zostawić komentarz