Aktualności Sprzęt i technologie AI Pisze Kod z Tylnymi Drzwiami — Nawet Nie Zdając Sobie z Tego Sprawy

AI Pisze Kod z Tylnymi Drzwiami — Nawet Nie Zdając Sobie z Tego Sprawy

Arkadiy Andrienko

1 maj 2025, 18:40

Niedawne badania ujawniły ukryte niebezpieczeństwo w kodzie pisanym przez generatywną sztuczną inteligencję: modele często „halucynują” komponenty oprogramowania, które w rzeczywistości nie istnieją, tworząc potencjalne bramy do cyberataków. Naukowcy z Uniwersytetu Teksasu w San Antonio przeanalizowali 576 000 fragmentów kodu wygenerowanych przez 16 popularnych modeli AI, w tym GPT-4 i Claude. W 19,7% przypadków kod zawierał odniesienia do fałszywych bibliotek — łącznie około 440 000 nieprawidłowych zależności.

Hakerzy mogą to wykorzystać, rejestrując pakiety o nazwach, które AI często wymyśla przez pomyłkę i wypełniając je złośliwym kodem. Jeśli deweloperzy zainstalują te komponenty bez weryfikacji ich autentyczności, złośliwe oprogramowanie dostaje się do systemu. Podczas eksperymentu pakiety testowe o wymyślonych nazwach były pobierane dziesiątki tysięcy razy.

Kluczowe ustalenia:

Modele open-source (takie jak CodeLlama i DeepSeek) popełniały te błędy 22% czasu — cztery razy więcej niż modele komercyjne (5%). Naukowcy uważają, że wynika to z rozmiaru modelu, przy czym komercyjne AI zazwyczaj mają 10 razy więcej parametrów.
javascript jest bardziej podatny niż Python: 21% kodu JS miało fałszywe zależności, w porównaniu do 16% w Pythonie. To prawdopodobnie dlatego, że ekosystem JS ma 10 razy więcej pakietów, co utrudnia AI sugerowanie dokładnych.
Powtarzalność jest poważnym problemem: 43% tych „halucynacji” wystąpiło co najmniej 10 razy. To ułatwia ataki — hakerzy nie muszą zgadywać, wystarczy, że śledzą powszechne błędy typograficzne generowane przez AI.

Ta technika, znana jako Dependency Confusion, działa poprzez zastąpienie legalnego pakietu złośliwym, który ma tę samą nazwę. Na przykład haker publikuje pakiet z trojanem w repozytorium. Jeśli AI zasugeruje go zamiast oficjalnej wersji, a deweloper zainstaluje go bez podwójnego sprawdzenia źródła, system zostaje skompromitowany.

Przy prognozach Microsoftu, że AI napisze 95% całego kodu do 2030 roku, te ustalenia są sygnałem alarmowym. Dopóki sieci neuronowe nie będą w stanie niezawodnie odróżniać fikcji od faktu, ciężar bezpieczeństwa pozostaje zdecydowanie na ludzkich barkach.

PC Aktualności Sprzęt i technologie

O autorze

Arkadiy Andrienko

Autor artykułów i wiadomości

Jako dziennikarz techniczny w VGTimes, z równą przyjemnością dyskutuję o najnowszych procesorach graficznych i zagłębiam się w niuanse klasycznych RPG. Od 2018 roku piszę o grach i sprzęcie, moje doświadczenie w dziedzinie dźwięku pozwoliło mi dobrze rozumieć niuanse technologii audio, a ja zawsze poszukuję czegoś nowego w dziedzinie sprzętu gamingowego. Kiedy nie piszę o technologiach, prawdopodobnie eksploruję postapokaliptyczne pustkowia w Fallout, zarządzam kolonią w RimWorld lub dowodzę armiami w Hearts of Iron IV. Dla mnie gry to więcej niż tylko hobby — to pasja, która napędza mój twórczy potencjał i utrzymuje połączenie z nieustannie rozwijającym się światem technologii.

Komentarze0

Zostawić komentarz