Co wiemy o Genie 3 — sieci neuronowej, która może na zawsze zmienić przemysł gier

Co wiemy o Genie 3 — sieci neuronowej, która może na zawsze zmienić przemysł gier

Fazil Dzhyndzholiia
7 sierpnia 2025, 21:47

Niedawno Google DeepMind wprowadziło nową wersję Genie — model generowania wirtualnego świata w czasie rzeczywistym, zdolny do tworzenia w pełni interaktywnych środowisk 3D. Użytkownik może poruszać się po wirtualnym świecie i wchodzić z nim w interakcję za pomocą tekstowych poleceń — przez kilka minut na raz, co jest znacznie dłużej niż w przypadku Genie 2. Kluczową innowacją jest to, że model zapamiętuje obiekty i zmiany w scenie, co znacznie zwiększa realizm symulacji. Nowa wersja sieci neuronowej jest nadal technologią eksperymentalną dostępną tylko dla wybranych testerów. Jednak Genie 3 już daje nam solidne wyobrażenie o tym, jak mogą być rozwijane gry za 10–20 lat — lub nawet wcześniej.

Co potrafi Genie 3

Sieć neuronowa Google’a należy do tzw. klasy „modeli świata” — systemów AI, które mogą wykorzystać zrozumienie świata do jego symulacji. Genie 3 potrafi przewidzieć, jak różne działania powinny wpływać na wirtualne środowisko i wprowadzać te zmiany w czasie rzeczywistym.

W przeciwieństwie do poprzedniej wersji, nowy Genie renderuje symulację w 720p zamiast 360p; okno interakcji trwa kilka minut, a nie 10–20 sekund; a model reaguje na polecenia natychmiastowo — coś, co było niemożliwe jeszcze niedawno.

Genie 3 potrafi realistycznie symulować oświetlenie, odbicia i inne właściwości fizyczne świata — takie jak symulacja wody. Imponujące jest to, że sieć neuronowa może generować całe ekosystemy z realistycznymi zwierzętami i roślinami.

A realizm nie jest jej jedyną mocną stroną: model AI potrafi również generować kreskówkowe środowiska z stylizowanymi fantastycznymi stworzeniami — takimi jak papierowy jaszczur czy bestia przypominająca Pokémona.

Jednak największym krokiem naprzód Genie 3 jest jej pamięć. Model potrafi teraz zapamiętywać zmiany, które użytkownik wprowadza do symulacji. Na przykład użytkownik może zmienić pogodę, dodać nowe obiekty lub postacie, a następnie odejść od sceny i wrócić później — a wszystko pozostanie tak, jak zostawił. Oczywiście, błędy zaczynają się kumulować z upływem czasu, ale jak zauważono, system pozostaje stabilny przez kilka minut — co stanowi znaczną poprawę.

Would you like to play a game where the story and world are created by AI in real time?

Wyniki

Aktualne ograniczenia

Genie 3 może zmieniać wirtualny świat na podstawie tekstowych poleceń. Na przykład, jeśli wpiszesz „dodaj drzewo”, model odpowie i wprowadzi zmianę. Jednak na tym etapie postać w grze kontrolowana przez użytkownika — tzw. agent — może tylko chodzić, skakać i wykonywać podstawowe akcje. Nie można kazać jej bezpośrednio zasadzić drzewa. Bardziej złożone działania — takie jak zmiana pogody — są wywoływane „magicznie” za pomocą polecenia tekstowego.

Badacze Google’a wciąż zastanawiają się, jak zintegrować więcej niż jednego agenta w symulacji. Modelowanie interakcji między wieloma kontrolowanymi postaciami jest wciąż zbyt skomplikowanym wyzwaniem.

Obecnie Genie 3 nie potrafi również dokładnie odtworzyć lokalizacji ze świata rzeczywistego i ma problemy z renderowaniem tekstu.

Na koniec, twórcy Genie 3 wciąż pracują nad poprawą stabilności systemu, aby symulacje mogły „żyć” nie tylko przez kilka minut, ale przez godziny. Chociaż ta wersja zrobiła ogromny postęp w porównaniu do poprzedniej, czas trwania okna interakcji pozostaje kluczowym ograniczeniem.

Niestety, deweloperzy nie podzielili się wysokiej jakości zrzutami ekranu Genie 3

To są ograniczenia uznawane przez inżynierów DeepMind. Jednak jeśli dokładnie przyjrzysz się demom opublikowanym przez Google, zauważysz również inne wady w Genie 3. Na przykład całkowicie statyczne palmy podczas symulacji huraganu lub słabe renderowanie powierzchni wody w scenach dziennych. W demie narciarskim fizyczne zachowanie śniegu nie zawsze wygląda realistycznie. Dodatkowo, prawie każde wideo zawiera drobne artefakty wizualne lub niespójności. I oczywiście nie powinniśmy ignorować faktu, że Genie 3 wciąż nie potrafi generować dźwięku — co negatywnie wpływa na immersję.

Co to oznacza dla gier przyszłości?

W rzeczywistości, zbytnie skupianie się na wadach Genie 3 jest w pewnym sensie bezcelowe: za sześć miesięcy do roku wiele z nich może już nie być aktualnych — sieci neuronowe rozwijają się tak szybko. Jeszcze kilka lat temu ludzie śmiali się z wygenerowanego wideo Willa Smitha jedzącego spaghetti, a dziś wielu w mediach społecznościowych myli klip z kangurem odmówionym wejścia na pokład komercyjnego lotu, stworzony za pomocą Veo 3, z prawdziwym wideo.

To, co się liczy, to że Genie 3 już oferuje wgląd w to, jakie narzędzia mogą wykorzystać deweloperzy do budowy wirtualnych przygód w przyszłości. Technologia, nad którą pracuje Google, mieści się w koncepcji neuronowych silników gier — nowego typu silnika, w którym wiele funkcji, takich jak generowanie poziomów, symulacja fizyki, zachowanie NPC czy nawet grafika, jest obsługiwanych przez AI zamiast tradycyjnego kodu. Deweloperzy mogliby animować postacie bez robienia tego ręcznie, a gracze mogliby doświadczać RPG z naprawdę nieliniowymi narracjami, w których gra dynamicznie dostosowuje się do ich działań.

Jednak bardziej prawdopodobne jest, że neuronowe silniki gier nie zastąpią całkowicie tradycyjnych, ale raczej zostaną w nie zintegrowane — jako część platform takich jak Unity czy Unreal. Przynajmniej na początku. Z czasem mogą ewoluować w samodzielne narzędzia do tworzenia.

Dziś technologie takie jak Genie 3 nie są jeszcze na poziomie, na którym można na nich budować pełnoprawne gry. Niemniej jednak Julian Togelius, profesor nadzwyczajny informatyki i inżynierii w Tandon School of Engineering na NYU, uważa, że Genie 3 może już być przydatne dla deweloperów. Przetestował model i napisał to na swoim osobistym blogu:

Myślę, że zastosowanie Genie 3, które jest już teraz wykonalne, to ideacja. Oczywiście, model najlepiej działał w przypadku rzeczy, które były mniej więcej w dystrybucji (np. „ścigaj Ferrari przez Greenwich Village”), ale były to również najmniej interesujące wyniki, i nie były to gry, które ktokolwiek chciałby grać, gdyby mógł zamiast tego zagrać w dobrą grę. Z drugiej strony, nietypowe polecenia, takie jak „Tetris #reallife #photorealistic”, dawały naprawdę interesujące i sugestywne wyniki, w pełni zrealizowane interaktywne fever dream, które można było zbadać, aby ujawnić nowe możliwości. Model staje się narzędziem myślowym, które może pomóc profesjonalnym lub amatorskim projektantom wymyślać nowe scenariusze, mechaniki i zasoby, które mogłyby być następnie odtworzone w silniku gry.

Jakakolwiek przyszła wersja Genie mogłaby również być narzędziem do prototypowania. Projektanci mogliby szczegółowo opisać, co mają na myśli, a w krótkim czasie mieć nieco niedoskonałą wersję opisanego scenariusza gry do zagrania.
Bethesda eksperymentowała z generowaniem proceduralnym na długo przed powstaniem sieci neuronowych.

***

Całkiem możliwe, że neuronowe silniki gier są dokładnie tym, czego potrzeba, aby rozwiązać obecny kryzys w rozwoju gier AAA. Tworzenie drogich wirtualnych przygód staje się coraz mniej zrównoważone: budżety rosną do setek milionów dolarów, a duże gry zajmują teraz średnio ponad sześć lat na wydanie. I będzie tylko gorzej. Jeśli nic się nie zmieni, to GTA 7, na przykład, może nie wyjść aż do lat 2040-tych. Modele AI, takie jak Genie 3, mogą pomóc złagodzić obciążenie dla deweloperów, zmniejszając ilość pracy technicznej.

Co o tym myślisz? Czy prace Google’a robią na Tobie wrażenie? Podziel się swoimi przemyśleniami w komentarzach.

How do you feel about the rise of neural game engines?

Wyniki
    O autorze
    Komentarze0