
Google DeepMind prezentuje Genie 3: Generacja tekstu na świat z kontrolkami przypominającymi gry

Zespół Google DeepMind wprowadził Genie 3 — nową sieć neuronową do generowania interaktywnych wirtualnych światów. Ten model pozwala na budowanie środowisk na podstawie tekstowych wskazówek i ich eksplorację w czasie rzeczywistym, jak w prostej grze wideo.
Kluczową aktualizacją Genie 3 jest jego zdolność do utrzymywania stabilności świata znacznie dłużej. Podczas gdy jego poprzednik (Genie 2) osiągał maksymalnie około 20 sekund interakcji, użytkownicy mogą teraz eksplorować wirtualną przestrzeń przez kilka minut bez krytycznych zniekształceń. System nauczył się "zapamiętywać" obiekty, które tymczasowo opuszczają pole widzenia kamery.
Sieć neuronowa generuje światy w rozdzielczości 720p i 24 klatkach na sekundę. Obsługuje złożone scenariusze, w tym efekty pogodowe, fizykę wody, dynamiczne oświetlenie oraz ekosystemy z florą i fauną. Styl generowanych światów może sięgać od fotorealistycznych lokalizacji po animowane i fantastyczne scenerie.
Jak to działa: Użytkownicy wprowadzają tekstową wskazówkę (np. "eksplorowanie weneckich kanałów z łodzi" lub "latanie nad wulkanem"). Genie 3 generuje środowisko, które można nawigować za pomocą klawiatury. Nowa funkcja "wydarzeń związanych z podpowiedziami" pozwala na modyfikacje świata w trakcie eksploracji — przywołanie deszczu, dodanie postaci lub zmiana krajobrazu za pomocą nowego polecenia tekstowego.
Ta technologia nie jest postrzegana tylko jako narzędzie rozrywkowe. Jest również gotowa do szkolenia agentów AI w symulowanych środowiskach, projektów edukacyjnych lub prototypowania poziomów gier. Na razie Genie 3 oznacza znaczący postęp w tworzeniu "stabilnych" światów generowanych przez AI, oferując znacznie mniej fragmentowane doświadczenie użytkownika niż wcześniejsze modele.
-
Sztuczna inteligencja Google teraz wykonuje połączenia za Ciebie: Twój asystent może bezpośrednio rezerwować wizyty
-
Google potwierdza plany połączenia Androida i ChromeOS w jeden system operacyjny
-
Krok po kroku nauka z AI: Google wprowadza «Guided Learning» w Gemini
-
Sztuczna inteligencja NotebookLM od Google może teraz przekształcać Twoje dokumenty w wizualne filmy wyjaśniające
-
Media w Wielkiej Brytanii domagają się, aby Google umożliwił rezygnację z podsumowań wyszukiwania AI