
Od tekstu do dyskusji: Nowa funkcja Gemini przekształca raporty w podcasty w kilka sekund

Google połączył dwie kluczowe technologie — Deep Research i Audio Overviews — aby stworzyć dynamiczne podcasty audio. Teraz użytkownicy mogą przekształcać skomplikowane analizy raportów w angażujące rozmowy między wirtualnymi gospodarzami, otwierając nowe możliwości uczenia się i pracy z informacjami.
Wcześniej uruchomiona funkcja Deep Research pozwala Gemini analizować ogromne ilości danych z internetu i generować szczegółowe raporty na dany temat. Od dzisiaj to narzędzie zawiera teraz opcję Generuj Podsumowanie Audio, która przekształca suche fakty w interaktywny podcast. Gdy badania są zakończone, użytkownik wybiera odpowiedni przycisk, a Gemini generuje dialog między dwoma AI „gospodarzami”, omawiającymi kluczowe ustalenia w żywym formacie rozmowy.
Technologia podsumowań głosowych zadebiutowała we wrześniu 2023 roku w aplikacji NotebookLM, zaprojektowanej do analizy dokumentów. W ciągu ostatniego półtora roku Google znacznie poprawił tę funkcję: użytkownicy mogą teraz wpływać na skrypt dialogu, zadawać pytania wirtualnym mówcom, a nawet zmieniać styl przekazu treści. W marcu 2025 roku usługa stała się dostępna w Gemini dla wszystkich — zarówno dla użytkowników bezpłatnych, jak i subskrybentów.
Podczas gdy system wcześniej działał tylko z krótkimi tekstami i prezentacjami, integracja z Deep Research teraz pozwala mu przetwarzać pełnoskalowe badania — od raportów klimatycznych po analizy rynkowe. Eksperci zauważają, że przejście od monotonnych podsumowań tekstowych do interaktywnych podcastów rozwiązuje problem „zmęczenia informacyjnego”. Dwaj AI rozmówcy symulują dyskusję, podkreślając sprzeczności, wspierając argumenty przykładami, a nawet dodając elementy opowiadania. Według przedstawicieli Google, ten format poprawia zapamiętywanie danych o 40% w porównaniu do tradycyjnych metod.
Do końca 2025 roku Google planuje dodać możliwość wyboru głosów gospodarzy, dostosowywania długości odcinków oraz wstawiania pytań generowanych przez użytkowników w czasie rzeczywistym. Nowa era spersonalizowanej treści audio, w której każde zapytanie staje się unikalnym programem, już się rozpoczęła.
-
Google Gemini 2.0 Flash pojawia się jako broń przeciwko znakom wodnym praw autorskich
-
Google rozpoczyna globalne wycofywanie Asystenta na rzecz Gemini
-
Departament Sprawiedliwości USA wciąż domaga się, aby Google sprzedał przeglądarkę internetową Chrome
-
Czat zamiast Photoshopa: Gemini 2.0 Flash od Google'a uczy się edytować obrazy poprzez dialog
-
Gry mobilne na komputerze: Google uruchamia automatyczne przenoszenie gier na PC