Od tekstu do dyskusji: Nowa funkcja Gemini przekształca raporty w podcasty w kilka sekund

Od tekstu do dyskusji: Nowa funkcja Gemini przekształca raporty w podcasty w kilka sekund

Arkadiy Andrienko

Google połączył dwie kluczowe technologie — Deep Research i Audio Overviews — aby stworzyć dynamiczne podcasty audio. Teraz użytkownicy mogą przekształcać skomplikowane analizy raportów w angażujące rozmowy między wirtualnymi gospodarzami, otwierając nowe możliwości uczenia się i pracy z informacjami.

Wcześniej uruchomiona funkcja Deep Research pozwala Gemini analizować ogromne ilości danych z internetu i generować szczegółowe raporty na dany temat. Od dzisiaj to narzędzie zawiera teraz opcję Generuj Podsumowanie Audio, która przekształca suche fakty w interaktywny podcast. Gdy badania są zakończone, użytkownik wybiera odpowiedni przycisk, a Gemini generuje dialog między dwoma AI „gospodarzami”, omawiającymi kluczowe ustalenia w żywym formacie rozmowy.

Technologia podsumowań głosowych zadebiutowała we wrześniu 2023 roku w aplikacji NotebookLM, zaprojektowanej do analizy dokumentów. W ciągu ostatniego półtora roku Google znacznie poprawił tę funkcję: użytkownicy mogą teraz wpływać na skrypt dialogu, zadawać pytania wirtualnym mówcom, a nawet zmieniać styl przekazu treści. W marcu 2025 roku usługa stała się dostępna w Gemini dla wszystkich — zarówno dla użytkowników bezpłatnych, jak i subskrybentów.

Podczas gdy system wcześniej działał tylko z krótkimi tekstami i prezentacjami, integracja z Deep Research teraz pozwala mu przetwarzać pełnoskalowe badania — od raportów klimatycznych po analizy rynkowe. Eksperci zauważają, że przejście od monotonnych podsumowań tekstowych do interaktywnych podcastów rozwiązuje problem „zmęczenia informacyjnego”. Dwaj AI rozmówcy symulują dyskusję, podkreślając sprzeczności, wspierając argumenty przykładami, a nawet dodając elementy opowiadania. Według przedstawicieli Google, ten format poprawia zapamiętywanie danych o 40% w porównaniu do tradycyjnych metod.

Do końca 2025 roku Google planuje dodać możliwość wyboru głosów gospodarzy, dostosowywania długości odcinków oraz wstawiania pytań generowanych przez użytkowników w czasie rzeczywistym. Nowa era spersonalizowanej treści audio, w której każde zapytanie staje się unikalnym programem, już się rozpoczęła.

    O autorze
    Komentarze0