Aktualności Sprzęt i technologie Od tekstu do dyskusji: Nowa funkcja Gemini przekształca raporty w podcasty w kilka sekund

Od tekstu do dyskusji: Nowa funkcja Gemini przekształca raporty w podcasty w kilka sekund

Arkadiy Andrienko

24 marca 2025, 13:36

Google połączył dwie kluczowe technologie — Deep Research i Audio Overviews — aby stworzyć dynamiczne podcasty audio. Teraz użytkownicy mogą przekształcać skomplikowane analizy raportów w angażujące rozmowy między wirtualnymi gospodarzami, otwierając nowe możliwości uczenia się i pracy z informacjami.

Wcześniej uruchomiona funkcja Deep Research pozwala Gemini analizować ogromne ilości danych z internetu i generować szczegółowe raporty na dany temat. Od dzisiaj to narzędzie zawiera teraz opcję Generuj Podsumowanie Audio, która przekształca suche fakty w interaktywny podcast. Gdy badania są zakończone, użytkownik wybiera odpowiedni przycisk, a Gemini generuje dialog między dwoma AI „gospodarzami”, omawiającymi kluczowe ustalenia w żywym formacie rozmowy.

Technologia podsumowań głosowych zadebiutowała we wrześniu 2023 roku w aplikacji NotebookLM, zaprojektowanej do analizy dokumentów. W ciągu ostatniego półtora roku Google znacznie poprawił tę funkcję: użytkownicy mogą teraz wpływać na skrypt dialogu, zadawać pytania wirtualnym mówcom, a nawet zmieniać styl przekazu treści. W marcu 2025 roku usługa stała się dostępna w Gemini dla wszystkich — zarówno dla użytkowników bezpłatnych, jak i subskrybentów.

Podczas gdy system wcześniej działał tylko z krótkimi tekstami i prezentacjami, integracja z Deep Research teraz pozwala mu przetwarzać pełnoskalowe badania — od raportów klimatycznych po analizy rynkowe. Eksperci zauważają, że przejście od monotonnych podsumowań tekstowych do interaktywnych podcastów rozwiązuje problem „zmęczenia informacyjnego”. Dwaj AI rozmówcy symulują dyskusję, podkreślając sprzeczności, wspierając argumenty przykładami, a nawet dodając elementy opowiadania. Według przedstawicieli Google, ten format poprawia zapamiętywanie danych o 40% w porównaniu do tradycyjnych metod.

Do końca 2025 roku Google planuje dodać możliwość wyboru głosów gospodarzy, dostosowywania długości odcinków oraz wstawiania pytań generowanych przez użytkowników w czasie rzeczywistym. Nowa era spersonalizowanej treści audio, w której każde zapytanie staje się unikalnym programem, już się rozpoczęła.

Post został przetłumaczony Pokaż oryginał (EN)

Aktualności Sprzęt i technologie Google

O autorze

Arkadiy Andrienko

Autor artykułów i wiadomości

Jako dziennikarz techniczny w VGTimes, z równą przyjemnością dyskutuję o najnowszych procesorach graficznych i zagłębiam się w niuanse klasycznych RPG. Od 2018 roku piszę o grach i sprzęcie, moje doświadczenie w dziedzinie dźwięku pozwoliło mi dobrze rozumieć niuanse technologii audio, a ja zawsze poszukuję czegoś nowego w dziedzinie sprzętu gamingowego. Kiedy nie piszę o technologiach, prawdopodobnie eksploruję postapokaliptyczne pustkowia w Fallout, zarządzam kolonią w RimWorld lub dowodzę armiami w Hearts of Iron IV. Dla mnie gry to więcej niż tylko hobby — to pasja, która napędza mój twórczy potencjał i utrzymuje połączenie z nieustannie rozwijającym się światem technologii.

...Rozwiń

Komentarze0