Google łączy generację wideo, audio i obrazów w jednej kompleksowej platformie

Google łączy generację wideo, audio i obrazów w jednej kompleksowej platformie

Arkadiy Andrienko

Google ogłosiło potężny nowy zestaw narzędzi AI do generowania treści multimedialnych — w tym wideo, obrazów i muzyki. Centralnym elementem jest Veo 3, model zdolny do produkcji klipów wideo z automatycznie zsynchronizowanym dźwiękiem. W przeciwieństwie do innych systemów, Veo 3 wybiera odpowiedni dźwięk — czy to dialog, dźwięki otoczenia, czy muzykę — na podstawie samego kontekstu wizualnego. Na przykład, jeśli w scenie pada deszcz, usłyszysz dźwięk kropli deszczu bez potrzeby osobnego wywoływania go.

Innym kluczowym narzędziem jest Imagen 4, które generuje obrazy w wysokiej rozdzielczości 2K, od hiperrealistycznych po sztukę abstrakcyjną. Jeśli chodzi o dźwięk, dostępny jest Music AI Sandbox, który pozwala użytkownikom tworzyć i remiksować utwory na podstawie pisemnych opisów. Wszystkie te narzędzia są teraz zgrupowane w zjednoczonej platformie zwanej Flow, gdzie twórcy mogą łączyć wideo, obrazy i podpowiedzi w stylu skryptu, dostosowywać kąty kamery, a nawet wstawiać nowe sceny w locie.

Google kładzie duży nacisk na bezpieczeństwo. Cała generowana treść jest oznaczona znakiem wodnym SynthID, co czyni ją odróżnialną od mediów z rzeczywistego świata. Firma współpracuje również z filmowcami i muzykami, aby dostosować te narzędzia do profesjonalnych przepływów pracy. Jednak nie wszyscy są zadowoleni. Według Animation Guild, automatyzacja może zagrozić nawet 100 000 kreatywnych miejsc pracy w USA do 2026 roku.

Na razie Flow jest dostępne tylko w Stanach Zjednoczonych. Podstawowa subskrypcja w ramach poziomu Google AI Pro kosztuje 20 USD/miesiąc i obejmuje 100 generacji. Google twierdzi, że platforma jest stworzona zarówno dla profesjonalistów, jak i początkujących. Zawiera nawet starannie dobrany hub przykładów, Flow TV, oferujący porady i inspiracje dla nowych użytkowników. Mimo to, Google nie ujawnili zbioru danych użytego do trenowania tych modeli, co budzi obawy o przejrzystość w społeczności AI. Mimo to, Flow oznacza duży krok w kierunku przekształcenia generatywnej AI z eksperymentalnej zabawki w poważne narzędzie kreatywne.

    O autorze
    Komentarze0