Aktualności Sprzęt i technologie Stability AI ujawnia lekki model AI do generowania dźwięku offline

Stability AI ujawnia lekki model AI do generowania dźwięku offline

15 maj 2025, 11:39

Stability AI, znane z innowacji w generatywnej sztucznej inteligencji, ogłosiło nowy model generowania dźwięku: Stable Audio Open Small. Co wyróżnia to narzędzie, to jego zdolność do działania na smartfonach bez dostępu do internetu, dzięki optymalizacji dla procesorów Arm.

Opracowany we współpracy z producentem chipów Arm, model jest zaprojektowany do generowania krótkich klipów dźwiękowych — próbek, efektów dźwiękowych lub szkiców instrumentalnych o długości do 11 sekund. Według deweloperów, produkcja takiego audio zajmuje mniej niż osiem sekund, nawet na urządzeniach mobilnych. Tę wydajność umożliwia zmniejszenie sieci neuronowej do 341 milionów parametrów i dostosowanie jej do energooszczędnych chipów.

W przeciwieństwie do usług opartych na chmurze, takich jak Suno czy Udio, Stable Audio Open Small działa całkowicie lokalnie. Eliminuje to opóźnienia i zależność od łączności internetowej. Model był trenowany wyłącznie na otwartych zbiorach danych z Free Music Archive i Freesound, co zmniejsza ryzyko naruszenia praw autorskich — co stanowi znaczną różnicę w porównaniu do niektórych konkurentów, którzy polegają na bardziej wątpliwych materiałach szkoleniowych.

Niemniej jednak narzędzie ma swoje ograniczenia: obsługuje tylko polecenia w języku angielskim, nie generuje wokali ani złożonych kompozycji. Warunki użytkowania różnią się — jest darmowe dla startupów i badaczy, ale firmy z rocznym przychodem przekraczającym 1 milion dolarów muszą zakupić licencję komercyjną. Chociaż nie jest to zamiennik dla profesjonalnych studiów, Stable Audio Open Small oferuje praktyczne rozwiązanie do szybkiego tworzenia audio w podróży prosto z telefonu.

Post został przetłumaczony Pokaż oryginał (EN)

Aktualności Sprzęt i technologie Ogłoszenia

O autorze

Arkadiy Andrienko

Autor artykułów i wiadomości

Jako dziennikarz techniczny w VGTimes, z równą przyjemnością dyskutuję o najnowszych procesorach graficznych i zagłębiam się w niuanse klasycznych RPG. Od 2018 roku piszę o grach i sprzęcie, moje doświadczenie w dziedzinie dźwięku pozwoliło mi dobrze rozumieć niuanse technologii audio, a ja zawsze poszukuję czegoś nowego w dziedzinie sprzętu gamingowego. Kiedy nie piszę o technologiach, prawdopodobnie eksploruję postapokaliptyczne pustkowia w Fallout, zarządzam kolonią w RimWorld lub dowodzę armiami w Hearts of Iron IV. Dla mnie gry to więcej niż tylko hobby — to pasja, która napędza mój twórczy potencjał i utrzymuje połączenie z nieustannie rozwijającym się światem technologii.

...Rozwiń

Komentarze0