Aktualności Sprzęt i technologie Offline AI: Google wprowadza Gemini Nano do aplikacji mobilnych bez chmury

Offline AI: Google wprowadza Gemini Nano do aplikacji mobilnych bez chmury

Arkadiy Andrienko
Czytaj w pełnej wersji

Google wprowadza narzędzia, które pozwalają deweloperom na osadzanie generatywnej sztucznej inteligencji bezpośrednio w aplikacjach mobilnych, bez polegania na serwerach w chmurze. Zaktualizowany zestaw SDK ML Kit obsługuje teraz Gemini Nano, kompaktowy model językowy zaprojektowany do działania lokalnie na smartfonach. Umożliwia to funkcje takie jak podsumowywanie tekstu, parafrazowanie treści czy generowanie podpisów do obrazów — wszystko to przy zachowaniu danych użytkownika na urządzeniu.

Kluczową zaletą jest tutaj prywatność. Wszystko — od wejścia do wyjścia — jest przetwarzane lokalnie. Oznacza to, że funkcje takie jak podsumowania powiadomień czy edytowanie tekstu mogą działać nawet bez połączenia z internetem. Jednak Gemini Nano ma ograniczenia w porównaniu do modeli opartych na chmurze: jego wyjście tekstowe jest ograniczone do trzech punktów, a generowanie podpisów do obrazów jest obecnie dostępne tylko w języku angielskim. Wydajność również różni się w zależności od wersji modelu: najmniejszy (XXS) waży zaledwie 25MB i obsługuje tylko tekst, podczas gdy standardowy (XS) wymaga około 100MB pamięci.

Na początku Gemini Nano jest wspierany na flagowych urządzeniach, takich jak Google Pixel 9a, Samsung Galaxy S25 i Xiaomi 15, a w przyszłości ma być ich więcej. Oczekuje się również, że liczba aplikacji korzystających z AI na urządzeniu wzrośnie. Deweloperzy mogą już rozpocząć testowanie API w wersji beta, ale są pewne ograniczenia: aplikacje podlegają limitom żądań, a przetwarzanie w tle jest ograniczone. Na przykład, jeśli użytkownik zminimalizuje aplikację, jej funkcje AI zostaną wstrzymane.

Interesujące jest to, że Google nie jest pierwszym, który dąży do AI na urządzeniu. Qualcomm i MediaTek wprowadziły własne rozwiązania, ale są one trudniejsze do zaadaptowania na różnych telefonach. Integrując Gemini Nano przez ML Kit, Google upraszcza ten proces — deweloperzy nie muszą budować modeli od podstaw ani dostosowywać ich do każdego chipsetu. Mimo to, szersza adopcja będzie spowolniona przez ograniczoną moc obliczeniową wielu smartfonów.

Korzyści w rzeczywistym świecie już się pojawiają: na przykład, Pixel może analizować zrzuty ekranu na urządzeniu, a Motorola Razr Ultra może generować offline podsumowania powiadomień. Dzięki Gemini Nano takie funkcje mogą stać się normą — ale na razie stabilna wydajność będzie zależała od dalszych wysiłków zarówno deweloperów, jak i producentów sprzętu.

    O autorze
    Komentarze0
    Zostawić komentarz