xAI wprowadziło nowy model językowy, Grok 3, który założyciel firmy, Elon Musk, nazwał „najmądrzejszą AI na Ziemi”. Twórcy chatbota twierdzą, że nowa wersja znacznie przewyższa poprzednią: przetwarza większą ilość danych treningowych i ma nowe mechanizmy samokorekcji. Wersja demonstracyjna Grok 3 została uruchomiona dzisiaj, a pierwsze recenzje już się pojawiły.
Kluczową zaletą Grok 3 jest dostęp do zwiększonych zasobów obliczeniowych. Chatbot jest trenowany przy użyciu superkomputera Colossus: na początkowych etapach jego twórcy wykorzystali 100 000 NVIDIA H100 GPU, a później podwoili tę liczbę. W przyszłości oczekuje się, że moc obliczeniowa wzrośnie pięciokrotnie.
Grok 3 zawiera wbudowane mechanizmy samokorekcji. AI analizuje swoje odpowiedzi, porównuje je z odpowiedziami referencyjnymi, a następnie wprowadza poprawki. Co ciekawe, chatbot otrzymuje „nagrody” za dokładne odpowiedzi i „kary” za tzw. „halucynacje” — nieprawidłowe lub wymyślone informacje.
Według przedstawicieli xAI, Grok 3 jest mądrzejszy od innych modeli w matematyce, naukach przyrodniczych i programowaniu. Do oceny jakości odpowiedzi wykorzystano testy ślepe, co oznacza, że użytkownicy nie wiedzieli, który chatbot odpowiada.
Podczas prezentacji Grok 3, xAI zaprezentowało również Deep Search — agenta wyszukiwania „nowej generacji”, zdolnego do szybkiego znajdowania i analizowania informacji w Internecie. Chociaż podobne funkcje istnieją w konkurencyjnych modelach, xAI twierdzi, że Deep Search jest dokładniejszy.
Dodatkowo, Grok 3 wkrótce otrzyma interfejs głosowy, co pozwoli użytkownikom na interakcję z nim tak, jakby rozmawiali z prawdziwą osobą. Mówi się, że jego głos brzmi bardziej naturalnie i ekspresyjnie niż w konkurencyjnych modelach.
Użytkownicy w sieci społecznościowej X mogą uzyskać dostęp do nowego chatbota, subskrybując X Premium+ za 50 USD miesięcznie. Chociaż na razie nie ma wielu wczesnych recenzji Grok 3, niektóre się wyróżniają.
Na przykład użytkownik o imieniu Penny2x podzielił się , że stworzył w pełni funkcjonalną grę przy użyciu nowej wersji AI:
Andrej Karpathy również docenił determinację Grok 3:
Podoba mi się, że model podejmie próbę rozwiązania hipotezy Riemanna, gdy zostanie o to poproszony, podobnie jak DeepSeek-R1, ale w przeciwieństwie do wielu innych modeli, które natychmiast się poddają (o1-pro, Claude, Gemini 2.0 Flash Thinking) i po prostu mówią, że to wielki nierozwiązany problem. Musiałem w końcu go zatrzymać, ponieważ poczułem się trochę źle, ale pokazał odwagę, a kto wie, może pewnego dnia...
Jednak były pewne wady. Agent Deep Search wzbudził kilka obaw:
…model nie wydaje się lubić odnosić się do X jako źródła domyślnie, chociaż można go o to wyraźnie poprosić. Kilka razy złapałem go na halucynowaniu URL-i, które nie istnieją. Kilka razy powiedział rzeczy faktograficzne, które uważam za niepoprawne i nie podał cytatu (prawdopodobnie nie istnieje).
Podsumowując, Andrej Karpathy zauważył, że na podstawie pierwszych wrażeń Grok 3 zbliżył się do poziomu najlepszych modeli OpenAI, takich jak o1-pro (200 USD miesięcznie), a nawet nieco przewyższa DeepSeek-R1 i Gemini 2.0 Flash Thinking. Biorąc pod uwagę, że zespół xAI rozpoczął rozwijanie tej AI od podstaw około roku temu, postęp jest imponujący. Jednak potrzebne są bardziej kompleksowe testy, zanim określi się, czy chatbot naprawdę zasługuje na tytuł „najmądrzejszego.”
Nie jest tajemnicą, że Elon Musk aktywnie uczestniczy w życiu politycznym USA i otwarcie wyraża swoje poglądy. Niektórzy użytkownicy internetu obawiają się, że Grok 3 może również promować pewne narracje.
Te obawy nie są bezpodstawne: Musk podzielił się zrzutem ekranu, na którym chatbot krytykuje jedną z agencji informacyjnych, jednocześnie chwaląc X jako najbardziej wiarygodne źródło informacji. To pomimo, że Grok 3 jest pozycjonowany jako produkt z minimalną cenzurą. Wiele osób uważa, że AI powinno pozostać neutralne w swoich osądach.
***
Niemniej jednak, uruchomienie kolejnego obiecującego modelu językowego oznacza ważny krok w trwającym wyścigu AI. Im większa konkurencja, tym szybciej postęp się rozwija.
Co sądzisz o Grok 3? Podziel się swoimi przemyśleniami w komentarzach.