Jak inteligentny jest «przerażająco inteligentny» chatbot Elona Muska?
Fazil Dzhyndzholiia
xAI wprowadziło nowy model językowy, Grok 3, który założyciel firmy, Elon Musk, nazwał „najmądrzejszą AI na Ziemi”. Twórcy chatbota twierdzą, że nowa wersja znacznie przewyższa poprzednią: przetwarza większą ilość danych treningowych i ma nowe mechanizmy samokorekcji. Wersja demonstracyjna Grok 3 została uruchomiona dzisiaj, a pierwsze recenzje już się pojawiły.
Co nowego
Kluczową zaletą Grok 3 jest dostęp do zwiększonych zasobów obliczeniowych. Chatbot jest trenowany przy użyciu superkomputera Colossus: na początkowych etapach jego twórcy wykorzystali 100 000 NVIDIA H100 GPU, a później podwoili tę liczbę. W przyszłości oczekuje się, że moc obliczeniowa wzrośnie pięciokrotnie.
Grok 3 zawiera wbudowane mechanizmy samokorekcji. AI analizuje swoje odpowiedzi, porównuje je z odpowiedziami referencyjnymi, a następnie wprowadza poprawki. Co ciekawe, chatbot otrzymuje „nagrody” za dokładne odpowiedzi i „kary” za tzw. „halucynacje” — nieprawidłowe lub wymyślone informacje.
Według przedstawicieli xAI, Grok 3 jest mądrzejszy od innych modeli w matematyce, naukach przyrodniczych i programowaniu. Do oceny jakości odpowiedzi wykorzystano testy ślepe, co oznacza, że użytkownicy nie wiedzieli, który chatbot odpowiada.
Podczas prezentacji Grok 3, xAI zaprezentowało również Deep Search — agenta wyszukiwania „nowej generacji”, zdolnego do szybkiego znajdowania i analizowania informacji w Internecie. Chociaż podobne funkcje istnieją w konkurencyjnych modelach, xAI twierdzi, że Deep Search jest dokładniejszy.
Dodatkowo, Grok 3 wkrótce otrzyma interfejs głosowy, co pozwoli użytkownikom na interakcję z nim tak, jakby rozmawiali z prawdziwą osobą. Mówi się, że jego głos brzmi bardziej naturalnie i ekspresyjnie niż w konkurencyjnych modelach.
Jak to działa w praktyce
Użytkownicy w sieci społecznościowej X mogą uzyskać dostęp do nowego chatbota, subskrybując X Premium+ za 50 USD miesięcznie. Chociaż na razie nie ma wielu wczesnych recenzji Grok 3, niektóre się wyróżniają.
Na przykład użytkownik o imieniu Penny2x podzielił się , że stworzył w pełni funkcjonalną grę przy użyciu nowej wersji AI:
Grok 3 właśnie został wydany. Nie uwierzysz, już stworzyłem grę.
(Miałem wczesny dostęp DZISIAJ RANO).
Ta gra została w 100% stworzona przez GROK, po prostu powiedziałem mu, czego chcę, i umieściłem kod w odpowiednim miejscu.
Po prostu ciągle proszę o poprawki, a on wciąż generuje grę w jednym pliku, który mogę umieścić na pulpicie i uruchomić.
Gra zmieniła się na zawsze. I rozwijałem wiele z AI od każdego innego głównego twórcy AI ostatnio, próbując zdecydować, co mi się najbardziej podoba, a grok to GRACZ. Nie mam oficjalnych benchmarków, a API jeszcze nie skonfigurowałem, więc to nie jest mój normalny przepływ pracy, ale czułem, że jest tak samo zdolny jak Sonet, 4o, czy cokolwiek innego.
W ciągu następnego dnia lub dwóch skonfiguruję to jako część mojego przepływu pracy w NVIM i włożę to do prawdziwej pracy.
To jest niesamowite. Żyjemy w przyszłości. Teraz każdy jest deweloperem.
Jeszcze bardziej interesujące jest to, co myśli współzałożyciel OpenAI Andrej Karpathy o Grok 3. On również testował nowy model językowy. Według Karpathy, w niektórych obszarach chatbot rywalizuje z najlepszymi konkurentami:
...Grok 3 wyraźnie ma nowoczesny model myślenia (przycisk „Myśl”) i świetnie poradził sobie z moim pytaniem o Osadników z Catanu:
„Stwórz stronę internetową gry planszowej pokazującą siatkę heksagonalną, tak jak w grze Osadnicy z Catanu. Każda siatka heksagonalna jest ponumerowana od 1..N, gdzie N to całkowita liczba heksów. Zrób to ogólnym, aby można było zmieniać liczbę „pierścieni” za pomocą suwaka. Na przykład, w Catan, promień wynosi 3 heksy. Proszę, jedna strona HTML.”
Niewiele modeli robi to poprawnie i niezawodnie. Najlepsze modele myślenia OpenAI (np. o1-pro, za 200 USD miesięcznie) również to robią, ale wszystkie modele DeepSeek-R1, Gemini 2.0 Flash Thinking i Claude nie.
Andrej Karpathy również docenił determinację Grok 3:
Podoba mi się, że model podejmie próbę rozwiązania hipotezy Riemanna, gdy zostanie o to poproszony, podobnie jak DeepSeek-R1, ale w przeciwieństwie do wielu innych modeli, które natychmiast się poddają (o1-pro, Claude, Gemini 2.0 Flash Thinking) i po prostu mówią, że to wielki nierozwiązany problem. Musiałem w końcu go zatrzymać, ponieważ poczułem się trochę źle, ale pokazał odwagę, a kto wie, może pewnego dnia...
Jednak były pewne wady. Agent Deep Search wzbudził kilka obaw:
…model nie wydaje się lubić odnosić się do X jako źródła domyślnie, chociaż można go o to wyraźnie poprosić. Kilka razy złapałem go na halucynowaniu URL-i, które nie istnieją. Kilka razy powiedział rzeczy faktograficzne, które uważam za niepoprawne i nie podał cytatu (prawdopodobnie nie istnieje).
Podsumowując, Andrej Karpathy zauważył, że na podstawie pierwszych wrażeń Grok 3 zbliżył się do poziomu najlepszych modeli OpenAI, takich jak o1-pro (200 USD miesięcznie), a nawet nieco przewyższa DeepSeek-R1 i Gemini 2.0 Flash Thinking. Biorąc pod uwagę, że zespół xAI rozpoczął rozwijanie tej AI od podstaw około roku temu, postęp jest imponujący. Jednak potrzebne są bardziej kompleksowe testy, zanim określi się, czy chatbot naprawdę zasługuje na tytuł „najmądrzejszego.”
Obawy dotyczące stronniczości
Nie jest tajemnicą, że Elon Musk aktywnie uczestniczy w życiu politycznym USA i otwarcie wyraża swoje poglądy. Niektórzy użytkownicy internetu obawiają się, że Grok 3 może również promować pewne narracje.
Te obawy nie są bezpodstawne: Musk podzielił się zrzutem ekranu, na którym chatbot krytykuje jedną z agencji informacyjnych, jednocześnie chwaląc X jako najbardziej wiarygodne źródło informacji. To pomimo, że Grok 3 jest pozycjonowany jako produkt z minimalną cenzurą. Wiele osób uważa, że AI powinno pozostać neutralne w swoich osądach.
***
Niemniej jednak, uruchomienie kolejnego obiecującego modelu językowego oznacza ważny krok w trwającym wyścigu AI. Im większa konkurencja, tym szybciej postęp się rozwija.
Co sądzisz o Grok 3? Podziel się swoimi przemyśleniami w komentarzach.
-
Grok 3 staje się darmowy: Elon Musk uwalnia najinteligentniejszą sztuczną inteligencję na świecie -
ChatGPT Wyszukiwanie Staje Się Bardziej Dostępne — OpenAI Wyzwanie dla Gigantów Wyszukiwania -
Najlepsze sieci neuronowe do generowania treści w styczniu-lutym 2025 -
Elon Musk Niespodziewanie Ogłasza Sprzedaż Sieci Społecznościowej X -
Elon Musk ponownie krytykuje 'woke' gry, obiecuje otworzyć własne studio





