Artykuły Sprzęt i technologie Jak inteligentny jest «przerażająco inteligentny» chatbot Elona Muska?

Jak inteligentny jest «przerażająco inteligentny» chatbot Elona Muska?

18 lutego 2025, 18:45

xAI wprowadziło nowy model językowy, Grok 3, który założyciel firmy, Elon Musk, nazwał „najmądrzejszą AI na Ziemi”. Twórcy chatbota twierdzą, że nowa wersja znacznie przewyższa poprzednią: przetwarza większą ilość danych treningowych i ma nowe mechanizmy samokorekcji. Wersja demonstracyjna Grok 3 została uruchomiona dzisiaj, a pierwsze recenzje już się pojawiły.

Co nowego

Kluczową zaletą Grok 3 jest dostęp do zwiększonych zasobów obliczeniowych. Chatbot jest trenowany przy użyciu superkomputera Colossus: na początkowych etapach jego twórcy wykorzystali 100 000 NVIDIA H100 GPU, a później podwoili tę liczbę. W przyszłości oczekuje się, że moc obliczeniowa wzrośnie pięciokrotnie.

Grok 3 zawiera wbudowane mechanizmy samokorekcji. AI analizuje swoje odpowiedzi, porównuje je z odpowiedziami referencyjnymi, a następnie wprowadza poprawki. Co ciekawe, chatbot otrzymuje „nagrody” za dokładne odpowiedzi i „kary” za tzw. „halucynacje” — nieprawidłowe lub wymyślone informacje.

Według przedstawicieli xAI, Grok 3 jest mądrzejszy od innych modeli w matematyce, naukach przyrodniczych i programowaniu. Do oceny jakości odpowiedzi wykorzystano testy ślepe, co oznacza, że użytkownicy nie wiedzieli, który chatbot odpowiada.

Podczas prezentacji Grok 3, xAI zaprezentowało również Deep Search — agenta wyszukiwania „nowej generacji”, zdolnego do szybkiego znajdowania i analizowania informacji w Internecie. Chociaż podobne funkcje istnieją w konkurencyjnych modelach, xAI twierdzi, że Deep Search jest dokładniejszy.

Dodatkowo, Grok 3 wkrótce otrzyma interfejs głosowy, co pozwoli użytkownikom na interakcję z nim tak, jakby rozmawiali z prawdziwą osobą. Mówi się, że jego głos brzmi bardziej naturalnie i ekspresyjnie niż w konkurencyjnych modelach.

{poll4570}

Jak to działa w praktyce

Użytkownicy w sieci społecznościowej X mogą uzyskać dostęp do nowego chatbota, subskrybując X Premium+ za 50 USD miesięcznie. Chociaż na razie nie ma wielu wczesnych recenzji Grok 3, niektóre się wyróżniają.

Na przykład użytkownik o imieniu Penny2x podzielił się , że stworzył w pełni funkcjonalną grę przy użyciu nowej wersji AI:

Grok 3 właśnie został wydany. Nie uwierzysz, już stworzyłem grę.

(Miałem wczesny dostęp DZISIAJ RANO).

Ta gra została w 100% stworzona przez GROK, po prostu powiedziałem mu, czego chcę, i umieściłem kod w odpowiednim miejscu.

Po prostu ciągle proszę o poprawki, a on wciąż generuje grę w jednym pliku, który mogę umieścić na pulpicie i uruchomić.

Gra zmieniła się na zawsze. I rozwijałem wiele z AI od każdego innego głównego twórcy AI ostatnio, próbując zdecydować, co mi się najbardziej podoba, a grok to GRACZ. Nie mam oficjalnych benchmarków, a API jeszcze nie skonfigurowałem, więc to nie jest mój normalny przepływ pracy, ale czułem, że jest tak samo zdolny jak Sonet, 4o, czy cokolwiek innego.

W ciągu następnego dnia lub dwóch skonfiguruję to jako część mojego przepływu pracy w NVIM i włożę to do prawdziwej pracy.

To jest niesamowite. Żyjemy w przyszłości. Teraz każdy jest deweloperem.

Jeszcze bardziej interesujące jest to, co myśli współzałożyciel OpenAI Andrej Karpathy o Grok 3. On również testował nowy model językowy. Według Karpathy, w niektórych obszarach chatbot rywalizuje z najlepszymi konkurentami:

...Grok 3 wyraźnie ma nowoczesny model myślenia (przycisk „Myśl”) i świetnie poradził sobie z moim pytaniem o Osadników z Catanu:

„Stwórz stronę internetową gry planszowej pokazującą siatkę heksagonalną, tak jak w grze Osadnicy z Catanu. Każda siatka heksagonalna jest ponumerowana od 1..N, gdzie N to całkowita liczba heksów. Zrób to ogólnym, aby można było zmieniać liczbę „pierścieni” za pomocą suwaka. Na przykład, w Catan, promień wynosi 3 heksy. Proszę, jedna strona HTML.”

Niewiele modeli robi to poprawnie i niezawodnie. Najlepsze modele myślenia OpenAI (np. o1-pro, za 200 USD miesięcznie) również to robią, ale wszystkie modele DeepSeek-R1, Gemini 2.0 Flash Thinking i Claude nie.

Andrej Karpathy również docenił determinację Grok 3:

Podoba mi się, że model podejmie próbę rozwiązania hipotezy Riemanna, gdy zostanie o to poproszony, podobnie jak DeepSeek-R1, ale w przeciwieństwie do wielu innych modeli, które natychmiast się poddają (o1-pro, Claude, Gemini 2.0 Flash Thinking) i po prostu mówią, że to wielki nierozwiązany problem. Musiałem w końcu go zatrzymać, ponieważ poczułem się trochę źle, ale pokazał odwagę, a kto wie, może pewnego dnia...

Jednak były pewne wady. Agent Deep Search wzbudził kilka obaw:

…model nie wydaje się lubić odnosić się do X jako źródła domyślnie, chociaż można go o to wyraźnie poprosić. Kilka razy złapałem go na halucynowaniu URL-i, które nie istnieją. Kilka razy powiedział rzeczy faktograficzne, które uważam za niepoprawne i nie podał cytatu (prawdopodobnie nie istnieje).

Podsumowując, Andrej Karpathy zauważył, że na podstawie pierwszych wrażeń Grok 3 zbliżył się do poziomu najlepszych modeli OpenAI, takich jak o1-pro (200 USD miesięcznie), a nawet nieco przewyższa DeepSeek-R1 i Gemini 2.0 Flash Thinking. Biorąc pod uwagę, że zespół xAI rozpoczął rozwijanie tej AI od podstaw około roku temu, postęp jest imponujący. Jednak potrzebne są bardziej kompleksowe testy, zanim określi się, czy chatbot naprawdę zasługuje na tytuł „najmądrzejszego.”

Obawy dotyczące stronniczości

Nie jest tajemnicą, że Elon Musk aktywnie uczestniczy w życiu politycznym USA i otwarcie wyraża swoje poglądy. Niektórzy użytkownicy internetu obawiają się, że Grok 3 może również promować pewne narracje.

Te obawy nie są bezpodstawne: Musk podzielił się zrzutem ekranu, na którym chatbot krytykuje jedną z agencji informacyjnych, jednocześnie chwaląc X jako najbardziej wiarygodne źródło informacji. To pomimo, że Grok 3 jest pozycjonowany jako produkt z minimalną cenzurą. Wiele osób uważa, że AI powinno pozostać neutralne w swoich osądach.

***

Niemniej jednak, uruchomienie kolejnego obiecującego modelu językowego oznacza ważny krok w trwającym wyścigu AI. Im większa konkurencja, tym szybciej postęp się rozwija.

Co sądzisz o Grok 3? Podziel się swoimi przemyśleniami w komentarzach.

{poll4569}

Post został przetłumaczony Pokaż oryginał (EN)

PC Artykuły Sprzęt i technologie

O autorze

Fazil Dzhyndzholiia

Edytor i współpracownik

Piszę o grach od 2013 roku. Jestem autorem setek artykułów, recenzji, zapowiedzi i skryptów. Obecnie gram głównie na PC, PlayStation 5 i Nintendo Switch 2. Moje ulubione gatunki to survival horror, souls-like i RPG. Ulubione gry: Bloodborne i Vampire: The Masquerade — Bloodlines. Ulubione serie: Resident Evil. Dla mnie kluczowa jest rozgrywka — dobra fabuła nie uratuje nudnych mechanik. Przynajmniej w większości przypadków.

...Rozwiń

Komentarze0