Darmowy DeepSeek R1 wzrasta w logicznym rozumowaniu — niemal dogania płatnego ChatGPT

Darmowy DeepSeek R1 wzrasta w logicznym rozumowaniu — niemal dogania płatnego ChatGPT

Arkadiy Andrienko

Zespół DeepSeek cicho wprowadził dużą aktualizację swojego darmowego asystenta AI, R1. Mimo że deweloperzy skromnie nazywają to „drobnostką”, testy ujawniają ogromny skok w jego zdolności do rozwiązywania trudnych problemów.

Kluczową poprawą jest wzmocniona logika i rozumowanie naukowe. Zaktualizowany model R1-0528 teraz poprawnie rozwiązuje problemy olimpijskie z matematyki prawie 9 razy na 10 – to duży skok od stycznia. Najbardziej imponujący jest jego postęp w notoriously difficult „Ostatnim Egzaminie Ludzkości”, gdzie wynik R1 wzrósł ponad dwukrotnie do 17,7%. (Ten test wciąż stawia w trudnej sytuacji większość AI.)

W sześciu niezależnych testach (nauka, programowanie, zaawansowana matematyka) zaktualizowany R1 dostarczył wyniki niezwykle bliskie płatnemu ChatGPT-o3 od OpenAI. Różnica była minimalna wszędzie, z wyjątkiem jednego benchmarku kodowania. Deweloperzy twierdzą również, że R1 teraz generuje mniej nieścisłości. Podczas gdy podobne możliwości w ChatGPT-o3 kosztują 20 USD/miesiąc, DeepSeek R1 pozostaje całkowicie darmowy.

Te zyski nie wynikły z większego modelu, ale z mądrzejszego „dostosowywania” – ostrzenia umiejętności rozumowania i analizy. Użytkownicy natychmiast zauważyli: aplikacja mobilna DeepSeek znowu znalazła się w czołówce sklepów z aplikacjami w USA, Wielkiej Brytanii, Japonii, Korei Południowej i Chinach.

Ten darmowy chiński asystent poczynił poważne postępy w zbliżaniu się do lidera rynku. Podczas gdy OpenAI wciąż ma przewagę w multimodalności (obrazy, głos), DeepSeek R1 staje się wyborem dla każdego, kto potrzebuje głębokiej analizy i skomplikowanego rozwiązywania problemów – bez subskrypcji.

    O autorze
    Komentarze0