DeepSeek wydał Janus-Pro-7B, przewyższając DALL-E 3 i Stable Diffusion w zdolnościach generowania obrazów

DeepSeek wydał Janus-Pro-7B, przewyższając DALL-E 3 i Stable Diffusion w zdolnościach generowania obrazów

Arkadiy Andrienko

Chińska firma DeepSeek wprowadziła swoją nową multimodalną sieć neuronową, Janus-Pro-7B, zaprojektowaną do efektywnego rozpoznawania i generowania obrazów. W porównaniu do poprzednich wersji, nowy model został znacznie ulepszony: algorytmy treningowe zostały zoptymalizowane, zestaw danych rozszerzony, a rozmiar modelu zwiększony. Te zmiany pozwoliły sieci neuronowej znacznie poprawić wydajność w zadaniach związanych z generowaniem obrazów na podstawie opisów tekstowych oraz analizą obrazów.

Janus-Pro-7B przewyższył znane modele, takie jak DALL-E 3 i Stable Diffusion w testach GenEval i DPG-Bench. Ta sieć neuronowa oferuje wysoki poziom szczegółowości i realizmu w tworzeniu obrazów, co czyni ją silnym konkurentem dla innych rozwiązań. Model jest już dostępny na platformie Hugging Face, a kod można pobrać za darmo z GitHub, co umożliwia badaczom i deweloperom wniesienie wkładu w jego rozwój.

    O autorze
    Komentarze0