Aktualności Sprzęt i technologie OpenAI integruje inteligentne generowanie obrazów zasilane przez GPT-4o w ChatGPT

OpenAI integruje inteligentne generowanie obrazów zasilane przez GPT-4o w ChatGPT

Arkadiy Andrienko

26 marca 2025, 12:40

OpenAI zintegrowało teraz potężne narzędzie do generowania obrazów bezpośrednio w ChatGPT. Od dzisiaj użytkownicy mogą tworzyć szczegółowe wizualizacje za pomocą zaktualizowanego modelu GPT-4o, który doskonale rozumie kontekst, radzi sobie z złożonymi prośbami, a nawet generuje idealny tekst w obrazach.

Wcześniejsze wersje ChatGPT polegały na sieci neuronowej DALL-E 3, ale nowy system — nazwany Obrazami w ChatGPT — działa na multimodalnym „uniwersalnym” GPT-4o. Oznacza to, że model jednocześnie przetwarza tekst, dźwięk, wideo i obrazy, znacznie zwiększając dokładność. Teraz AI może dokładnie kojarzyć do 15–20 obiektów w jednym obrazie, unikając błędów, które wcześniej występowały przy zaledwie 5–8 elementach.

Jedną z kluczowych ulepszeń jest możliwość produkcji obrazów z idealnie czytelnym tekstem — wyzwanie, które od dawna było piętą achillesową modeli generatywnych. ChatGPT może teraz generować menu restauracyjne, logotypy z podpisami lub infografiki bez żadnych literówek. Dodatkowo użytkownicy mają teraz funkcję edytowania: każdy przesłany obraz można modyfikować, po prostu dodając lub usuwając elementy za pomocą tekstowego polecenia.

Ta nowa funkcja jest dostępna dla wszystkich subskrypcji ChatGPT, w tym dla bezpłatnego poziomu, chociaż nadal obowiązują podobne ograniczenia jak w przypadku DALL-E 3. W międzyczasie DALL-E będzie nadal dostępny za pośrednictwem niestandardowych modułów GPT. OpenAI zwróciło również szczególną uwagę na bezpieczeństwo: wszystkie obrazy są oznaczone metadanymi C2PA, aby zidentyfikować treści generowane przez AI, a system blokuje prośby związane z przemocą, deepfake'ami i innymi potencjalnymi nadużyciami.

PC Aktualności Sprzęt i technologie OpenAI ChatGPT

O autorze

Arkadiy Andrienko

Autor artykułów i wiadomości

Jako dziennikarz techniczny w VGTimes, z równą przyjemnością dyskutuję o najnowszych procesorach graficznych i zagłębiam się w niuanse klasycznych RPG. Od 2018 roku piszę o grach i sprzęcie, moje doświadczenie w dziedzinie dźwięku pozwoliło mi dobrze rozumieć niuanse technologii audio, a ja zawsze poszukuję czegoś nowego w dziedzinie sprzętu gamingowego. Kiedy nie piszę o technologiach, prawdopodobnie eksploruję postapokaliptyczne pustkowia w Fallout, zarządzam kolonią w RimWorld lub dowodzę armiami w Hearts of Iron IV. Dla mnie gry to więcej niż tylko hobby — to pasja, która napędza mój twórczy potencjał i utrzymuje połączenie z nieustannie rozwijającym się światem technologii.

Komentarze0

Zostawić komentarz