Aktualności Sprzęt i technologie OpenAI integruje inteligentne generowanie obrazów zasilane przez GPT-4o w ChatGPT

OpenAI integruje inteligentne generowanie obrazów zasilane przez GPT-4o w ChatGPT

Arkadiy Andrienko
Czytaj w pełnej wersji

OpenAI zintegrowało teraz potężne narzędzie do generowania obrazów bezpośrednio w ChatGPT. Od dzisiaj użytkownicy mogą tworzyć szczegółowe wizualizacje za pomocą zaktualizowanego modelu GPT-4o, który doskonale rozumie kontekst, radzi sobie z złożonymi prośbami, a nawet generuje idealny tekst w obrazach.

Wcześniejsze wersje ChatGPT polegały na sieci neuronowej DALL-E 3, ale nowy system — nazwany Obrazami w ChatGPT — działa na multimodalnym „uniwersalnym” GPT-4o. Oznacza to, że model jednocześnie przetwarza tekst, dźwięk, wideo i obrazy, znacznie zwiększając dokładność. Teraz AI może dokładnie kojarzyć do 15–20 obiektów w jednym obrazie, unikając błędów, które wcześniej występowały przy zaledwie 5–8 elementach.

Jedną z kluczowych ulepszeń jest możliwość produkcji obrazów z idealnie czytelnym tekstem — wyzwanie, które od dawna było piętą achillesową modeli generatywnych. ChatGPT może teraz generować menu restauracyjne, logotypy z podpisami lub infografiki bez żadnych literówek. Dodatkowo użytkownicy mają teraz funkcję edytowania: każdy przesłany obraz można modyfikować, po prostu dodając lub usuwając elementy za pomocą tekstowego polecenia.

Ta nowa funkcja jest dostępna dla wszystkich subskrypcji ChatGPT, w tym dla bezpłatnego poziomu, chociaż nadal obowiązują podobne ograniczenia jak w przypadku DALL-E 3. W międzyczasie DALL-E będzie nadal dostępny za pośrednictwem niestandardowych modułów GPT. OpenAI zwróciło również szczególną uwagę na bezpieczeństwo: wszystkie obrazy są oznaczone metadanymi C2PA, aby zidentyfikować treści generowane przez AI, a system blokuje prośby związane z przemocą, deepfake'ami i innymi potencjalnymi nadużyciami.

    O autorze
    Komentarze0
    Zostawić komentarz