Użytkownicy aplikacji Gemini oraz deweloperzy na platformach AI Studio i Vertex AI firmy Google uzyskają dostęp do ulepszonego narzędzia do edycji obrazów. Ten nowy model, znany wewnętrznie jako „nano-banana”, umożliwia skomplikowane edycje zdjęć na podstawie tekstowych wskazówek.
Główną zaletą aktualizacji jest jej wysoka precyzja i zdolność do zachowania szczegółów. Prośba do większości obecnych usług AI o zmienienie kolorów części obrazu może prowadzić do rozczarowujących rezultatów—twarze mogą się zniekształcać, a tła mogą się nieoczekiwanie zmieniać. Gemini 2.5 Flash Image skutecznie radzi sobie z tymi zadaniami, poprawnie działając z drobnymi szczegółami, takimi jak cechy twarzy, tekstura futra zwierząt czy wzory na odzieży.
Google również stwierdza, że w systemie wprowadzono surowe zabezpieczenia. AI nie ma prawa generować intymnych obrazów ludzi bez ich zgody. Wszystkie wygenerowane obrazy są automatycznie oznaczane specjalnymi metadanymi i znakami wodnymi, aby użytkownicy mogli je odróżnić od prawdziwych fotografii.
Uruchomienie tego precyzyjnego edytora obrazów to znaczący krok dla Google w rywalizacji z OpenAI, którego bot ChatGPT ma więcej użytkowników tygodniowo niż Gemini w ciągu miesiąca. Nowa funkcja w Gemini będzie przydatna w codziennych zadaniach, takich jak wizualizacja pomysłów na remont czy przymierzanie stylów odzieżowych, ponieważ model może łączyć wiele elementów w jeden obraz na podstawie przykładu. Pełny dostęp dla wszystkich użytkowników ma być dostępny do końca sierpnia.
Rozszerzona funkcjonalność edytora obrazów następuje po niedawnej ekspansji dostępności NotebookLM, który zyskał wsparcie dla ponad 80 języków. Wygląda na to, że ta jesień przyniesie falę nowych innowacji od zespołu AI firmy Google.
-
Startup AI Perplexity składa oszałamiającą ofertę w wysokości 34,5 miliarda dolarów na zakup Chrome od Google
-
Krok po kroku nauka z AI: Google wprowadza «Guided Learning» w Gemini
-
Google DeepMind prezentuje Genie 3: Generacja tekstu na świat z kontrolkami przypominającymi gry
-
Sztuczna inteligencja NotebookLM od Google może teraz przekształcać Twoje dokumenty w wizualne filmy wyjaśniające
-
Ukryta funkcja treningu językowego zauważona w Google Translate