Gemini otrzymał potężną aktualizację z generatywnym edytowaniem zdjęć

Gemini otrzymał potężną aktualizację z generatywnym edytowaniem zdjęć
Kolaż z wynikami pracy Gemini. Źródło: Google

Google ogłosił dużą aktualizację narzędzi do edytowania zdjęć w aplikacji Gemini. Opracowany przez zespół DeepMind nowy model już otrzymał najwyższe oceny w wczesnych testach i jest dostępny dla wszystkich użytkowników Gemini. Model pozwala na tworzenie i modyfikowanie zdjęć w taki sposób, aby przedstawione osoby lub zwierzęta pozostawały rozpoznawalne i naturalne.

MiejsceModelOcena95% CI (±)GłosyOrganizacjaLicencja
1gemini-2.5-flash-image-preview (nano-banana)1362±29 321 556GoogleProprietarna
2flux-1-kontext-max1191±31 554 616Black Forest LabsProprietarna
3flux-1-kontext-pro1174±27 117 496Black Forest LabsProprietarna
3gpt-image-11170±33 807 220OpenAIProprietarna
5flux-1-kontext-dev1152±34 299 200Black Forest LabsProprietarna
6qwen-image-edit1145±24 301 648AlibabaApache 2.0
6seededit-3.01142±43 701 440BytedanceProprietarna
8gemini-2.0-flash-preview-image-generation1093±34 591 905GoogleProprietarna
9bagel1044±555 590BytedanceApache 2.0
10step1x-edit1017±4181 769StepFunApache 2.0

Źródło: lmarena.ai

Co się zmieniło

Nowa wersja Gemini skupia się na autentyczności. Jeśli wcześniej sztuczna inteligencja mogła "przeprojektować" cechy twarzy lub zmieniać wygląd podczas edytowania, to teraz system minimalizuje takie odchylenia. Oznacza to, że przyjaciele na zdjęciach będą wyglądać jak przyjaciele, a zwierzęta domowe - jak zwykle, nawet po zmianie fryzury, ubrań czy otoczenia.

Gemini nauczył się:

  • przenosić ludzi lub obiekty w inne środowisko bez utraty rozpoznawalności;
  • dodawać lub wymieniać rzeczy i meble na zdjęciach, pozostawiając inne elementy bez zmian;
  • stosować styl jednej części obrazu do drugiej (na przykład kolor kwiatów na odzieży);
  • kombinować fotografie i tworzyć całkowicie nowe scenerie.
Przykład zmiany ról postaci
Przykład zmiany ról postaci. Ilustracja: Google

Przykłady użycia

  • Zdjęcia rodzinne: jeśli ktoś mrugnął okiem, algorytm poprawi tylko wyraz twarzy.
  • Zwierzęta domowe: pies z nową obrożą pozostanie tym samym pupilem, a nie "nową rasą".
  • Modowe eksperymenty: można przymierzyć inne ubrania lub buty bezpośrednio na zdjęciu.
  • Remont i projektowanie: łatwo wyobrazić sobie, jak wyglądałoby pomieszczenie z nowymi meblami lub kolorem ścian.
  • Fantastyczne sceny: przyjaciele z podwórka mogą pojawić się w Paryżu lub na Marsie — i nadal pozostaną rozpoznawalni.
Przykład mieszania dwóch obrazów
Przykład mieszania dwóch obrazów. Ilustracja: Google

Dlaczego to ważne

Google pozycjonuje zaktualizowany Gemini jako narzędzie nowego poziomu personalizacji i wizualnej narracji. Model otwiera możliwości dla kreatywności, komunikacji online i profesjonalnej pracy z treściami wizualnymi — od tworzenia albumów rodzinnych po kampanie reklamowe.

Przykład łączenia designu
Przykład łączenia designu. Ilustracja: Google

Według deweloperów wszystkie obliczenia są wykonywane z zachowaniem prywatności użytkownika, a aktualizacja jest tylko pierwszym krokiem do jeszcze bardziej elastycznych funkcji edytowania.

Źródło: Google

var _paq = window._paq = window._paq || []; _paq.push(['trackPageView']); _paq.push(['enableLinkTracking']); (function() { var u='//mm.magnet.kiev.ua/'; _paq.push(['setTrackerUrl', u+'matomo.php']); _paq.push(['setSiteId', '2']); var d=document, g=d.createElement('script'), s=d.getElementsByTagName('script')[0]; g.async=true; g.src=u+'matomo.js'; s.parentNode.insertBefore(g,s); })();