Gemini otrzymał potężną aktualizację z generatywnym edytowaniem zdjęć
Google ogłosił dużą aktualizację narzędzi do edytowania zdjęć w aplikacji Gemini. Opracowany przez zespół DeepMind nowy model już otrzymał najwyższe oceny w wczesnych testach i jest dostępny dla wszystkich użytkowników Gemini. Model pozwala na tworzenie i modyfikowanie zdjęć w taki sposób, aby przedstawione osoby lub zwierzęta pozostawały rozpoznawalne i naturalne.
| Miejsce | Model | Ocena | 95% CI (±) | Głosy | Organizacja | Licencja |
|---|---|---|---|---|---|---|
| 1 | gemini-2.5-flash-image-preview (nano-banana) | 1362 | ±2 | 9 321 556 | Proprietarna | |
| 2 | flux-1-kontext-max | 1191 | ±3 | 1 554 616 | Black Forest Labs | Proprietarna |
| 3 | flux-1-kontext-pro | 1174 | ±2 | 7 117 496 | Black Forest Labs | Proprietarna |
| 3 | gpt-image-1 | 1170 | ±3 | 3 807 220 | OpenAI | Proprietarna |
| 5 | flux-1-kontext-dev | 1152 | ±3 | 4 299 200 | Black Forest Labs | Proprietarna |
| 6 | qwen-image-edit | 1145 | ±2 | 4 301 648 | Alibaba | Apache 2.0 |
| 6 | seededit-3.0 | 1142 | ±4 | 3 701 440 | Bytedance | Proprietarna |
| 8 | gemini-2.0-flash-preview-image-generation | 1093 | ±3 | 4 591 905 | Proprietarna | |
| 9 | bagel | 1044 | ±5 | 55 590 | Bytedance | Apache 2.0 |
| 10 | step1x-edit | 1017 | ±4 | 181 769 | StepFun | Apache 2.0 |
Źródło: lmarena.ai
Co się zmieniło
Nowa wersja Gemini skupia się na autentyczności. Jeśli wcześniej sztuczna inteligencja mogła "przeprojektować" cechy twarzy lub zmieniać wygląd podczas edytowania, to teraz system minimalizuje takie odchylenia. Oznacza to, że przyjaciele na zdjęciach będą wyglądać jak przyjaciele, a zwierzęta domowe - jak zwykle, nawet po zmianie fryzury, ubrań czy otoczenia.
Gemini nauczył się:
- przenosić ludzi lub obiekty w inne środowisko bez utraty rozpoznawalności;
- dodawać lub wymieniać rzeczy i meble na zdjęciach, pozostawiając inne elementy bez zmian;
- stosować styl jednej części obrazu do drugiej (na przykład kolor kwiatów na odzieży);
- kombinować fotografie i tworzyć całkowicie nowe scenerie.
Przykład zmiany ról postaci. Ilustracja: Google
Przykłady użycia
- Zdjęcia rodzinne: jeśli ktoś mrugnął okiem, algorytm poprawi tylko wyraz twarzy.
- Zwierzęta domowe: pies z nową obrożą pozostanie tym samym pupilem, a nie "nową rasą".
- Modowe eksperymenty: można przymierzyć inne ubrania lub buty bezpośrednio na zdjęciu.
- Remont i projektowanie: łatwo wyobrazić sobie, jak wyglądałoby pomieszczenie z nowymi meblami lub kolorem ścian.
- Fantastyczne sceny: przyjaciele z podwórka mogą pojawić się w Paryżu lub na Marsie — i nadal pozostaną rozpoznawalni.
Przykład mieszania dwóch obrazów. Ilustracja: Google
Dlaczego to ważne
Google pozycjonuje zaktualizowany Gemini jako narzędzie nowego poziomu personalizacji i wizualnej narracji. Model otwiera możliwości dla kreatywności, komunikacji online i profesjonalnej pracy z treściami wizualnymi — od tworzenia albumów rodzinnych po kampanie reklamowe.
Przykład łączenia designu. Ilustracja: Google
Według deweloperów wszystkie obliczenia są wykonywane z zachowaniem prywatności użytkownika, a aktualizacja jest tylko pierwszym krokiem do jeszcze bardziej elastycznych funkcji edytowania.
Źródło: Google