Xiaomi wprowadza UltraSpeed: Sztuczna inteligencja generuje ponad 1000 tokenów na sekundę!
Podczas gdy większość deweloperów sztucznej inteligencji rywalizuje w ilości parametrów, Xiaomi uznało, że nadszedł czas, by pomyśleć o szybkości. W rodzinie dużych modeli językowych MiMo oficjalnie wprowadzono tryb UltraSpeed dla wersji MiMo-V2.5-Pro. To nie tylko kolejna aktualizacja oprogramowania, ale próba udowodnienia, że nawet monstrualne modele z 1 bilionem parametrów mogą działać bez opóźnień, które zazwyczaj irytują użytkowników.
Technologiczny przełom i współpraca z TileRT
Nowy tryb UltraSpeed pozwala MiMo-V2.5-Pro pokonać psychologiczny próg 1000 tokenów na sekundę. Dla zrozumienia skali: poprzedni model MiMo-V2-Flash, wydany w grudniu 2025 roku, generował około 150 tokenów na sekundę. To już było szybciej, niż ktokolwiek potrafi czytać lub mówić, ale Xiaomi postanowiło przyspieszyć proces jeszcze niemal siedem razy. Takiego wyniku udało się osiągnąć dzięki wspólnej pracy specjalistów Xiaomi i TileRT.
Kluczowa cecha polega na tym, że model jest zoptymalizowany pod kątem pracy na uniwersalnych procesorach graficznych. Firma twierdzi, że sekret tkwi w precyzyjnym projektowaniu samego modelu i jego podstawowej architektury. To umożliwia skuteczne rozłożenie obciążenia i unikanie „wąskich gardeł” podczas przetwarzania danych, które zazwyczaj spowalniają pracę dużych sieci neuronowych.
Koszt i warunki dostępu
Jak to często bywa w świecie technologii zaawansowanych, za szybkość trzeba płacić. Korzystanie z API MiMo-V2.5-Pro w trybie UltraSpeed będzie dla deweloperów trzy razy droższe od standardowej stawki. To logiczne, ponieważ utrzymanie takiej wydajności wymaga znacznych zasobów obliczeniowych, które na rynku nadal są deficytowe.
Aby przetestować możliwości systemu, Xiaomi uruchamia okres próbny, który potrwa od 9 do 23 czerwca 2026 roku. Jednak nie wszyscy uzyskają dostęp. Priorytet będą mieli klienci korporacyjni i profesjonalni deweloperzy, którzy mają realne przypadki do zastosowania takiej mocy. Ci, którzy przejdą selekcję, otrzymają dwa tygodnie darmowego dostępu, ale z pewnymi ograniczeniami, by zachować sprawiedliwość:
- Nie więcej niż 10 żądań w kolejce na jedno konto dziennie.
- Czas trwania jednej sesji ograniczony do 30 minut.
- Automatyczne odłączenie i zwolnienie zasobów po 5 minutach bezczynności.
Czym jest MiMo i do czego jest nam potrzebne
Dla tych, którzy przegapili wcześniejsze wydania, przypominamy: Xiaomi MiMo to modele multimodalne o otwartym kodzie źródłowym. Potrafią pracować nie tylko z tekstem, ale także z obrazami i dźwiękiem. Główną cechą jest zdolność do symulacji logicznego myślenia w celu rozwiązywania złożonych zadań. Wcześniej firma udostępniła do użytku publicznego sieć neuronową MiMo-V2-Flash, która stała się bazą dla wielu projektów zewnętrznych.
Wprowadzenie trybu UltraSpeed sprawia, że te modele nadają się do scenariuszy, gdzie kluczowa jest natychmiastowa reakcja: od złożonych systemów tłumaczenia w czasie rzeczywistym po autonomicznych asystentów, którzy muszą analizować ogromne zbiory danych „na żywo”. Podczas gdy konkurenci starają się po prostu uczynić swoje AI mądrzejszymi, Xiaomi stawia na to, aby były też niesamowicie szybkie.
Podobne kroki optymalizacji kosztów i dostępności swoich usług podejmują też inni giganci rynku. Na przykład niedawno Google zaktualizowało AI Plus, obniżając cenę subskrypcji dla użytkowników Gemini i dodając bonusy w postaci przestrzeni w chmurze.