DeepSeek wprowadza ulepszoną wersję V3 AI trzy miesiące po pierwszym wydaniu

Aktualizacja: 29.03.2025, 06:28

Chińska firma DeepSeek wydała zaktualizowaną wersję swojej sztucznej inteligencji językowej na dużą skalę, DeepSeek-V3-0324, zaledwie trzy miesiące po uruchomieniu pierwszej wersji V3 w grudniu 2024 roku.

Co wiadomo

Nowy model ma lepszą wydajność i możliwości, w tym tworzenie estetycznych stron internetowych i wysokiej jakości raportów w języku chińskim.

DeepSeek-V3-0324 przyciągnął uwagę zmniejszonymi wymaganiami sprzętowymi do treningu, krótszym czasem treningu i niższymi kosztami API przy wysokiej wydajności w porównaniu do konkurentów, takich jak GPT OpenAI.

Wydajność DeepSeek. Ilustracja: DeepSeek

Zaktualizowany model nie wymaga myślenia, co pozwala mu szybko udzielać odpowiedzi, bez zatrzymywania się na złożonych zadaniach, w przeciwieństwie do modelu DeepSeek R1. Nowa wersja ma rozmiar parametrów 685 miliardów, co czyni ją jednym z największych publicznie dostępnych modeli językowych.

DeepSeek-V3-0324 uzyskał od 5,3% do 19,8% wyższe wyniki w testach AI w porównaniu do poprzedniej wersji. Pod względem wydajności jest zbliżony do takich liderów jak GPT-4.5 i Claude Sonnet 3.7.

Ponadto zaktualizowana wersja wykazała poprawę w tworzeniu stron internetowych, a także w wyszukiwaniu, pisaniu i tłumaczeniu tekstów w języku chińskim.

Aby przetestować pełną wersję modelu, użytkownicy będą potrzebować co najmniej 700 GB wolnej przestrzeni dyskowej i kilku procesorów graficznych Nvidia A100/H100. Istnieją jednak również uproszczone wersje modelu, które mogą działać na jednym GPU, takim jak Nvidia 3090.

Źródło: DeepSeek