DeepSeek wprowadza ulepszoną wersję V3 AI trzy miesiące po pierwszym wydaniu

Chińska firma DeepSeek wydała zaktualizowaną wersję swojej sztucznej inteligencji językowej na dużą skalę, DeepSeek-V3-0324, zaledwie trzy miesiące po uruchomieniu pierwszej wersji V3 w grudniu 2024 roku.
Co wiadomo
Nowy model ma lepszą wydajność i możliwości, w tym tworzenie estetycznych stron internetowych i wysokiej jakości raportów w języku chińskim.
DeepSeek-V3-0324 przyciągnął uwagę zmniejszonymi wymaganiami sprzętowymi do treningu, krótszym czasem treningu i niższymi kosztami API przy wysokiej wydajności w porównaniu do konkurentów, takich jak GPT OpenAI.

Wydajność DeepSeek. Ilustracja: DeepSeek
Zaktualizowany model nie wymaga myślenia, co pozwala mu szybko udzielać odpowiedzi, bez zatrzymywania się na złożonych zadaniach, w przeciwieństwie do modelu DeepSeek R1. Nowa wersja ma rozmiar parametrów 685 miliardów, co czyni ją jednym z największych publicznie dostępnych modeli językowych.
DeepSeek-V3-0324 uzyskał od 5,3% do 19,8% wyższe wyniki w testach AI w porównaniu do poprzedniej wersji. Pod względem wydajności jest zbliżony do takich liderów jak GPT-4.5 i Claude Sonnet 3.7.
Ponadto zaktualizowana wersja wykazała poprawę w tworzeniu stron internetowych, a także w wyszukiwaniu, pisaniu i tłumaczeniu tekstów w języku chińskim.
Aby przetestować pełną wersję modelu, użytkownicy będą potrzebować co najmniej 700 GB wolnej przestrzeni dyskowej i kilku procesorów graficznych Nvidia A100/H100. Istnieją jednak również uproszczone wersje modelu, które mogą działać na jednym GPU, takim jak Nvidia 3090.
Źródło: DeepSeek