Chińczycy mogą wstrząsnąć rynkiem. Nadciąga DeepSeek R2

Chińska firma DeepSeek przygotowuje się do kolejnej premiery. W sieci pojawiły się pierwsze informacje na temat nowego modelu, który ma być tani i wydajny.

Przemysław Banasiak (Yokai)
0
Udostępnij na fb
Udostępnij na X
Chińczycy mogą wstrząsnąć rynkiem. Nadciąga DeepSeek R2

Poprzedni model DeepSeek R1 udowodnił, że Chiny nie pozostają daleko w tyle w wyścigu o rozwój sztucznej inteligencji. Jego debiut zaskoczył zachodni świat, doprowadzając do spadków na amerykańskich giełdach i pokazując, że tworzenie LLM wcale nie musi generować gigantycznych kosztów, jak wcześniej sugerowały firmy takie jak OpenAI.

Dalsza część tekstu pod wideo

DeepSeek korzysta na szeroką skalę z układów Huawei Ascend 910B

Teraz chińskie media donoszą, że DeepSeek przygotowuje kolejny przełom - model R2. Według niepotwierdzonych informacji, ma on wykorzystywać hybrydową architekturę Mixture of Experts (tzw. MoE) w zaawansowanej wersji z ulepszonymi mechanizmami selekcji. Nowy model ma mieć aż 1,2 biliona parametrów, czyli dwukrotnie więcej niż jego poprzednik.

Specyfikacja ta plasuje R2 w bezpośredniej konkurencji z OpenAI GPT-4 Turbo czy Google Gemini 2.0 Pro. Jednak DeepSeek nie zamierza konkurować tylko jakością - podobno koszt jednostkowy przetwarzania tokenów w R2 będzie niższy o aż 97,4% w porównaniu do GPT-4.

Przy stawkach rzędu 26 groszy za milion tokenów wejściowych i złotówki za milion tokenów wyjściowych, DeepSeek R2 może stać się najbardziej opłacalnym rozwiązaniem na rynku, co z pewnością zainteresuje przedsiębiorstwa szukające tańszych alternatyw.

Warto jednak pamiętać, że na razie są to informacje nieoficjalne i finalna wersja R2 może się różnić od obecnych spekulacji. Jeśli jednak doniesienia się potwierdzą, DeepSeek ponownie może zaskoczyć światową branżę AI.