Chińczycy mogą wstrząsnąć rynkiem. Nadciąga DeepSeek R2
Chińska firma DeepSeek przygotowuje się do kolejnej premiery. W sieci pojawiły się pierwsze informacje na temat nowego modelu, który ma być tani i wydajny.

Poprzedni model DeepSeek R1 udowodnił, że Chiny nie pozostają daleko w tyle w wyścigu o rozwój sztucznej inteligencji. Jego debiut zaskoczył zachodni świat, doprowadzając do spadków na amerykańskich giełdach i pokazując, że tworzenie LLM wcale nie musi generować gigantycznych kosztów, jak wcześniej sugerowały firmy takie jak OpenAI.
DeepSeek korzysta na szeroką skalę z układów Huawei Ascend 910B
Teraz chińskie media donoszą, że DeepSeek przygotowuje kolejny przełom - model R2. Według niepotwierdzonych informacji, ma on wykorzystywać hybrydową architekturę Mixture of Experts (tzw. MoE) w zaawansowanej wersji z ulepszonymi mechanizmami selekcji. Nowy model ma mieć aż 1,2 biliona parametrów, czyli dwukrotnie więcej niż jego poprzednik.



Specyfikacja ta plasuje R2 w bezpośredniej konkurencji z OpenAI GPT-4 Turbo czy Google Gemini 2.0 Pro. Jednak DeepSeek nie zamierza konkurować tylko jakością - podobno koszt jednostkowy przetwarzania tokenów w R2 będzie niższy o aż 97,4% w porównaniu do GPT-4.
Przy stawkach rzędu 26 groszy za milion tokenów wejściowych i złotówki za milion tokenów wyjściowych, DeepSeek R2 może stać się najbardziej opłacalnym rozwiązaniem na rynku, co z pewnością zainteresuje przedsiębiorstwa szukające tańszych alternatyw.
Warto jednak pamiętać, że na razie są to informacje nieoficjalne i finalna wersja R2 może się różnić od obecnych spekulacji. Jeśli jednak doniesienia się potwierdzą, DeepSeek ponownie może zaskoczyć światową branżę AI.