Theo DeepSeek, phiên bản Pro của mô hình mới vượt qua phần lớn các mô hình mã nguồn mở khác trên các bài kiểm tra kiến thức tổng hợp, chỉ xếp sau duy nhất Gemini-Pro-3.1 của Google, một mô hình đóng.
Hiện nay, đa số mô hình AI hàng đầu vẫn phụ thuộc vào chip của Nvidia. Vì vậy, việc DeepSeek chuyển hướng sang Huawei phản ánh đúng lo ngại mà CEO Nvidia Jensen Huang từng nêu: các biện pháp kiểm soát xuất khẩu của Mỹ có thể khiến hãng dần đánh mất hệ sinh thái nhà phát triển tại Trung Quốc.
“Ngày DeepSeek ưu tiên Huawei thay vì chúng tôi, đó sẽ là một kịch bản tồi tệ với Mỹ”, ông Huang nói trên một podcast trong tháng này.
Theo Lewis Tunstall, kỹ sư máy học tại Hugging Face, V4 là mô hình leo lên vị trí số 1 nhanh nhất trên nền tảng này. Mô hình đặc biệt mạnh ở việc xử lý các tác vụ văn bản dài và phức tạp với chi phí thấp hơn đáng kể so với các đối thủ, dù vẫn có hạn chế, chẳng hạn chưa hỗ trợ đa phương thức như hình ảnh hay video.
Mối liên kết chặt chẽ giữa Huawei và DeepSeek
DeepSeek đối mặt chỉ trích từ Washington và các đối thủ Mỹ, cho rằng thành công của hãng có thể dựa vào việc tận dụng công nghệ Mỹ không phù hợp. Công ty thừa nhận từng sử dụng chip Nvidia nhưng không làm rõ có chịu hạn chế xuất khẩu hay không, đồng thời phủ nhận việc cố ý dùng dữ liệu tổng hợp từ OpenAI.
Việc ra mắt diễn ra chỉ một ngày sau khi Nhà Trắng cáo buộc Trung Quốc đánh cắp tài sản trí tuệ của các phòng thí nghiệm AI Mỹ “ở quy mô công nghiệp”, và trước chuyến thăm dự kiến của Tổng thống Donald Trump tới Bắc Kinh vào tháng tới để gặp Chủ tịch Tập Cận Bình.
Trước đó, chính quyền Trump đã bật đèn xanh cho phép bán chip H200 của Nvidia tại Trung Quốc từ tháng 1, nhưng theo các nguồn tin, việc giao hàng vẫn bị đình trệ do bất đồng điều khoản giữa hai bên.
Cổ phiếu các nhà sản xuất chip Trung Quốc tăng mạnh nhờ kỳ vọng sử dụng rộng rãi hơn chip nội địa, với Huahong Semiconductor và SMIC lần lượt tăng 15% và 10%. Trong khi đó, cổ phiếu Nvidia cũng đi lên khi Intel đưa ra dự báo doanh thu và lợi nhuận vượt kỳ vọng, củng cố niềm tin rằng làn sóng AI vẫn chưa hạ nhiệt.
DeepSeek đối mặt cạnh tranh khốc liệt
Nhiều chính phủ phương Tây và một số nước châu Á đã cấm cơ quan nhà nước sử dụng DeepSeek vì lo ngại về bảo mật dữ liệu. Tuy vậy, các mô hình của công ty vẫn nằm trong nhóm được sử dụng nhiều nhất trên các nền tảng mã nguồn mở toàn cầu.
Tại Trung Quốc, dù từng vươn lên vị thế “nhà vô địch quốc gia”, lợi thế của DeepSeek đã bị bào mòn bởi sự nổi lên của hàng loạt đối thủ nội địa. Sau khi V4 ra mắt, cổ phiếu các đối thủ như Zhipu AI và MiniMax đồng loạt giảm 9%.
DeepSeek cho biết V4 đặc biệt phù hợp với các hệ thống AI agent, có thể thực hiện các tác vụ phức tạp hơn chatbot nhưng đòi hỏi năng lực tính toán cao hơn.
Tuy nhiên, mức độ thành công thực tế vẫn còn bỏ ngỏ.
“Kết quả benchmark ban đầu rất ấn tượng, nhưng cần thận trọng cho đến khi có đánh giá độc lập và thử nghiệm thực tế rộng rãi”, Daniel Dewhurst, một kỹ sư AI, nhận định.
Điểm đáng chú ý là V4 cho thấy các mô hình mở đang dần thu hẹp khoảng cách với mô hình đóng, đặc biệt về chi phí, khả năng xử lý ngữ cảnh dài và lập trình.
Mô hình này có thể xử lý hơn 1 triệu token, ngang với cửa sổ ngữ cảnh của GPT-5.4 từ OpenAI và Claude Opus 4.6 từ Anthropic, nhưng chỉ cần một phần nhỏ tài nguyên tính toán.
Bên cạnh đó, DeepSeek còn tung ra phiên bản Flash với chi phí thấp hơn. Các bản preview sẽ giúp công ty thu thập phản hồi thực tế trước khi hoàn thiện sản phẩm, dù chưa công bố thời điểm ra mắt chính thức.
Thuộc sở hữu của High-Flyer Capital Management, DeepSeek đang tìm cách gọi vốn với định giá vượt 20 tỷ USD. Theo The Information, Alibaba và Tencent được cho là đang đàm phán để tham gia đầu tư.
Theo Reuters