Startup Trung Quốc DeepSeek đang chuẩn bị ra mắt AI agent thế hệ tiếp theo vào cuối năm 2025, theo báo cáo của Bloomberg. Công ty có trụ sở tại Hàng Châu đang phát triển một hệ thống có khả năng thực hiện các nhiệm vụ phức tạp, nhiều bước chỉ với tối thiểu sự can thiệp từ người dùng. Đặc biệt, mô hình này được thiết kế để học hỏi từ các hành động trước đó nhằm liên tục cải thiện hiệu suất.
DeepSeek đã gây chấn động toàn cầu vào đầu năm nay khi ra mắt mô hình R1 – một hệ thống thể hiện khả năng suy luận tiên tiến nhưng chỉ tốn khoảng 6 triệu USD để phát triển, thấp hơn đáng kể so với các đối thủ như ChatGPT của OpenAI hay Gemini của Google. Điểm đặc biệt là R1 hoàn toàn mã nguồn mở, cho phép các nhà phát triển truy cập tự do vào mã nguồn. Việc ra mắt này đã thách thức triết lý “càng lớn càng tốt” thống trị tại Silicon Valley, nơi ngân sách khổng lồ và tập dữ liệu siêu lớn từng được coi là chìa khóa thành công trong phát triển AI.
Kể từ thành công của R1, DeepSeek đã áp dụng chiến lược thận trọng hơn. Nhà sáng lập Liang Wenfeng quyết định hoãn phát hành mô hình R2, được cho là để tinh chỉnh kỹ thuật và do công việc đang tiếp diễn tại High-Flyer Asset Management. Nhịp độ có tính toán này tạo nên sự khác biệt rõ rệt so với các đối thủ như Alibaba và Tencent – những công ty đang tăng tốc mạnh mẽ trong việc triển khai các giải pháp AI riêng.
Tháng trước, DeepSeek tung ra bản cập nhật V3.1 với những cải tiến đáng kể: mở rộng context window lên 128.000 token và tăng số lượng tham số lên 685 tỷ. Công ty cũng áp dụng chính sách nhãn bắt buộc cho mọi nội dung do AI tạo ra – một biện pháp không thể vô hiệu hóa và tạo nên dấu ấn riêng biệt so với các đối thủ.
AI Agent chính là mục tiêu mới của DeepSeek
Mô hình R2 sắp tới nhắm đến thị trường AI agent đang bùng nổ. Khác với chatbot truyền thống chỉ cung cấp phản hồi văn bản, các agent được thiết kế để xử lý những nhiệm vụ phức tạp như lập kế hoạch du lịch, gỡ lỗi phần mềm và tối ưu hóa quy trình kinh doanh với mức độ giám sát tối thiểu từ con người. Giới phân tích đánh giá đây là bước tiến quan trọng tiếp theo trong lĩnh vực AI, hứa hẹn thúc đẩy năng suất và tái định hình toàn bộ hệ sinh thái dịch vụ số.
Trong bối cảnh các đối thủ toàn cầu như OpenAI, Microsoft và Anthropic đã tung ra những tính năng tập trung vào agent, DeepSeek đặt mục tiêu không chỉ theo kịp mà còn vượt qua những nỗ lực này, tiếp tục khẳng định tham vọng thách thức sự thống trị AI của Mỹ.
Mặc dù các thông tin chi tiết về giá cả, khả năng tiếp cận và thông số kỹ thuật vẫn được giữ kín, giới quan sát ngành công nghệ dự đoán việc ra mắt sẽ được theo dõi sát sao tại cả Silicon Valley lẫn Washington – nơi tốc độ phát triển vượt bậc của DeepSeek đã làm dấy lên những lo ngại về ảnh hưởng ngày càng gia tăng của Trung Quốc trong cuộc đua trí tuệ nhân tạo toàn cầu.