Google DeepMind vừa giới thiệu DiffusionGemma, mô hình AI thử nghiệm mới thuộc dòng Gemma 4 với cách tạo văn bản hoàn toàn khác so với các chatbot hiện nay.
Thay vì sinh nội dung theo từng từ hoặc từng cụm từ từ trái sang phải, DiffusionGemma áp dụng cơ chế “khuếch tán” (diffusion) tương tự các mô hình tạo ảnh AI. Mô hình bắt đầu từ dữ liệu tạm thời, sau đó liên tục tinh chỉnh để tạo ra văn bản hoàn chỉnh.
Theo Google, phương pháp này cho phép AI xử lý nhiều phần nội dung cùng lúc, giúp tăng đáng kể tốc độ phản hồi khi chạy trực tiếp trên máy tính hoặc hệ thống AI cục bộ.
DiffusionGemma sở hữu 26 tỷ tham số nhưng chỉ kích hoạt khoảng 3,8 tỷ tham số trong quá trình xử lý, giúp tối ưu hiệu suất và giảm yêu cầu phần cứng. Trong các thử nghiệm nội bộ, mô hình đạt tốc độ khoảng 700 token/giây trên card đồ họa Nvidia RTX 5090 và vượt 1.000 token/giây trên bộ tăng tốc AI Nvidia H100, nhanh gấp khoảng 4 lần so với các mô hình Gemma truyền thống cùng quy mô.

Google cho biết DiffusionGemma phù hợp với các tác vụ như chỉnh sửa văn bản trực tiếp, phân tích dữ liệu phức tạp hoặc những bài toán đòi hỏi nhiều vòng tự điều chỉnh.
Dù vậy, hãng cũng lưu ý đây vẫn là một mô hình thử nghiệm. Khác với hình ảnh, chỉ một lỗi nhỏ trong quá trình tạo văn bản có thể làm thay đổi ý nghĩa của cả câu hoặc đoạn nội dung.
DiffusionGemma hiện được phát hành theo giấy phép mã nguồn mở Apache 2.0 và đã có mặt trên nền tảng Hugging Face để cộng đồng nghiên cứu, phát triển thử nghiệm.






