Theo BGR, nhu cầu AI tăng mạnh đang đẩy giá RAM toàn cầu đi lên, kéo theo chi phí của máy tính, máy chơi game và TV thông minh. Tuy nhiên, Google vừa giới thiệu thuật toán nén mới mang tên TurboQuant, được kỳ vọng giúp AI sử dụng bộ nhớ hiệu quả hơn.
Ông Matthew Prince, CEO Cloudflare, đánh giá TurboQuant có thể cải thiện đáng kể cách huấn luyện và vận hành các mô hình ngôn ngữ lớn (LLM), nhờ tối ưu cách lưu trữ dữ liệu trong bộ nhớ.
Cụ thể, công nghệ này tập trung vào việc nén và quản lý bộ nhớ đệm “key-value” – thành phần lưu trữ ngữ cảnh giúp AI tránh phải tính toán lại. Nếu được tối ưu, hệ thống có thể giảm đáng kể nhu cầu RAM trong các trung tâm dữ liệu, qua đó góp phần hạ nhiệt giá linh kiện.
Tuy vậy, TurboQuant hiện vẫn ở giai đoạn nghiên cứu và chưa được triển khai rộng rãi. Trong khi đó, cuộc đua phát triển AI từ các hãng như OpenAI tiếp tục làm gia tăng nhu cầu bộ nhớ.

Giới chuyên gia nhận định, nếu công nghệ của Google thành công, áp lực lên thị trường RAM có thể giảm trong tương lai. Nhưng ở thời điểm hiện tại, tác động vẫn chưa rõ ràng khi nhu cầu AI vẫn tăng nhanh.









