Vi xử lý Tensor G5, niềm hy vọng mới của Google, dường như lại gây thất vọng khi liên tục gặp vấn đề về sụt giảm hiệu năng (throttling), khiến giới công nghệ và người dùng không khỏi đặt câu hỏi. Nguyên nhân sâu xa có lẽ không nằm ở một linh kiện đơn lẻ, mà đến từ chính triết lý thiết kế “chắp vá” mà Google đang theo đuổi.
“Mổ xẻ” kiến trúc bên trong Tensor G5
Để hiểu rõ hơn, hãy cùng xem xét cấu trúc phần cứng của Tensor G5:
- CPU 8 nhân:
- 1 nhân hiệu năng cao Cortex-X4 (3.78 GHz)
- 5 nhân hiệu năng trung bình Cortex-A725 (3.05 GHz)
- 2 nhân tiết kiệm điện Cortex-A520 (2.25 GHz)
- TPU (Tensor Processing Unit): Thế hệ thứ năm, chuyên xử lý các tác vụ AI và máy học.
- GPU (Graphics Processing Unit): Imagination IMG DXT-48-1536, một GPU tích hợp thuộc dòng PowerVR, chạy ở xung nhịp 1.10 GHz. Về lý thuyết, hiệu năng của nó ngang ngửa các GPU di động cao cấp như Adreno 732/740 hay ARM Mali G715 MP7, nhưng lại thiếu hỗ trợ công nghệ ray-tracing.
- Modem: Samsung Exynos 5G.
Toàn bộ con chip được sản xuất trên tiến trình 3nm tiên tiến của TSMC, hứa hẹn mật độ bóng bán dẫn cao hơn cùng hiệu suất và khả năng tiết kiệm năng lượng vượt trội.
Vấn đề đến từ triết lý thiết kế thiếu đồng bộ
Thực tế cho thấy, Tensor G5 rất dễ bị quá nhiệt và “bóp hiệu năng”, ảnh hưởng nghiêm trọng đến trải nghiệm, đặc biệt là khi chơi game. Nhiều người đã nhanh chóng đổ lỗi cho việc Google chuyển từ GPU ARM Mali sang Imagination IMG, nhưng vấn đề không đơn giản như vậy.
Bằng chứng là ngay cả khi giả lập PlayStation 2 – một tác vụ vốn nặng về CPU hơn là GPU – hiện tượng sụt giảm hiệu năng vẫn xảy ra. Điều này cho thấy “thủ phạm” thực sự có thể là cách tiếp cận thiếu đồng bộ của Google trong việc phát triển con chip của mình.
Để thấy rõ sự khác biệt, hãy nhìn sang đối thủ Qualcomm Snapdragon 8 Elite Gen 5, con chip dễ dàng vượt qua Tensor G5 trong các bài kiểm tra hiệu năng. Bí quyết của Qualcomm nằm ở việc họ không dùng nhân CPU “nguyên bản” của Arm. Thay vào đó, họ đầu tư phát triển nhân Oryon tùy chỉnh, với nhân chính đạt xung nhịp lên tới 4.60 GHz và các nhân hiệu năng cao khác cũng chạm mốc 3.62 GHz.
Tất nhiên, xung nhịp cao không phải là tất cả. Qualcomm còn thực hiện nhiều tối ưu hóa sâu hơn, điển hình là tăng cường bộ nhớ đệm L2 (mỗi cụm nhân đều có 12 MB). Trong khi đó, Tensor G5 của Google chỉ đơn giản là sử dụng các nhân Arm Cortex tiêu chuẩn mà không có sự tinh chỉnh sâu để chúng phối hợp nhịp nhàng nhất trong hệ sinh thái của Pixel 10.
Câu chuyện tương tự cũng xảy ra với GPU. Mặc dù Google hợp tác chặt chẽ với Imagination để phát triển GPU IMG DXT-48-1536, quyền kiểm soát các trình điều khiển (driver) cốt lõi vẫn nằm trong tay Imagination. Điều này đồng nghĩa với việc Google chỉ có thể tinh chỉnh ở mức độ bề mặt, đặc biệt là các khía cạnh liên quan đến AI và quản lý năng lượng. Trong khi đó, những cập nhật sâu hơn về hiệu năng và mã nguồn vẫn phụ thuộc hoàn toàn vào đối tác. Một lần nữa, sự thiếu tự chủ trong các thành phần cốt lõi lại lộ rõ.
Lời kết
Nói một cách hình ảnh, chiến lược thiết kế chip của Google giống như mua một bộ vest may sẵn và chỉ sửa lại đôi chút cho vừa người. Nó vẫn dùng được, nhưng không bao giờ có được sự vừa vặn, tinh xảo và đẳng cấp của một bộ vest được may đo riêng.
Chừng nào Google còn đặt nặng bài toán chi phí hơn là sự tối ưu hóa đồng bộ từ gốc, vi xử lý Tensor của họ có lẽ sẽ còn phải tiếp tục “hụt hơi” trong cuộc đua hiệu năng thô với các đối thủ, dù cho nó sở hữu những công nghệ AI và TPU đầy hứa hẹn.