Google vừa công bố ra mắt AI Gemma 3 được phát triển trên nền tảng công nghệ của Gemini 2.0. Tuy nhiên, mô hình này tối ưu hơn về tính linh hoạt và kích thước. Gemma 3 có thể phân tích văn bản, hình ảnh, video ngắn, và hỗ trợ tới 35 ngôn ngữ.
Mô hình lớn nhất của Gemma 3 có 27 tỷ tham số (27B) nhưng chỉ cần một GPU Nvidia H100 để vận hành. Các phiên bản nhỏ hơn có thể chạy trên smartphone hoặc laptop thông thường.
CEO Google Sundar Pichai khẳng định: “Bạn cần khả năng tính toán gấp 10 lần để đạt hiệu suất tương tự từ các mô hình khác”. Điều này nhấn mạnh hiệu quả vượt trội của Gemma 3.
Clement Farabet, Giám đốc sản phẩm Google DeepMind, cho biết Gemma 3 rất nhẹ, hiệu quả và linh hoạt. Điều này giúp các nhà phát triển dễ dàng xây dựng ứng dụng AI. Đặc biệt, mô hình này phù hợp với các quốc gia có hạ tầng công nghệ hạn chế.
Gemma 3 có nhiều tùy chọn quy mô, gồm 1B, 4B, 12B và 27B. Người dùng có thể lựa chọn theo nhu cầu phần cứng và hiệu suất mong muốn.
Dù mạnh mẽ, Gemma 3 vẫn tiêu tốn ít tài nguyên hơn nhiều đối thủ như Llama-405B, DeepSeek V3 hay o3-mini. Hiện tại, nó chỉ xếp sau R1 của DeepSeek trên bảng xếp hạng LMArena.
Google cũng ra mắt ShieldGemma 2, công cụ kiểm tra độ an toàn hình ảnh tích hợp với Gemma 3. Công cụ này giúp nhận diện nội dung không phù hợp, đảm bảo an toàn cho người dùng.
Với Gemma 3, Google tiếp tục thúc đẩy phổ cập AI, cung cấp công cụ nguồn mở, giúp mở rộng ứng dụng AI trên toàn cầu.