GenZ Viet
No Result
View All Result
  • Thành viên
    • Đăng nhập tài khoản
    • Đăng ký tài khoản mới
MXH GenZ Viet
No Result
View All Result
Trang chủ Chọn đồ mà chơi

Meta bị chỉ trích vì thao túng điểm chuẩn Llama 4

Meta lại trở thành tâm điểm tranh cãi sau màn ra mắt Llama 4, làm dấy lên nhiều hoài nghi và tranh luận trong cộng đồng AI toàn cầu.

Đăng bởi Phượng Trần
09/04/2025
Meta bị chỉ trích vì thao túng điểm chuẩn Llama 4
2
CHIA SẺ
3.3k
LƯỢT XEM
Share on FacebookShare on Twitter

Gần đây, Meta đã ra mắt mô hình AI Llama 4 và gây chú ý khi tuyên bố rằng phiên bản Llama 4 Maverick vượt qua GPT-4o và Gemini 2.0 Pro trên bảng xếp hạng Chatbot Arena. Theo Meta, mô hình này – với 17 tỷ tham số hoạt động từ tổng số 400 tỷ tham số – đạt điểm ELO 1.417, một thành tích đáng kinh ngạc.

Tuy nhiên, điều này ngay lập tức gây nghi ngờ trong cộng đồng AI. Làm sao một mô hình tương đối nhỏ lại có thể vượt qua những gã khổng lồ như GPT-4.5 và Grok 3? Các thử nghiệm độc lập sau đó đã phát hiện ra hiệu suất thực tế không khớp với kết quả mà Meta công bố, đặc biệt trong các nhiệm vụ lập trình.

Meta bị chỉ trích vì thao túng điểm chuẩn Llama 4

Làn sóng hoài nghi càng dâng cao khi một người tự xưng là cựu nhân viên Meta đăng tải thông tin rằng ban lãnh đạo công ty đã trộn “các bộ kiểm tra từ nhiều bộ điểm chuẩn vào quá trình huấn luyện sau” nhằm thổi phồng kết quả. Người này thậm chí còn liên kết việc từ chức gần đây của Joelle Pineau, Trưởng bộ phận nghiên cứu AI của Meta, với vụ việc này.

Đáp lại những cáo buộc, Ahmad Al-Dahle, người đứng đầu bộ phận AI tạo sinh của Meta, đã kiên quyết phủ nhận. Ông tuyên bố: “Chúng tôi sẽ không bao giờ huấn luyện trên các bộ kiểm tra” và cho rằng sự khác biệt về hiệu suất chỉ là vấn đề ổn định triển khai.

Meta bị chỉ trích vì thao túng điểm chuẩn Llama 4

LMSYS, tổ chức đứng sau Chatbot Arena, đã phải lên tiếng giải thích rằng mô hình được sử dụng là “Llama-4-Maverick-03-26-Experimental” – một biến thể tùy chỉnh được tối ưu hóa theo sở thích của người dùng. Họ thừa nhận rằng “phong cách và giọng điệu” có thể đã tạo lợi thế không công bằng cho mô hình này, đồng thời chỉ trích Meta đã không cung cấp thông tin đầy đủ về điều này.

Đáng chú ý, đây không phải lần đầu Meta bị cáo buộc thao túng điểm chuẩn. Vào tháng 2/2024, Susan Zhang, cựu nhà nghiên cứu AI tại Meta, hiện làm việc tại Google DeepMind, đã chia sẻ một nghiên cứu phát hiện hơn 50% mẫu kiểm tra từ các điểm chuẩn chính đã xuất hiện trong dữ liệu huấn luyện của Llama 1.

Meta bị chỉ trích vì thao túng điểm chuẩn Llama 4

Giữa làn sóng chỉ trích mới về Llama 4, Zhang đã mỉa mai rằng Meta ít nhất nên trích dẫn “công trình trước đó” của Llama 1 cho “cách tiếp cận độc đáo” này – ám chỉ việc thao túng điểm chuẩn có thể là chiến lược có chủ đích của công ty nhằm nâng cao chỉ số hiệu suất một cách giả tạo.

Có thể bạn sẽ thích

OPPO Pad 5 ra mắt, pin lớn, hỗ trợ AI
Chọn đồ mà chơi

OPPO Pad 5 ra mắt, pin lớn, hỗ trợ AI

13/01/2026
OPPO Watch S ra mắt với thiết kế siêu mỏng
Chọn đồ mà chơi

OPPO Watch S ra mắt với thiết kế siêu mỏng

13/01/2026
Motorola tung loa di động 30W kết hợp cùng Bose
Chọn đồ mà chơi

Motorola tung loa di động 30W kết hợp cùng Bose

12/01/2026
Xiaomi sẽ tự chủ với chip XRING 02 và hệ điều hành riêng
Chọn đồ mà chơi

Xiaomi sẽ “tự chủ” với chip XRING 02 và hệ điều hành riêng

12/01/2026
Tết này, đừng cất điện thoại để "kết nối", hãy dùng nó để "thấu hiểu": Khi Gemini AI tái hiện “điều cũ”
Chọn đồ mà chơi

Tết này, đừng cất điện thoại để “kết nối”, hãy dùng nó để “thấu hiểu”: Khi Gemini AI tái hiện “điều cũ”

12/01/2026
NVIDIA để ngỏ khả năng "hồi sinh" VGA đời cũ
Chọn đồ mà chơi

NVIDIA để ngỏ khả năng “hồi sinh” VGA đời cũ

12/01/2026
Please login to join discussion

Xu hướng tuần qua

  • Apple tung bản bảo mật iOS 26.3 (a): Không phải để vá lỗi

    Apple tung iOS 26.3 (a): Tăng bảo mật chứ không vá lỗi!

    2 chia sẻ
    Share 84 Tweet 52
  • Câu lệnh tạo ảnh thẻ cực chuyên nghiệp với Gemini AI

    2197 chia sẻ
    Share 879 Tweet 549
  • Prompt tạo ảnh chân dung cho nam cực ngầu với Gemini

    2 chia sẻ
    Share 59 Tweet 37
  • Gmail hào phóng tặng free người dùng 3 tính năng AI

    2 chia sẻ
    Share 80 Tweet 50
  • Prompt tạo ảnh đu trend “trạm tỷ” quá dễ cùng Gemini AI

    2 chia sẻ
    Share 241 Tweet 151
  • Chụp ảnh áo dài Tết không bon chen chỉ với Gemini AI

    2 chia sẻ
    Share 33 Tweet 21
Chốt Deal Cực Hời Minh Tuấn Mobile

Bài viết mới cập nhật

OPPO Pad 5 ra mắt, pin lớn, hỗ trợ AI

OPPO Pad 5 ra mắt, pin lớn, hỗ trợ AI

13/01/2026
OPPO Watch S ra mắt với thiết kế siêu mỏng

OPPO Watch S ra mắt với thiết kế siêu mỏng

13/01/2026
Motorola tung loa di động 30W kết hợp cùng Bose

Motorola tung loa di động 30W kết hợp cùng Bose

12/01/2026
Google Maps trên Android được "đại tu" sau nhiều năm

Google Maps trên Android được “đại tu” sau nhiều năm

12/01/2026
Xiaomi sẽ tự chủ với chip XRING 02 và hệ điều hành riêng

Xiaomi sẽ “tự chủ” với chip XRING 02 và hệ điều hành riêng

12/01/2026
cropped-genz-1.png

Mạng xã hội GenZ Việt
Giấy phép cung cấp dịch vụ MXH số: 4688/GXN-SVHTT do Sở Văn hoá và Thể thao Thành phố Hồ Chí Minh cấp ngày 04/10/2025
Chịu trách nhiệm nội dung: Phan Phước Quốc
Địa chỉ: 228 Bùi Hữu Nghĩa, Phường Gia Định, TP.HCM
Điện thoại: 0829.012.012
Liên hệ nội dung: quangcao@genz.com.vn

  • Thoả thuận người dùng
  • Tuyển dụng
  • Liên hệ
No Result
View All Result
  • Thành viên
    • Đăng nhập tài khoản
    • Đăng ký tài khoản mới

© 2022 GenZ. All right go to their respective owners