No Result
View All Result
XU HƯỚNG
  • Game mobile
  • Smartphone
  • Laptop
  • Galaxy A56 5G
  • Galaxy A 2025
GenZ Viet
  • Chọn lựa lối sống
  • Chọn đồ mà chơi
  • Chọn mẹo để học
  • Chọn game để chơi
  • Chọn xe để chạy
GenZ Viet
  • Chọn lựa lối sống
  • Chọn đồ mà chơi
  • Chọn mẹo để học
  • Chọn game để chơi
  • Chọn xe để chạy
No Result
View All Result
GenZ Viet
No Result
View All Result
Trang chủ Chọn đồ mà chơi

Meta bị chỉ trích vì thao túng điểm chuẩn Llama 4

Meta lại trở thành tâm điểm tranh cãi sau màn ra mắt Llama 4, làm dấy lên nhiều hoài nghi và tranh luận trong cộng đồng AI toàn cầu.

Đăng bởi Kayden
09/04/2025
Meta bị chỉ trích vì thao túng điểm chuẩn Llama 4
2
CHIA SẺ
3.3k
LƯỢT XEM
Share on FacebookShare on Twitter

Gần đây, Meta đã ra mắt mô hình AI Llama 4 và gây chú ý khi tuyên bố rằng phiên bản Llama 4 Maverick vượt qua GPT-4o và Gemini 2.0 Pro trên bảng xếp hạng Chatbot Arena. Theo Meta, mô hình này – với 17 tỷ tham số hoạt động từ tổng số 400 tỷ tham số – đạt điểm ELO 1.417, một thành tích đáng kinh ngạc.

Tuy nhiên, điều này ngay lập tức gây nghi ngờ trong cộng đồng AI. Làm sao một mô hình tương đối nhỏ lại có thể vượt qua những gã khổng lồ như GPT-4.5 và Grok 3? Các thử nghiệm độc lập sau đó đã phát hiện ra hiệu suất thực tế không khớp với kết quả mà Meta công bố, đặc biệt trong các nhiệm vụ lập trình.

Meta bị chỉ trích vì thao túng điểm chuẩn Llama 4

Làn sóng hoài nghi càng dâng cao khi một người tự xưng là cựu nhân viên Meta đăng tải thông tin rằng ban lãnh đạo công ty đã trộn “các bộ kiểm tra từ nhiều bộ điểm chuẩn vào quá trình huấn luyện sau” nhằm thổi phồng kết quả. Người này thậm chí còn liên kết việc từ chức gần đây của Joelle Pineau, Trưởng bộ phận nghiên cứu AI của Meta, với vụ việc này.

Đáp lại những cáo buộc, Ahmad Al-Dahle, người đứng đầu bộ phận AI tạo sinh của Meta, đã kiên quyết phủ nhận. Ông tuyên bố: “Chúng tôi sẽ không bao giờ huấn luyện trên các bộ kiểm tra” và cho rằng sự khác biệt về hiệu suất chỉ là vấn đề ổn định triển khai.

Meta bị chỉ trích vì thao túng điểm chuẩn Llama 4

LMSYS, tổ chức đứng sau Chatbot Arena, đã phải lên tiếng giải thích rằng mô hình được sử dụng là “Llama-4-Maverick-03-26-Experimental” – một biến thể tùy chỉnh được tối ưu hóa theo sở thích của người dùng. Họ thừa nhận rằng “phong cách và giọng điệu” có thể đã tạo lợi thế không công bằng cho mô hình này, đồng thời chỉ trích Meta đã không cung cấp thông tin đầy đủ về điều này.

Đáng chú ý, đây không phải lần đầu Meta bị cáo buộc thao túng điểm chuẩn. Vào tháng 2/2024, Susan Zhang, cựu nhà nghiên cứu AI tại Meta, hiện làm việc tại Google DeepMind, đã chia sẻ một nghiên cứu phát hiện hơn 50% mẫu kiểm tra từ các điểm chuẩn chính đã xuất hiện trong dữ liệu huấn luyện của Llama 1.

Meta bị chỉ trích vì thao túng điểm chuẩn Llama 4

Giữa làn sóng chỉ trích mới về Llama 4, Zhang đã mỉa mai rằng Meta ít nhất nên trích dẫn “công trình trước đó” của Llama 1 cho “cách tiếp cận độc đáo” này – ám chỉ việc thao túng điểm chuẩn có thể là chiến lược có chủ đích của công ty nhằm nâng cao chỉ số hiệu suất một cách giả tạo.

Có thể bạn sẽ thích

Dreame ra mắt loạt thiết bị thông minh thế hệ mới tại IFA 2025
Chọn đồ mà chơi

Dreame ra mắt loạt thiết bị thông minh thế hệ mới tại IFA 2025

07/09/2025
DeepSeek thách thức OpenAI với AI agent vào cuối 2025
Chọn đồ mà chơi

DeepSeek thách thức OpenAI với AI agent vào cuối 2025

07/09/2025
Đánh giá chi tiết laptop AI ASUS Vivobook M3407KA
Chọn đồ mà chơi

ASUS Vivobook M3407KA – “Chuẩn gu” Gen Z: Mỏng nhẹ, pin khỏe, màn OLED

06/09/2025
Galaxy S26 Ultra sẽ có thiết kế bo tròn hơn
Chọn đồ mà chơi

Galaxy S26 Ultra sẽ có thiết kế “bo tròn”?

06/09/2025
Mưa Sài Gòn bất chợt, sinh viên thì bất chấp với bộ đôi Galaxy A17 5G & Galaxy A07!
Chọn đồ mà chơi

Mưa Sài Gòn bất chợt, sinh viên thì bất chấp với bộ đôi Galaxy A17 5G & Galaxy A07!

05/09/2025
Galaxy S25 FE: Camera “đỉnh” chuẩn flagship với Provisual Engine
Chọn đồ mà chơi

Galaxy S25 FE: Camera “đỉnh” chuẩn flagship với Provisual Engine

05/09/2025

Để lại một bình luận Hủy

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Xu hướng tuần qua

  • iPhone 17 Pro Max ra mắt 10/9: Giá từ 34 triệu đồng, nên mua không? (Cập nhật liên tục)

    iPhone 17 Pro Max ra mắt 10/9: Giá từ 34 triệu đồng, nên mua không? (Cập nhật liên tục)

    5 chia sẻ
    Share 311 Tweet 195
  • Lộ bảng giá bán iPhone 17 Series: Tin vui cho người dùng!

    2 chia sẻ
    Share 60 Tweet 37
  • Galaxy S26 Ultra sẽ có thiết kế “bo tròn”?

    2 chia sẻ
    Share 59 Tweet 37
  • iPad Mini 8 sẽ có 2 nâng cấp đáng giá

    2 chia sẻ
    Share 88 Tweet 55
  • Grab bác bỏ báo cáo thị trường taxi của Mordor Intelligence

    2 chia sẻ
    Share 175 Tweet 110
  • ASUS Vivobook M3407KA – “Chuẩn gu” Gen Z: Mỏng nhẹ, pin khỏe, màn OLED

    2 chia sẻ
    Share 220 Tweet 138
Đại Hải Trình GenZ

Bài viết mới cập nhật

Dreame ra mắt loạt thiết bị thông minh thế hệ mới tại IFA 2025

Dreame ra mắt loạt thiết bị thông minh thế hệ mới tại IFA 2025

07/09/2025
Giải vô địch PUBG MOBILE Đông Nam Á Mùa Thu 2025 khởi tranh tại Thái Lan

Giải vô địch PUBG MOBILE Đông Nam Á Mùa Thu 2025 khởi tranh tại Thái Lan

07/09/2025
Samsung công bố tầm nhìn “AI Home: Tương lai của cuộc sống, ngay hôm nay” tại IFA 2025

Samsung công bố tầm nhìn “AI Home: Tương lai của cuộc sống, ngay hôm nay” tại IFA 2025

07/09/2025
DeepSeek thách thức OpenAI với AI agent vào cuối 2025

DeepSeek thách thức OpenAI với AI agent vào cuối 2025

07/09/2025
Đánh giá chi tiết laptop AI ASUS Vivobook M3407KA

ASUS Vivobook M3407KA – “Chuẩn gu” Gen Z: Mỏng nhẹ, pin khỏe, màn OLED

06/09/2025
cropped-genz-1.png
  • Liên hệ
  • Chính sách bảo mật
  • Tuyển dụng

GENZ: Trang công nghệ dành cho Giới trẻ
Địa chỉ: Lầu 4, 228 Bùi Hữu Nghĩa, Phường Gia Định, TP.HCM
Điện thoại: 0829.012.012
Liên hệ nội dung: quangcao@genz.com.vn

No Result
View All Result
  • Chọn lựa lối sống
  • Chọn đồ mà chơi
  • Chọn mẹo để học
  • Chọn game để chơi
  • Chọn xe để chạy

© 2022 GenZ. All right go to their respective owners