Mô hình AI Trung Quốc đánh bại cả OpenAI và Google

Thị trường tiêu dùng 28/05/2026 11:47

Alibaba đang nổi lên như một đối thủ đáng gờm trong lĩnh vực AI viết mã khi Qwen3.7-Max lọt top 5 toàn cầu trên bảng xếp hạng Code Arena.

Mô hình AI mới nhất của Alibaba vừa giành vị trí hàng đầu trên một bảng xếp hạng lập trình uy tín toàn cầu, giúp tập đoàn công nghệ Trung Quốc trở thành nhà phát triển duy nhất ngoài Anthropic góp mặt trong top 5.

Qwen3.7-Max – mô hình AI mới nhất của Alibaba – đạt 1.541 điểm trên bảng xếp hạng Code Arena, qua đó đứng thứ 4 toàn cầu và vượt qua nhiều mô hình cạnh tranh từ OpenAI và Google. Bốn vị trí còn lại trong top 5 đều thuộc về các phiên bản Claude của Anthropic – công ty AI đang nổi lên tại Mỹ.

Kết quả này xuất hiện trong bối cảnh các công ty AI Trung Quốc ngày càng chuyển hướng từ chatbot đa năng sang các tác nhân AI chuyên viết mã và hệ thống tự động hóa, lĩnh vực được giới đầu tư đánh giá là ứng dụng thương mại tiềm năng nhất của AI.

anh-chup-man-hinh-2026-05-28-103440_1779939382.png
Mô hình AI mới của Alibaba vượt mặt đối thủ OpenAI và Google trên bảng xếp hạng lập trình.

Khác với các bộ đánh giá lập trình truyền thống như HumanEval hay SWE-bench, vốn dựa trên các bài kiểm tra chuẩn hóa, Code Arena cho phép người dùng kiểm tra khả năng của mô hình trong việc tự xây dựng hoàn chỉnh các ứng dụng web tương tác từ đầu dựa trên yêu cầu đầu vào.

Người dùng sau đó sẽ bỏ phiếu cho những kết quả đầu ra đã được ẩn danh trong các cuộc so sánh “mù”, giúp bảng xếp hạng phản ánh sát hơn nhu cầu thực tế của giới lập trình viên.

Bảng xếp hạng này được vận hành bởi Arena – tổ chức do các nhà nghiên cứu từ Đại học California, Berkeley sáng lập, phối hợp cùng Đại học California San Diego và Đại học Carnegie Mellon.

AI viết mã trở thành chiến trường mới

Sự tập trung ngày càng lớn của ngành công nghệ vào mảng lập trình AI diễn ra sau thành công của các công ty Mỹ như Anthropic, khi mô hình Claude cùng tính năng hỗ trợ viết mã trở thành một trong những sản phẩm AI đầu tiên cho thấy khả năng giữ chân người dùng và tạo doanh thu ổn định.

Khảo sát do Stack Overflow – nền tảng hỏi đáp phổ biến dành cho lập trình viên – thực hiện năm ngoái cho thấy 84% nhà phát triển đã hoặc có kế hoạch sử dụng công cụ AI, trong khi 51% lập trình viên chuyên nghiệp sử dụng AI hằng ngày.

Qwen3.7-Max được thiết kế cho các tác vụ tự động, cho phép quản lý quy trình làm việc kéo dài, sử dụng công cụ phần mềm và tự viết mã mà không cần can thiệp từ con người.

Trong một bài đăng trên WeChat, Alibaba cho biết mô hình này có thể xử lý nhiệm vụ phức tạp liên tục trong tối đa 35 giờ và sử dụng công cụ phần mềm hơn 1.000 lần liên tiếp mà không cần con người hỗ trợ.

Động thái này phản ánh xu hướng rộng hơn của ngành AI, khi các công ty dần rời xa chatbot trò chuyện để hướng tới các hệ thống AI độc lập có thể hoàn thành dự án nhiều bước với mức giám sát tối thiểu.

Thiên Kim