GLM-5.2 được ví là "khoảnh khắc DeepSeek" mới của AI Trung Quốc
GLM-5.2 là mô hình trí tuệ nhân tạo mới do công ty Zhipu AI (Z.ai) của Trung Quốc phát triển và đang tạo được nhiều sự chú ý nhờ khả năng lập trình được đánh giá thuộc nhóm dẫn đầu thế giới.
Theo bảng xếp hạng FrontierSWE, thước đo khả năng hoàn thành các dự án kỹ thuật phần mềm quy mô lớn kéo dài hàng chục giờ, GLM-5.2 đạt 74,4%, vượt GPT-5.5 của OpenAI và Opus 4.7 của Anthropic. Khoảng cách giữa mô hình này và Opus 4.8, mô hình đang dẫn đầu bảng xếp hạng, chưa đến một điểm phần trăm.
![]() |
| GLM-5.2 của Zhipu AI gây chú ý với hiệu năng tiệm cận OpenAI và Anthropic |
Ở hai bảng đánh giá khác là PostTrainBench và SWE-Marathon, chuyên đo lường khả năng xử lý các tác vụ phức tạp nhiều bước, GLM-5.2 cũng nằm trong nhóm ba mô hình có thành tích cao nhất, cùng với các sản phẩm AI hàng đầu của Mỹ.
Nhà nghiên cứu Kyle Chan thuộc Viện Brookings nhận định trên SCMP rằng GLM-5.2 đánh dấu một "khoảnh khắc DeepSeek" mới đối với ngành AI Trung Quốc. Theo ông, mô hình này cho thấy Trung Quốc hiện chỉ còn chậm Mỹ vài tháng về hiệu năng AI, dù vẫn gặp nhiều hạn chế về năng lực tính toán.
Kyle Chan cũng cho rằng GLM-5.2 xuất hiện đúng thời điểm khi chi phí phát triển và vận hành AI ngày càng trở thành vấn đề được quan tâm. Theo đánh giá của ông, chi phí sử dụng mô hình này chỉ bằng khoảng một nửa so với nhiều mô hình của các công ty Mỹ, trong khi hiệu năng vẫn thuộc nhóm dẫn đầu.
Vẫn còn khoảng cách với các mô hình AI hàng đầu của Mỹ
Lập trình hiện là một trong những lĩnh vực ứng dụng thương mại phát triển nhanh nhất của các mô hình ngôn ngữ lớn. Theo các tài liệu gọi vốn gần đây, Anthropic - công ty đang dẫn đầu trong lĩnh vực AI lập trình - dự kiến đạt doanh thu thường niên khoảng 47 tỷ USD, tăng mạnh so với mức khoảng 1 tỷ USD vào đầu năm 2025.
Nathan Lambert, nhà nghiên cứu tại Viện Nghiên cứu Trí tuệ nhân tạo Allen, nhận định GLM-5.2 là một trong những mô hình trọng số mở đầu tiên có thể được xem là lựa chọn thay thế đáng chú ý cho các mô hình AI thương mại hiện nay. Dạng mô hình này cho phép người dùng điều chỉnh bộ trọng số đã được huấn luyện để phù hợp với từng nhu cầu sử dụng.
Tuy nhiên, theo CNBC, GLM-5.2 vẫn chưa thể vượt qua các mô hình AI hàng đầu của Mỹ ở mọi tiêu chí. Trên bảng xếp hạng DeepSWE đánh giá năng lực kỹ thuật phần mềm, mô hình này đứng thứ 5, sau nhiều sản phẩm của Anthropic và OpenAI.
Một số chuyên gia cũng ghi nhận những điểm cần tiếp tục cải thiện. Sridhar Ramaswamy, CEO công ty phần mềm dữ liệu Snowflake, đánh giá GLM-5.2 có hiệu năng tổng thể tương đương Claude Opus 4.7 nhưng đôi khi kết thúc tác vụ quá sớm hoặc dành quá nhiều thời gian phân tích các chi tiết chưa thực sự chính xác.
Trong khi đó, Tang Jie, nhà sáng lập Zhipu AI, cho biết GLM-5.2 vẫn còn nhiều dư địa để cải thiện nếu có thêm nguồn lực tính toán dành cho quá trình huấn luyện tăng cường (reinforcement learning).