Chủ nhật 29/03/2026 04:14
Hotline: 024.355.63.010
Kinh tế số

Mô hình AI Llama 4 của Meta ra mắt: Đột phá về hiệu năng, cạnh tranh trực tiếp với Gemini 2.0

Mô hình AI Llama 4 được kỳ vọng sẽ cạnh tranh trực tiếp với các đối thủ nặng ký như GPT-4.5 của OpenAI, Gemini 2.0 của Google hay Claude Sonnet của Anthropic.
Mô hình AI Llama 4 ra mắt: Đột phá về hiệu năng, cạnh tranh trực tiếp với Gemini 2.0
Mô hình AI Llama 4 của Meta ra mắt: Đột phá về hiệu năng, cạnh tranh trực tiếp với Gemini 2.0

Meta – công ty mẹ của Facebook, vừa công bố bộ mô hình ngôn ngữ lớn thế hệ mới mang tên Llama 4, đánh dấu bước tiến mạnh mẽ trong cuộc đua AI toàn cầu. Llama 4 bao gồm ba mô hình chính: Scout, Maverick và Behemoth, với khả năng xử lý đa phương thức và hiệu suất vượt trội, được kỳ vọng sẽ cạnh tranh trực tiếp với các đối thủ nặng ký như GPT-4.5 của OpenAI, Gemini 2.0 của Google hay Claude Sonnet của Anthropic.

Llama 4 Scout, mô hình nhỏ nhất trong bộ ba, được thiết kế để vận hành hiệu quả ngay cả trên một GPU duy nhất NVIDIA H100. Dù chỉ kích hoạt 17 tỷ tham số cho mỗi lượt xử lý, Scout lại có tổng cộng 109 tỷ tham số và nổi bật với cửa sổ ngữ cảnh “khổng lồ” lên đến 10 triệu token – gấp 80 lần phiên bản Llama trước đó. Điều này giúp mô hình ghi điểm trong các bài đánh giá liên quan đến trí nhớ ngữ cảnh và xử lý đa nhiệm.

Trong khi đó, Llama 4 Maverick là mô hình tầm trung với hiệu năng mạnh mẽ hơn, sử dụng tổng cộng 400 tỷ tham số và chia sẻ kiến trúc “mixture of experts” (MoE) như Scout. Theo Meta, Maverick có thể so sánh hiệu suất với GPT-4o và Gemini 2.0 Flash, đồng thời đạt kết quả ấn tượng trong các bài kiểm tra về mã hóa và suy luận logic, dù chỉ sử dụng một phần nhỏ số tham số hoạt động.

Cuối cùng, Llama 4 Behemoth – mô hình lớn nhất – hiện vẫn đang được huấn luyện, với 288 tỷ tham số hoạt động và tổng cộng 2.000 tỷ tham số. Meta đặt nhiều kỳ vọng vào Behemoth, gọi đây là “người thầy” cho các mô hình AI tương lai. CEO Mark Zuckerberg còn tuyên bố đây là “mô hình nền có hiệu suất cao nhất thế giới hiện nay”, có tiềm năng vượt qua các đối thủ mạnh nhất trong các bài kiểm tra thuộc lĩnh vực STEM (khoa học, công nghệ, kỹ thuật và toán học).

Cả Scout và Maverick đều hỗ trợ xử lý đa phương thức (multimodal), có thể phân tích và kết hợp dữ liệu từ văn bản, hình ảnh, âm thanh đến video – cho phép ứng dụng rộng rãi trong các lĩnh vực như truyền thông, y tế, giáo dục, công nghiệp sáng tạo và chatbot AI. Đây là bước phát triển quan trọng, giúp Meta bắt kịp và thậm chí vượt lên trong một số khía cạnh so với các mô hình đối thủ vốn thiên về văn bản như GPT.

Các mô hình Llama 4 đã được tích hợp vào trợ lý ảo Meta AI trên WhatsApp, Messenger, Instagram Direct cũng như trên nền tảng web. Đồng thời, Meta cũng cung cấp các mô hình này qua nền tảng Azure AI Foundry, Azure Databricks và Hugging Face, giúp các nhà phát triển dễ dàng tiếp cận và triển khai.

Meta tiếp tục gọi Llama 4 là phần mềm mã nguồn mở, tuy nhiên đã gặp chỉ trích từ cộng đồng mã nguồn mở do một số điều khoản hạn chế quyền sử dụng. Cụ thể, các tổ chức có hơn 700 triệu người dùng hoạt động hàng tháng phải xin phép Meta trước khi triển khai Llama 4, điều này bị cho là vi phạm tinh thần “mở” của phần mềm nguồn mở thực sự theo định nghĩa của Open Source Initiative.

Meta đang bước vào một giai đoạn tăng tốc phát triển AI khi công bố kế hoạch đầu tư 65 tỷ USD vào năm 2025 để mở rộng cơ sở hạ tầng AI. Đây là nỗ lực đáp lại áp lực từ các nhà đầu tư, những người yêu cầu Meta chứng minh hiệu quả từ các khoản chi khổng lồ vào AI trong bối cảnh ngành công nghệ đang chứng kiến sự cạnh tranh khốc liệt.

Dù quá trình phát triển Llama 4 gặp không ít trở ngại – đặc biệt trong các bài kiểm tra nội bộ liên quan đến năng lực lập luận và toán học – Meta cho biết đã điều chỉnh phương pháp huấn luyện bằng cách áp dụng kiến trúc MoE và cải tiến quy trình đào tạo. Tập đoàn cũng lên kế hoạch công bố thêm thông tin về chiến lược AI tại sự kiện LlamaCon, dự kiến tổ chức vào ngày 29/4 tới.

Tin bài khác
Gemini mở tính năng nhập bộ nhớ, tạo sức ép mới trong cuộc đua AI

Gemini mở tính năng nhập bộ nhớ, tạo sức ép mới trong cuộc đua AI

Google vừa đưa vào Gemini tính năng “nhập bộ nhớ”, cho phép người dùng chuyển dữ liệu cá nhân, thói quen sử dụng và ngữ cảnh đã hình thành trên các chatbot như ChatGPT hay Claude. Bước đi này được xem là nỗ lực đáng chú ý nhằm giảm bớt trở ngại khi người dùng muốn dịch chuyển giữa các nền tảng AI.
Không còn đầu tư dàn trải: Đâu là những ngành công nghệ chiến lược tạo động lực tăng trưởng mới cho Việt Nam?

Không còn đầu tư dàn trải: Đâu là những ngành công nghệ chiến lược tạo động lực tăng trưởng mới cho Việt Nam?

Bộ KH&CN yêu cầu rà soát, cập nhật danh mục công nghệ chiến lược nhằm nâng cao năng lực cạnh tranh, phát triển ngành công nghiệp mới và đảm bảo tự chủ.
Melania Trump chọn robot Figure 03 để truyền thông điệp mới về AI và tương lai trẻ em

Melania Trump chọn robot Figure 03 để truyền thông điệp mới về AI và tương lai trẻ em

Đệ nhất phu nhân Mỹ Melania Trump đã xuất hiện cùng robot hình người Figure 03 tại Nhà Trắng trong khuôn khổ hội nghị thượng đỉnh toàn cầu về giáo dục và công nghệ cho trẻ em. Sự kiện quy tụ đại diện từ 45 quốc gia và 28 tổ chức công nghệ, cho thấy AI đang được đưa vào trung tâm các cuộc thảo luận về giáo dục tương lai.
Doanh nghiệp phải vượt “bài kiểm tra” vốn và công nghệ để vận hành sàn giao dịch tài sản mã hóa

Doanh nghiệp phải vượt “bài kiểm tra” vốn và công nghệ để vận hành sàn giao dịch tài sản mã hóa

Thị trường tài sản mã hóa tại Việt Nam đang bước vào giai đoạn chuẩn bị thực chất cho chương trình thí điểm, nhưng để vận hành một sàn giao dịch hợp pháp, doanh nghiệp không chỉ cần vốn lớn mà còn phải đáp ứng loạt tiêu chuẩn ngặt nghèo về công nghệ, an ninh hệ thống và bảo vệ nhà đầu tư.
ONUS tê liệt giao dịch, HVA nói bộ máy điều hành vẫn hoạt động bình thường

ONUS tê liệt giao dịch, HVA nói bộ máy điều hành vẫn hoạt động bình thường

Giữa lúc nhiều nhà đầu tư không thể đăng nhập, rút tiền trên app ONUS từ tối 20/3, HVA Group khẳng định doanh nghiệp vẫn hoạt động bình thường, đồng thời cảnh báo nguy cơ bùng phát các chiêu lừa “hỗ trợ lấy lại tiền”.
OpenAI thâu tóm Astral, tăng tốc Codex trong cuộc đua AI viết code

OpenAI thâu tóm Astral, tăng tốc Codex trong cuộc đua AI viết code

OpenAI vừa ký thỏa thuận mua lại Astral - startup đứng sau các công cụ Python mã nguồn mở phổ biến như uv, Ruff và ty - trong bước đi được đánh giá là mang tính chiến lược để tăng tốc Codex. Thương vụ cho thấy cuộc đua AI viết code đang chuyển từ mô hình “trợ lý sinh mã” sang giai đoạn mới, nơi các hãng công nghệ tìm cách kiểm soát sâu hơn các lớp công cụ cốt lõi trong hệ sinh thái phát triển phần mềm.
Bí mật phía sau đơn đến trong 1 giờ, thậm chí 30 phút của Amazon

Bí mật phía sau đơn đến trong 1 giờ, thậm chí 30 phút của Amazon

Amazon đang đẩy cuộc đua giao hàng siêu tốc lên một nấc mới khi triển khai dịch vụ nhận hàng trong 1 giờ tại hàng trăm khu vực ở Mỹ, đồng thời thử nghiệm mô hình giao trong 30 phút. Tốc độ kỷ lục này giúp hãng gia tăng sức ép lên Walmart và toàn ngành bán lẻ, nhưng cũng đặt ra câu hỏi lớn về chi phí vận hành và áp lực lao động trong chuỗi logistics.
Nvidia đặt cược vào “AI vận hành”, dự báo thị trường chip đạt 1.000 tỷ USD

Nvidia đặt cược vào “AI vận hành”, dự báo thị trường chip đạt 1.000 tỷ USD

Tại hội nghị công nghệ GTC 2026 diễn ra ở San Jose (Mỹ), CEO Jensen Huang công bố bước chuyển chiến lược quan trọng của Nvidia: tập trung vào giai đoạn vận hành AI (AI inference), nơi các mô hình trí tuệ nhân tạo được triển khai vào thực tế.
Samsung đối mặt nguy cơ thua lỗ lần đầu ở mảng di động dù Galaxy S26 bán chạy

Samsung đối mặt nguy cơ thua lỗ lần đầu ở mảng di động dù Galaxy S26 bán chạy

Dù Galaxy S26 đạt doanh số khả quan, Samsung vẫn phải đối mặt bài toán lớn hơn: làm sao duy trì lợi nhuận trong một thị trường smartphone ngày càng cạnh tranh và chi phí ngày càng cao.
Oppo Find X9 Ultra rò rỉ camera 10x: Khẩu độ lớn hơn, tham vọng dẫn đầu nhiếp ảnh di động

Oppo Find X9 Ultra rò rỉ camera 10x: Khẩu độ lớn hơn, tham vọng dẫn đầu nhiếp ảnh di động

Oppo Find X9 Ultra lộ thông tin camera 10x periscope khẩu độ f/3.5, cảm biến telephoto 200MP và hệ thống camera nâng cấp mạnh, hứa hẹn cạnh tranh trực tiếp trong phân khúc flagship cao cấp.
Công nghệ UAV bầy đàn hỗ trợ chữa cháy trong đô thị

Công nghệ UAV bầy đàn hỗ trợ chữa cháy trong đô thị

Công ty CT UAV, thành viên của CT Group, đang phát triển hệ thống UAV bầy đàn chữa cháy mang tên Fire Swarm, hướng đến giải quyết bài toán xử lý hỏa hoạn tại các khu vực ngõ nhỏ, hẻm sâu – nơi phương tiện cứu hỏa truyền thống khó tiếp cận.
Xuất hiện khái niệm “drone chúa” mang hàng nghìn UAV

Xuất hiện khái niệm “drone chúa” mang hàng nghìn UAV

Những nền tảng máy bay không người lái siêu tải trọng, có khả năng mang theo hàng trăm đến hàng nghìn UAV cỡ nhỏ, có thể sớm xuất hiện trong tương lai gần.
Xiaomi 17 Ultra có gì mới khi sở hữu camera 200MP và pin 6000mAh?

Xiaomi 17 Ultra có gì mới khi sở hữu camera 200MP và pin 6000mAh?

Xiaomi 17 Ultra là mẫu smartphone flagship mới được giới thiệu trong năm 2026, tiếp tục kế thừa định hướng công nghệ cao cấp của dòng Xiaomi Ultra.
Internet Việt Nam sẵn sàng cho “kinh tế tầm thấp”

Internet Việt Nam sẵn sàng cho “kinh tế tầm thấp”

Sự phát triển nhanh của hạ tầng viễn thông đang đưa Internet Việt Nam trở thành một trong những nền tảng quan trọng thúc đẩy kinh tế số, đặc biệt là các mô hình kinh tế mới như kinh tế tầm thấp (Low Altitude Economy – LAE).
Apple Music bắt đầu gắn nhãn nội dung AI trong âm nhạc

Apple Music bắt đầu gắn nhãn nội dung AI trong âm nhạc

Nền tảng nghe nhạc trực tuyến Apple Music vừa triển khai hệ thống “thẻ minh bạch” (transparency tags) nhằm giúp người dùng nhận biết liệu nội dung âm nhạc họ đang nghe có được tạo ra bằng trí tuệ nhân tạo (AI) hay không.