![]() |
Mô hình AI Llama 4 của Meta ra mắt: Đột phá về hiệu năng, cạnh tranh trực tiếp với Gemini 2.0 |
Meta – công ty mẹ của Facebook, vừa công bố bộ mô hình ngôn ngữ lớn thế hệ mới mang tên Llama 4, đánh dấu bước tiến mạnh mẽ trong cuộc đua AI toàn cầu. Llama 4 bao gồm ba mô hình chính: Scout, Maverick và Behemoth, với khả năng xử lý đa phương thức và hiệu suất vượt trội, được kỳ vọng sẽ cạnh tranh trực tiếp với các đối thủ nặng ký như GPT-4.5 của OpenAI, Gemini 2.0 của Google hay Claude Sonnet của Anthropic.
Llama 4 Scout, mô hình nhỏ nhất trong bộ ba, được thiết kế để vận hành hiệu quả ngay cả trên một GPU duy nhất NVIDIA H100. Dù chỉ kích hoạt 17 tỷ tham số cho mỗi lượt xử lý, Scout lại có tổng cộng 109 tỷ tham số và nổi bật với cửa sổ ngữ cảnh “khổng lồ” lên đến 10 triệu token – gấp 80 lần phiên bản Llama trước đó. Điều này giúp mô hình ghi điểm trong các bài đánh giá liên quan đến trí nhớ ngữ cảnh và xử lý đa nhiệm.
Trong khi đó, Llama 4 Maverick là mô hình tầm trung với hiệu năng mạnh mẽ hơn, sử dụng tổng cộng 400 tỷ tham số và chia sẻ kiến trúc “mixture of experts” (MoE) như Scout. Theo Meta, Maverick có thể so sánh hiệu suất với GPT-4o và Gemini 2.0 Flash, đồng thời đạt kết quả ấn tượng trong các bài kiểm tra về mã hóa và suy luận logic, dù chỉ sử dụng một phần nhỏ số tham số hoạt động.
Cuối cùng, Llama 4 Behemoth – mô hình lớn nhất – hiện vẫn đang được huấn luyện, với 288 tỷ tham số hoạt động và tổng cộng 2.000 tỷ tham số. Meta đặt nhiều kỳ vọng vào Behemoth, gọi đây là “người thầy” cho các mô hình AI tương lai. CEO Mark Zuckerberg còn tuyên bố đây là “mô hình nền có hiệu suất cao nhất thế giới hiện nay”, có tiềm năng vượt qua các đối thủ mạnh nhất trong các bài kiểm tra thuộc lĩnh vực STEM (khoa học, công nghệ, kỹ thuật và toán học).
Cả Scout và Maverick đều hỗ trợ xử lý đa phương thức (multimodal), có thể phân tích và kết hợp dữ liệu từ văn bản, hình ảnh, âm thanh đến video – cho phép ứng dụng rộng rãi trong các lĩnh vực như truyền thông, y tế, giáo dục, công nghiệp sáng tạo và chatbot AI. Đây là bước phát triển quan trọng, giúp Meta bắt kịp và thậm chí vượt lên trong một số khía cạnh so với các mô hình đối thủ vốn thiên về văn bản như GPT.
Các mô hình Llama 4 đã được tích hợp vào trợ lý ảo Meta AI trên WhatsApp, Messenger, Instagram Direct cũng như trên nền tảng web. Đồng thời, Meta cũng cung cấp các mô hình này qua nền tảng Azure AI Foundry, Azure Databricks và Hugging Face, giúp các nhà phát triển dễ dàng tiếp cận và triển khai.
Meta tiếp tục gọi Llama 4 là phần mềm mã nguồn mở, tuy nhiên đã gặp chỉ trích từ cộng đồng mã nguồn mở do một số điều khoản hạn chế quyền sử dụng. Cụ thể, các tổ chức có hơn 700 triệu người dùng hoạt động hàng tháng phải xin phép Meta trước khi triển khai Llama 4, điều này bị cho là vi phạm tinh thần “mở” của phần mềm nguồn mở thực sự theo định nghĩa của Open Source Initiative.
Meta đang bước vào một giai đoạn tăng tốc phát triển AI khi công bố kế hoạch đầu tư 65 tỷ USD vào năm 2025 để mở rộng cơ sở hạ tầng AI. Đây là nỗ lực đáp lại áp lực từ các nhà đầu tư, những người yêu cầu Meta chứng minh hiệu quả từ các khoản chi khổng lồ vào AI trong bối cảnh ngành công nghệ đang chứng kiến sự cạnh tranh khốc liệt.
Dù quá trình phát triển Llama 4 gặp không ít trở ngại – đặc biệt trong các bài kiểm tra nội bộ liên quan đến năng lực lập luận và toán học – Meta cho biết đã điều chỉnh phương pháp huấn luyện bằng cách áp dụng kiến trúc MoE và cải tiến quy trình đào tạo. Tập đoàn cũng lên kế hoạch công bố thêm thông tin về chiến lược AI tại sự kiện LlamaCon, dự kiến tổ chức vào ngày 29/4 tới.