Mô hình AI Llama 4 của Meta ra mắt: Đột phá về hiệu năng, cạnh tranh trực tiếp với Gemini 2.0

07/04/2025 16:41

Công nghệ

Mô hình AI Llama 4 được kỳ vọng sẽ cạnh tranh trực tiếp với các đối thủ nặng ký như GPT-4.5 của OpenAI, Gemini 2.0 của Google hay Claude Sonnet của Anthropic.

Mô hình AI Llama 4 ra mắt: Đột phá về hiệu năng, cạnh tranh trực tiếp với Gemini 2.0

Mô hình AI Llama 4 của Meta ra mắt: Đột phá về hiệu năng, cạnh tranh trực tiếp với Gemini 2.0

Meta – công ty mẹ của Facebook, vừa công bố bộ mô hình ngôn ngữ lớn thế hệ mới mang tên Llama 4, đánh dấu bước tiến mạnh mẽ trong cuộc đua AI toàn cầu. Llama 4 bao gồm ba mô hình chính: Scout, Maverick và Behemoth, với khả năng xử lý đa phương thức và hiệu suất vượt trội, được kỳ vọng sẽ cạnh tranh trực tiếp với các đối thủ nặng ký như GPT-4.5 của OpenAI, Gemini 2.0 của Google hay Claude Sonnet của Anthropic.

Llama 4 Scout, mô hình nhỏ nhất trong bộ ba, được thiết kế để vận hành hiệu quả ngay cả trên một GPU duy nhất NVIDIA H100. Dù chỉ kích hoạt 17 tỷ tham số cho mỗi lượt xử lý, Scout lại có tổng cộng 109 tỷ tham số và nổi bật với cửa sổ ngữ cảnh “khổng lồ” lên đến 10 triệu token – gấp 80 lần phiên bản Llama trước đó. Điều này giúp mô hình ghi điểm trong các bài đánh giá liên quan đến trí nhớ ngữ cảnh và xử lý đa nhiệm.

Trong khi đó, Llama 4 Maverick là mô hình tầm trung với hiệu năng mạnh mẽ hơn, sử dụng tổng cộng 400 tỷ tham số và chia sẻ kiến trúc “mixture of experts” (MoE) như Scout. Theo Meta, Maverick có thể so sánh hiệu suất với GPT-4o và Gemini 2.0 Flash, đồng thời đạt kết quả ấn tượng trong các bài kiểm tra về mã hóa và suy luận logic, dù chỉ sử dụng một phần nhỏ số tham số hoạt động.

Cuối cùng, Llama 4 Behemoth – mô hình lớn nhất – hiện vẫn đang được huấn luyện, với 288 tỷ tham số hoạt động và tổng cộng 2.000 tỷ tham số. Meta đặt nhiều kỳ vọng vào Behemoth, gọi đây là “người thầy” cho các mô hình AI tương lai. CEO Mark Zuckerberg còn tuyên bố đây là “mô hình nền có hiệu suất cao nhất thế giới hiện nay”, có tiềm năng vượt qua các đối thủ mạnh nhất trong các bài kiểm tra thuộc lĩnh vực STEM (khoa học, công nghệ, kỹ thuật và toán học).

Cả Scout và Maverick đều hỗ trợ xử lý đa phương thức (multimodal), có thể phân tích và kết hợp dữ liệu từ văn bản, hình ảnh, âm thanh đến video – cho phép ứng dụng rộng rãi trong các lĩnh vực như truyền thông, y tế, giáo dục, công nghiệp sáng tạo và chatbot AI. Đây là bước phát triển quan trọng, giúp Meta bắt kịp và thậm chí vượt lên trong một số khía cạnh so với các mô hình đối thủ vốn thiên về văn bản như GPT.

Các mô hình Llama 4 đã được tích hợp vào trợ lý ảo Meta AI trên WhatsApp, Messenger, Instagram Direct cũng như trên nền tảng web. Đồng thời, Meta cũng cung cấp các mô hình này qua nền tảng Azure AI Foundry, Azure Databricks và Hugging Face, giúp các nhà phát triển dễ dàng tiếp cận và triển khai.

Meta tiếp tục gọi Llama 4 là phần mềm mã nguồn mở, tuy nhiên đã gặp chỉ trích từ cộng đồng mã nguồn mở do một số điều khoản hạn chế quyền sử dụng. Cụ thể, các tổ chức có hơn 700 triệu người dùng hoạt động hàng tháng phải xin phép Meta trước khi triển khai Llama 4, điều này bị cho là vi phạm tinh thần “mở” của phần mềm nguồn mở thực sự theo định nghĩa của Open Source Initiative.

Meta đang bước vào một giai đoạn tăng tốc phát triển AI khi công bố kế hoạch đầu tư 65 tỷ USD vào năm 2025 để mở rộng cơ sở hạ tầng AI. Đây là nỗ lực đáp lại áp lực từ các nhà đầu tư, những người yêu cầu Meta chứng minh hiệu quả từ các khoản chi khổng lồ vào AI trong bối cảnh ngành công nghệ đang chứng kiến sự cạnh tranh khốc liệt.

Dù quá trình phát triển Llama 4 gặp không ít trở ngại – đặc biệt trong các bài kiểm tra nội bộ liên quan đến năng lực lập luận và toán học – Meta cho biết đã điều chỉnh phương pháp huấn luyện bằng cách áp dụng kiến trúc MoE và cải tiến quy trình đào tạo. Tập đoàn cũng lên kế hoạch công bố thêm thông tin về chiến lược AI tại sự kiện LlamaCon, dự kiến tổ chức vào ngày 29/4 tới.

TAGS:

Llama 4 mô hình AI Meta CEO Mark Zuckerberg

Bài liên quan

Sau TikTok và DeepSeek, WhatsApp bị cấm khỏi thiết bị chính phủ Mỹ

Bị tố độc quyền Android, Google đối mặt án phạt 4,7 tỷ USD

CEO Sam Altman: Không ai rời OpenAI dù Meta trả 100 triệu USD

Tin bài khác

Kim Oanh Group hợp tác đối tác công nghệ, tiên phong ứng dụng AI và Robotic trong quản lý vận hành dự án

18/12/2025 13:35

TP.HCM, ngày 18/12/2025, Kim Oanh Group đã chính thức ký kết thỏa thuận hợp tác chiến lược cùng AirCity, thành lập liên doanh K-City – đơn vị tiên phong ứng dụng các giải pháp công nghệ hiện đại như Trí tuệ nhân tạo (AI) và Robot tự hành (Robotic) trong công tác quản lý vận hành bất động sản, đặc biệt tại phân khúc nhà ở xã hội (NOXH).

Công nghệ AI, Deepfake đang bị lợi dụng để thao túng tâm lý và trục lợi tinh vi

17/12/2025 10:58

Theo ông Vũ Hoàng Liên - Chủ tịch Hiệp hội Internet Việt Nam, Công nghệ AI, Deepfake đang bị lợi dụng để trở thành công cụ thao túng tâm lý và trục Theo ông Vũ Hoàng Liên - Chủ tịch Hiệp hội Internet Việt Nam, Công nghệ AI, Deepfake đang bị lợi dụng để trở thành công cụ thao túng tâm lý và trục lợi tinh vi.

AI – Đòn bẩy nâng cấp năng lực sản xuất trong không gian phát triển mới của TP. Hồ Chí Minh

16/12/2025 18:40

Trong bối cảnh TP. Hồ Chí Minh mở rộng không gian phát triển, hướng tới mô hình siêu đô thị đa trung tâm, trí tuệ nhân tạo đang trở thành “chìa khóa” giúp ngành sản xuất nâng cấp năng lực cạnh tranh và thích ứng với yêu cầu tăng trưởng xanh. Hội thảo “Ứng dụng AI: Tối ưu quy trình trong sản xuất” do ITPC phối hợp với Trường Đại học Anh Quốc Việt Nam tổ chức đã phác họa rõ bức tranh cơ hội, thách thức và lộ trình triển khai AI, từ đó gợi mở hướng đi thực chất cho cộng đồng doanh nghiệp trong giai đoạn chuyển đổi mới.

Australia cấm trẻ em dưới 16 tuổi dùng mạng xã hội, mở ra tiền lệ quản lý mới trên thế giới

10/12/2025 16:26

Từ ngày 10/12, Australia chính thức cấm trẻ em dưới 16 tuổi sử dụng mạng xã hội và yêu cầu 10 nền tảng lớn như TikTok, YouTube, Instagram, Facebook phải chặn truy cập ngay trước nửa đêm.

Công nghệ 2025: Khi AI, siêu ứng dụng và thế giới số trở thành “mạch sống” hằng ngày

07/12/2025 09:34

Năm 2025 đang chứng kiến một bước chuyển sâu sắc trong đời sống xã hội, khi công nghệ không còn đơn thuần là công cụ hỗ trợ mà dần trở thành “hạ tầng vô hình” chi phối cách con người sống, làm việc, học tập, mua sắm và giải trí.

Xu hướng đăng nhập không cần mật khẩu

06/12/2025 10:35

Việc đăng nhập không dùng mật khẩu – từng được xem là một lựa chọn mang tính thử nghiệm – nay đang dần trở thành tiêu chuẩn mới trong ngành công nghệ.

TECHFEST 2025: Khởi nghiệp sáng tạo toàn dân, động lực tăng trưởng mới

03/12/2025 16:42

TECHFEST Việt Nam 2025 với chủ đề "Khởi nghiệp sáng tạo toàn dân - Động lực tăng trưởng mới” sẽ diễn ra tại Phố đi bộ Hồ Hoàn Kiếm, Hà Nội từ ngày 12 - 14/12.

Doanh nghiệp Việt có đang phòng thủ chậm?

25/11/2025 17:00

Khi công nghệ đang được sử dụng không chỉ cho mục đích “tốt”, hoạt động an ninh mạng bước vào giai đoạn mà ranh giới giữa “an toàn” và “bị xâm nhập” trở nên mờ nhạt hơn bao giờ hết. Các kỹ thuật tấn công hiện đại dựa trên AI và phi kỹ thuật đang khiến phần lớn tổ chức không thể phát hiện sớm rủi ro, tạo ra khoảng trống nguy hiểm giữa thực tế và những gì hệ thống bảo mật báo cáo.

Người dùng Việt tự kiểm chứng chất lượng Internet

24/11/2025 16:16

Nếu trước đây, việc lựa chọn nhà mạng phần lớn dựa trên quảng cáo hoặc cảm nhận chủ quan, thì hiện nay, người dùng đã bắt đầu đặt dữ liệu thực tế làm trung tâm.

TS. Chử Đức Hoàng: Chính sách đột phá mở đường để DNNN làm chủ công nghệ lõi

21/11/2025 08:26

TS. Chử Đức Hoàng cho rằng Việt Nam đang sở hữu đòn bẩy chính sách trị giá 25.000 tỷ mỗi năm cùng cơ chế sandbox mới, tạo cơ hội để DNNN tiên phong làm chủ AI, bán dẫn và chuyển đổi số.

Phát triển nguồn lực và công dân số khởi nghiệp: Việt Nam cần thêm 700.000 nhân sự an ninh mạng

19/11/2025 20:57

Sự kiện “Ngày hội Sinh viên & Chung khảo Cuộc thi Sinh viên An ninh mạng 2025” (CSCV 2025) đã trở thành tâm điểm chú ý của cộng đồng công nghệ, quy tụ hơn 3.000 sinh viên, hơn 50 doanh nghiệp công nghệ và hàng trăm chuyên gia an toàn thông tin đã diễn ra ngày 15/11, tại Hà Nội.

Cảnh báo nhiều lỗ hổng nghiêm trọng có thể bị tin tặc khai thác đánh cắp dữ liệu

12/11/2025 17:08

Phòng An ninh mạng và Phòng chống tội phạm công nghệ cao (Công an TP. Hà Nội) vừa phát cảnh báo về một số lỗ hổng bảo mật nghiêm trọng có thể bị tin tặc lợi dụng để tấn công, khai thác dữ liệu của cơ quan, tổ chức và cá nhân tại Việt Nam.

VinFuture thúc đẩy hợp tác nghiên cứu về 6G và IoT: Hướng tới mạng truyền thông hỗn hợp thế hệ mới

11/11/2025 15:40

Hàng chục chuyên gia, nhà khoa học trong và ngoài nước cùng hơn 300 sinh viên đã quy tụ tại sự kiện InnovaConnect diễn ra ở Hà Nội, với chủ đề “Vai trò của IoT và 6G trong việc định hình kiến trúc mạng truyền thông hỗn hợp thế hệ mới”.

Phát huy vai trò người có ảnh hưởng trên không gian mạng trong quảng bá văn hóa – du lịch Cần Thơ

11/11/2025 15:10

Trong bối cảnh chuyển đổi số mạnh mẽ, không gian mạng đã trở thành “mặt trận mềm” giúp lan tỏa giá trị văn hóa, du lịch và sản phẩm đặc trưng của địa phương. Với tầm ảnh hưởng sâu rộng, đội ngũ người có ảnh hưởng (KOL, influencer) đang góp phần quan trọng định vị thương hiệu văn hóa – du lịch của thành phố Cần Thơ trong thời kỳ mới.

Hé lộ iPad Pro 2027: Chip M6, làm mát buồng hơi và hiệu năng tiệm cận MacBook

03/11/2025 15:06

iPad Pro 2027 của Apple sẽ được trang bị chip M6 và hệ thống làm mát bằng hơi nước tiên tiến.

Xem thêm

Đọc nhiều