![]() |
Google ra mắt mô hình AI Gemma 3 hỗ trợ đa nền tảng |
Google vừa giới thiệu mô hình AI Gemma 3, mô hình AI mã nguồn mở thế hệ thứ 3, có khả năng hoạt động trên cả điện thoại thông minh và máy trạm hiệu suất cao.
Google cho biết đây là tập hợp của mô hình nguồn mở nhẹ, hiện đại, được xây dựng từ cùng một nghiên cứu, công nghệ tương tự Gemini 2.0. Mô hình AI Gemma 3 được phát hành hơn một năm sau khi công ty lần đầu công bố mô hình nguồn mở Gemma.
So với dòng mô hình AI Gemini, lợi thế lớn nhất của Gemma 3 là tính mã nguồn mở, giúp các nhà phát triển dễ dàng tùy chỉnh, đóng gói và triển khai theo nhu cầu trong các ứng dụng di động và phần mềm máy tính. Ngoài ra, Gemma hỗ trợ hơn 140 ngôn ngữ, trong đó 35 ngôn ngữ đã có sẵn dưới dạng gói huấn luyện.
Gemma 3 có khả năng xử lý văn bản, hình ảnh và video. Về hiệu suất, mô hình AI Gemma 3 được đánh giá cao hơn so với nhiều mô hình AI mã nguồn mở phổ biến khác, bao gồm DeepSeek V3, OpenAI o3-mini và biến thể Llama-405B của Meta. Để tối ưu cho các nhà phát triển ứng dụng AI, Gemma 3 được tối ưu cho GPU của Nvidia cũng như những cụm nhân xử lý AI trên những chip xử lý thiết bị tiêu dùng hiện tại.
"Các mô hình nguồn mở mới của chúng tôi cực kỳ hiệu quả, như mô hình 27B lớn nhất chỉ chạy trên một GPU H100. Bạn sẽ cần khả năng tính toán ít nhất gấp 10 lần để có được hiệu suất tương tự từ các mô hình khác", CEO Sundar Pichai của Google viết trên X.
Gemma 3 sẽ có các phiên bản 1B, 4B, 12B và 27B, cho phép người dùng đưa ra lựa chọn hợp nhất với nhu cầu phần cứng và hiệu suất cụ thể của mình.
Gemma 3 có thể tương tác với các tập dữ liệu bên ngoài và hoạt động như một tác nhân tự động, tương tự cách Gemini hỗ trợ công việc trên các nền tảng như Gmail hay Docs một cách liền mạch.
Các mô hình AI mã nguồn mở mới nhất của Google có thể được triển khai cục bộ hoặc thông qua các dịch vụ đám mây của công ty, chẳng hạn như Vertex AI. Hiện tại, Gemma 3 đã có sẵn trên Google AI Studio, cũng như các nền tảng bên thứ ba như Hugging Face, Ollama và Kaggle.
Để tăng cường hiệu năng xử lý thông tin cũng như nội suy dữ liệu, Gemma 3 được nâng cấp bộ mã hóa hình ảnh, vision encoder, nhờ đó mô hình AI có thể nhận diện chi tiết trong những hình ảnh độ phân giải lớn cũng như hình kích thước chữ nhật, thay vì chỉ nhận dữ liệu đầu vào là những hình kích thước vuông trước kia.
Để đảm bảo an toàn vận hành AI, cơ chế xác thực an toàn ShieldGemma 2 cho phép lọc cả hình ảnh đầu vào lẫn đầu ra, loại bỏ những chi tiết hình ảnh được cho là không phù hợp, nguy hiểm hay bạo lực.
Mô hình nguồn mở thế hệ thứ 3 của Google là một phần của xu hướng trong ngành, nơi các công ty phát triển song song cả mô hình ngôn ngữ lớn (LLM) và mô hình ngôn ngữ nhỏ (SLM). Microsoft, đối thủ của Google, cũng đang theo đuổi chiến lược tương tự với dòng mô hình ngôn ngữ nhỏ mã nguồn mở.
Xu hướng các mô hình ngôn ngữ nhỏ do Google và Microsoft phát triển được đánh giá cao về hiệu suất sử dụng tài nguyên, giúp chúng trở thành lựa chọn lý tưởng để chạy trên các thiết bị như điện thoại thông minh.