Mô hình AI mới của Google hoãn ngày ra mắt

16:56 04/12/2023

Trước đó, công ty dự kiến công bố sản phẩm mới trong tuần này, đồng loạt tại các sự kiện tổ chức ở California, New York và Washington.

Gemini là mô hình trí tuệ nhân tạo đa phương thức do bộ phận Google DeepMind nghiên cứu và phát triển
Gemini là mô hình trí tuệ nhân tạo đa phương thức do bộ phận Google DeepMind nghiên cứu và phát triển.

Chuyên trang công nghệ The Information ngày 4/12 đưa tin, Gemini AI, mô hình ngôn ngữ lớn của Google được đánh giá có khả năng cạnh tranh với GPT-4, không ra mắt tháng 12 như dự kiến.

The Information dẫn hai nguồn tin nội bộ cho biết CEO Alphabet Sundar Pichai yêu cầu dời ngày ra mắt mô hình ngôn ngữ lớn Gemini sang năm sau. Trước đó, công ty dự kiến công bố sản phẩm mới trong tuần này, đồng loạt tại các sự kiện tổ chức ở California, New York và Washington.

Gemini là mô hình trí tuệ nhân tạo đa phương thức do bộ phận Google DeepMind nghiên cứu và phát triển, được đề cập lần đầu hồi tháng 5 tại sự kiện thường niên Google I/O 2023.

Gemini được xem là dự án đầy tham vọng của Google và hoạt động tương tự mô hình GPT-4 hiện có trên ChatGPT. Sau khi trải nghiệm, Gemini được đánh giá là có một số điểm mạnh hơn GPT-4 vì tận dụng lượng dữ liệu lớn từ dịch vụ như Google Translate, Google Maps, Google Search... có được từ các sản phẩm của công ty thay vì dữ liệu thuần thu thập từ Internet. Điều này cho phép chatbot này có thể hiểu chính xác hơn ý định của người dùng.

Ngoài ra, chatbot này đã giải quyết được một hạn chế lớn của trí tuệ nhân tạo tạo sinh khi ít đưa ra các câu trả lời sai.

Trước đó, Google cho biết Gemini "sở hữu khả năng xử lý thông tin đa phương thức ấn tượng chưa từng có trên các mô hình trước đó, đạt hiệu quả cao trong việc tích hợp vào công cụ và giao diện lập trình ứng dụng (API), mở ra những đổi mới trong tương lai". Google cũng dự kiến tạo ra nhiều bản Gemini để đưa lên các dịch vụ của hãng như Bard, Search và Workspace cũng như bản di động có tên Gecko.

Theo Interesting Engineering, Gemini có thể là một trong những sản phẩm quan trọng nhất của Google khi ra mắt. Mô hình sẽ cho thấy hãng có thể cạnh tranh và vượt qua OpenAI, khi xu hướng tìm kiếm chuyển từ nền tảng truyền thống sang chatbot.

Giới chuyên gia nhận định, Gemini sẽ là bước tiến lớn trong xử lý ngôn ngữ tự nhiên (LLM) và có thể cạnh tranh với GPT-4 của OpenAI. Mô hình này có thể xử lý nhiều loại dữ liệu như hình ảnh và văn bản, cho phép thực hiện các tính năng như phân tích bằng biểu đồ trực quan. Các nhà nghiên cứu của SemiAnalysis cho rằng, Gemini có thể sẽ hoạt động tốt hơn GPT-4 do công ty có khả năng tiếp cận các chip tiên tiến hàng đầu.

Thực tế, hiện chưa công ty nào triển khai được mô hình AI có khả năng tiệm cận GPT-4 của OpenAI. Thay vào đó, thị trường tràn ngập các sản phẩm với cấp độ tương đương GPT-3.5. 

Hồi tháng 8,  hai chuyên gia Dylan Patel và Daniel Nishball thuộc công ty nghiên cứu SemiAnalysis đã đăng bài nhận định với tiêu đề "Google Gemini ăn cả thế giới - sẽ phá vỡ GPT-4 bằng sức mạnh nhân năm với ít GPU hơn". Bài viết lập luận rằng AI của Google đã sẵn sàng để "thổi bay" GPT-4 mạnh nhất hiện nay của OpenAI bằng sức mạnh tính toán lớn, trong khi đòi hỏi ít card đồ họa hơn.

Patel cho biết phân tích của họ dựa trên dữ liệu thu thập từ nhiều nguồn là nhà cung cấp bên thứ ba của Google. Dẫn hàng loạt số liệu, nhóm kết luận mô hình Gemini vượt trội GPT-4 về thước đo hiệu suất liên quan đến tính toán máy tính, được gọi là FLOPS.

Hiện nay, hầu hết mô hình AI ngôn ngữ lớn (LLM) như GPT-4 của OpenAI hay LLaMA của Meta chủ yếu dựa vào GPU từ Nvidia - thiết bị có giá 40.000 USD mỗi chiếc - để hoạt động. Càng nhiều GPU, sức mạnh tính toán càng tăng. Cơn sốt AI đã giúp Nvidia gia nhập "câu lạc bộ nghìn tỷ USD" hồi tháng 5. Nvidia cũng gần như độc quyền về GPU cho các hệ thống AI. Trong khi đó, đối thủ lớn như AMD chưa có sản phẩm tương tự đủ khả năng cạnh tranh.

"Có ai có thể cứu chúng ta khỏi việc lệ thuộc vào Nvidia không? Câu trả lời có thể là Gemini", bài viết nêu.

Thu Phương (t/h)

Tags: