Meta chính thức gia nhập đường đua AI, công bố phát hành sản phẩm mang tên LLaMA

23:02 26/02/2023

Meta’s LLaMA, viết tắt của Large Language Model Meta AI, sẽ được cung cấp theo giấy phép phi thương mại cho các nhà nghiên cứu và các tổ chức liên kết với chính phủ, phòng thí nghiệm công nghiệp…

Ảnh minh họa

Ảnh minh họa.

Meta Platforms mới đây cho biết công ty đã phát hành một mô hình ngôn ngữ lớn mới dựa trên trí tuệ nhân tạo (AI) nhằm vào cộng đồng nghiên cứu, trở thành công ty mới nhất tham gia cuộc đua AI đang ngày càng "nóng".

Mô hình có tên LLaMA, viết tắt của Large Language Model Meta AI, nhằm giúp các nhà khoa học và kỹ sư khám phá các ứng dụng cho AI như trả lời câu hỏi và tóm tắt tài liệu.

Meta cho biết ngôn ngữ mới của họ có yêu cầu sức mạnh tính toán “ít hơn nhiều” so với các ngôn ngữ trước đó, được đào tạo trên 20 ngôn ngữ, tập trung vào những ngôn ngữ có bảng chữ cái Latinh và Cyrillic.

Meta’s LLaMA, viết tắt của Large Language Model Meta AI, sẽ được cung cấp theo giấy phép phi thương mại cho các nhà nghiên cứu và các tổ chức liên kết với chính phủ, phòng thí nghiệm công nghiệp…

Công ty sẽ cung cấp mã cơ bản để người dùng điều chỉnh mô hình và sử dụng nó cho các trường hợp sử dụng liên quan đến nghiên cứu.

Trong bài đăng mới đây, Mark Zuckerberg cho biết công nghệ LLaMA thậm chí có thể giải các bài toán hoặc tiến hành nghiên cứu khoa học.

“Mô hình LLaMA đã cho thấy nhiều hứa hẹn trong việc tạo văn bản, trò chuyện, tóm tắt tài liệu bằng văn bản và các nhiệm vụ phức tạp hơn như giải các định lý toán học hoặc dự đoán cấu trúc protein,” ông Zuckerberg viết.

Meta cũng cho rằng mô hình LLaMA của công ty đặc trưng hơn so với các mô hình cạnh tranh.

Meta tuyên bố rằng LLaMA-13B, hoạt động tốt hơn mô hình GPT-3, mô hình phổ biến của OpenAI. Ngoài ra, phiên bản lớn nhất, LLaMA-65B có thể cạnh tranh với các mô hình tốt nhất như Chinchilla70B của DeepMind và PaLM 540B của Google.

Các con số trong các tên như 13B hay 65B đề cập đến hàng tỷ tham số trong mỗi mô hình. Đây là thước đo kích thước của hệ thống và ước tính sơ bộ về mức độ phức tạp của AI.

LLaMA không giống như ChatGPT hoặc Bing, không phải là một hệ thống mà bất cứ ai cũng có thể nói chuyện. Thay vào đó, nó là một công cụ nghiên cứu mà Meta để giúp các chuyên gia giải quyết các vấn đề của mô hình ngôn ngữ AI, từ sự thiên vị và tính độc hại đến xu hướng đơn giản nhằm tạo nên thông tin.

Theo CEO Meta Mark Zuckerberg, mô hình ngôn ngữ AI quy mô lớn mang tên LLaMa để giúp các nhà nghiên cứu cải thiện công việc của họ.

AI đã nổi lên như một điểm sáng cho các khoản đầu tư vào ngành công nghệ.
AI đã nổi lên như một điểm sáng cho các khoản đầu tư vào ngành công nghệ.

Việc Meta phát hành mô hình mới, được phát triển bởi nhóm Nghiên cứu AI cơ bản (FAIR), diễn ra khi các công ty công nghệ lớn và các công ty khởi nghiệp có vốn đầu tư lớn chạy đua để chào hàng những tiến bộ trong kỹ thuật trí tuệ nhân tạo và tích hợp công nghệ này vào các sản phẩm thương mại.

AI đã nổi lên như một điểm sáng cho các khoản đầu tư vào ngành công nghệ. Ngành công nghệ vốn có tốc độ tăng trưởng chậm lại dẫn tới việc sa thải trên diện rộng cũng như cắt giảm các hoạt động đặt cược vào thử nghiệm. 

Cuộc chiến công khai để thống trị không gian công nghệ AI bắt đầu vào cuối năm ngoái với việc ra mắt ChatGPT của OpenAI do Microsoft hậu thuẫn. Việc ChatGPT ra mắt khiến các đối thủ nặng ký trong lĩnh vực công nghệ từ Alphabet đến Baidu của Trung Quốc cũng nhanh chóng tung ra các dịch vụ riêng của hãng. 

Vào tháng 5 năm ngoái, Meta đã phát hành mô hình ngôn ngữ lớn OPT-175B, cũng hướng tới các nhà nghiên cứu, tạo cơ sở cho một phiên bản mới của chatbot BlenderBot. 

Phương Linh