Mô hình ngôn ngữ lớn dựa trên AI của Meta bị gỡ xuống chỉ sau vài ngày ra mắt

16:22 21/11/2022

Meta đã tiết lộ một mô hình máy tính xử lý ngôn ngữ mới có tên là Galactica, trình làng ngày 15/11 nhưng chỉ xuất hiện vỏn vẹn hơn ba ngày dưới dạng thử nghiệm trước khi biến mất.

Mô hình ngôn ngữ lớn dựa trên AI của Meta bị gỡ xuống chỉ sau vài ngày ra mắt

Mô hình ngôn ngữ lớn dựa trên AI của Meta bị gỡ xuống chỉ sau vài ngày ra mắt.

Ngày 15/11, Meta đã tiết lộ một mô hình máy tính xử lý ngôn ngữ mới có tên là Galactica, được tạo ra để hỗ trợ tìm kiếm và xử lý tài liệu khoa học.

Galactica được đào tạo dựa trên 48 triệu ví dụ về các bài báo khoa học, trang web, sách giáo khoa, ghi chú bài giảng và bách khoa toàn thư. Meta quảng cáo đây là một trợ thủ xử lý tư liệu cho các nhà nghiên cứu và sinh viên, thay thế các công cụ tìm kiếm thông thường.

“Galactica có thể tóm tắt các bài báo học thuật, giải các bài toán, tạo các bài báo trên Wiki, tạo chú thích...”, công ty này cho biết.

Vào tháng 5, Meta từng công khai AI này dưới tên gọi OPT-175B. Khi đó, công ty cho biết, đây là mô hình ngôn ngữ với 175 tỷ tham số đầu tiên được công khai cho cộng đồng nghiên cứu AI. Thế nhưng, Galactica, trình làng ngày 15/11, chỉ xuất hiện vỏn vẹn hơn ba ngày dưới dạng thử nghiệm trước khi biến mất.

Vài giờ sau khi bản beta xuất hiện, các nhà khoa học liên tục chia sẻ kết quả sai của AI từ Meta lên mạng xã hội. "Tôi vừa ngạc nhiên, vừa không ngạc nhiên. Khi Meta trình diễn, chúng trông thật tuyệt vời, kỳ diệu và thông minh. Nhưng về nguyên tắc, những thứ như vậy không thể hoạt động theo cách thổi phồng", Chirag Shah, chuyên gia nghiên cứu về công nghệ tìm kiếm tại Đại học Washington, nhận xét.

Theo Technology Review, AI của Meta giống như "con bot không có đầu óc", không thể phân biệt sự thật với hư cấu. "Vấn đề cơ bản nhất của Galactica là nó không thể phân biệt thật giả - yêu cầu cơ bản với mô hình ngôn ngữ được thiết kế để tạo ra văn bản khoa học", trang này bình luận. "Mọi người phát hiện nó đã tạo ra các bài viết giả hoặc sai sự thật. Nó không thể qua mặt được các nhà khoa học, nhưng có thể khiến những người chưa am hiểu chủ đề đó hiểu nhầm".

Galactica cũng có lỗ hổng về khả năng nhận chủ đề. Khi được yêu cầu tạo văn bản về các chủ đề như “phân biệt chủng tộc” và “AIDS”, trợ lý này trả lời: “Xin lỗi, truy vấn của bạn không vượt qua bộ lọc nội dung của chúng tôi. Hãy thử lại và ghi nhớ đây là một mô hình ngôn ngữ khoa học".

Theo Technology Review, AI của Meta giống như
Theo Technology Review, AI của Meta không thể phân biệt sự thật với hư cấu.

Meta từ chối đưa ra lý do gỡ bỏ Galactica. Trên Twitter, đại diện công ty viết: "Cảm ơn đã dùng thử bản demo Galactica. Chúng tôi đánh giá cao phản hồi cho đến nay từ cộng đồng và đã dừng bản demo. Tuy nhiên, nó vẫn có sẵn cho các nhà nghiên cứu muốn tìm hiểu".

Trong khi đó, nhóm Meta đứng sau Galactica khẳng định mô hình ngôn ngữ như Galactica tốt hơn các công cụ tìm kiếm hiện có. "Chúng tôi tin đây là nền tảng tiếp theo cho cách con người tiếp cận kiến thức khoa học", đại diện nhóm nói.

"Sai lầm của Meta và sự ngạo mạn của công ty một lần nữa cho thấy Big Tech đang có những hạn chế nghiêm trọng khi phát triển các mô hình ngôn ngữ lớn", Technology Review bình luận.

Meta không phải là công ty duy nhất ủng hộ ý tưởng rằng các mô hình ngôn ngữ có thể thay thế các công cụ tìm kiếm. Trong vài năm qua, Google cũng đã quảng bá mô hình ngôn ngữ PaLM của mình như một cách để tra cứu thông tin.

"Thật liều lĩnh và vô trách nhiệm khi nói rằng văn bản gần giống của con người mà các mô hình này tạo ra chứa thông tin đáng tin cậy, như Meta đã làm khi quảng cáo Galactica", theo đánh giá của MIT Technology Review.

Vào năm 2016, Microsoft đã ra mắt một chatbot có tên là Tay, và gỡ xuống 16 giờ sau đó khi người dùng phát hiện trợ lý này đã trở thành một chatbot phân biệt chủng tộc và kỳ thị đồng tính do đầu vào dữ liệu. Bây giờ, Meta lặp lại sai lầm với Galactica.

“Các công ty công nghệ lớn tiếp tục làm điều này, và họ sẽ không dừng lại đơn giản bởi vì họ có thể làm. Họ nghĩ rằng đây là tương lai của việc truy cập thông tin”, Shah nói.

Mai Anh (T/h)