Apple công bố mô hình AI mới được đánh giá cao hơn GPT-4 của OpenAI

11:30 03/04/2024

So với GPT-4, ReALM được đánh giá cao hơn ở khả năng xử lý các ngữ cảnh phức tạp, đặc biệt là những ngữ cảnh liên quan đến hình ảnh và video.

Ảnh minh họa
Ảnh minh họa.

Apple vừa công bố ReALM, mô hình AI mới được đánh giá cao hơn cả GPT-4 của OpenAI. Theo các nhà nghiên cứu của Apple, ReALM là mô hình ngôn ngữ có khả năng hiểu và xử lý thành công các ngữ cảnh khác nhau, mở ra tiềm năng to lớn cho các ứng dụng AI trong tương lai.

Điểm nổi bật của ReALM là khả năng giải quyết tham chiếu, một vấn đề quan trọng trong AI. Tham chiếu ở đây là các thực thể được đề cập trong một câu chuyện hoặc cuộc trò chuyện, ví dụ như tên người, địa điểm, sự kiện, ... Khả năng giải quyết tham chiếu hiệu quả giúp AI hiểu rõ hơn ngữ cảnh và đưa ra phản hồi chính xác, phù hợp hơn.

Thông tin về ReALM (Reference Resolution As Language Modeling) xuất hiện không lâu sau khi có thông tin tiết lộ rằng, Apple có thể hợp tác với Google để tích hợp Gemini vào iOS 18 và tổ chức các cuộc đàm phán với OpenAI - công ty đã tạo ra ChatGPT. Ngoài ra, nhà sản xuất iPhone cũng đã mua lại hàng loạt startup liên quan đến ngành AI.

Các nhà phát triển ReALM cho biết mô hình AI này sẽ nhanh và hiệu quả hơn so với ChatGPT trong một số hoạt động. ReALM cũng được hứa hẹn có khả năng hiểu bối cảnh tham chiếu khác nhau của các yếu tố hình ảnh trên màn hình, chuyển đổi hình ảnh thành văn bản, tạo ra các tương tác đàm thoại và tự nhiên hơn với trợ lý giọng nói.

Apple dự kiến sẽ áp dụng công nghệ ReALM vào Siri trong thời gian sớm nhất. Ngoài ra, Apple cũng đang nghiên cứu một chiến lược AI toàn diện hơn, dự kiến sẽ được công bố tại sự kiện WWDC 2024 vào tháng 6. Chiến lược này bao gồm việc phát triển các mô hình AI nhỏ gọn hơn, bảo mật hơn và có thể hoạt động trực tiếp trên thiết bị. 

So với GPT-4, ReALM được đánh giá cao hơn ở khả năng xử lý các ngữ cảnh phức tạp, đặc biệt là những ngữ cảnh liên quan đến hình ảnh và video. Trong bài báo khoa học giới thiệu ReALM, các nhà nghiên cứu của Apple cho biết, họ đã sử dụng ảnh chụp màn hình để hỗ trợ ReALM giải quyết các tham chiếu trên màn hình, giúp cải thiện hiệu suất đáng kể so với GPT-4.

“Chúng tôi đã chứng minh những cải tiến lớn so với hệ thống hiện có với chức năng tương tự trên nhiều loại tài liệu tham khảo khác nhau, trong đó mô hình nhỏ của chúng tôi đạt được mức cải thiện 5% về số tài liệu tham khảo trên màn hình. Các mô hình lớn hơn hoạt động tốt hơn đáng kể so với GPT-4”, nhóm phát triển cho biết.

Mặc dù vậy, Apple vẫn còn rất nhiều việc phải làm phía trước do ReALM có những hạn chế khi quản lý các tài liệu tham khảo trực quan phức tạp hơn khi cần phân biệt giữa nhiều hình ảnh. Với kết quả ban đầu, ReALM sẽ rất hứa hẹn và có thể khiến Siri cũng như các thành phần khác trong hệ điều hành của Apple có thể mang lại những lợi ích to lớn cho người dùng.

Với sự phát triển không ngừng của công nghệ AI, ReALM và các mô hình tương tự sẽ đóng vai trò quan trọng trong việc định hình tương lai của tương tác giữa con người và máy móc, đặc biệt là trong lĩnh vực trợ lý giọng nói và xử lý ngôn ngữ tự nhiên.

Thu Hà (T/h)

Tags: