Thứ năm 26/12/2024 17:48
Hotline: 024.355.63.010
Email: banbientap.dnhn@gmail.com
Kinh tế số

Apple: Mô hình AI không thật sự thông minh như nhiều người lo ngại

20/10/2024 22:08
Theo Apple, khó có thể nói các mô hình ngôn ngữ lớn hiện nay có khả năng suy luận, chúng chỉ đơn thuần làm theo các khuôn mẫu phức tạp có sẵn trong kho dữ liệu.
Apple: Mô hình AI không thật sự thông minh như nhiều người lo ngại
Cá nhà nghiên cứu Apple tiết lộ, mô hình AI không thật sự thông minh như nhiều người lo ngại.

Nghiên cứu từ Apple cho thấy, các mô hình ngôn ngữ lớn (LLM) phổ biến nhất hiện nay không thông minh như nhiều người lo ngại.

Các LLM từ OpenAI, Google hay Meta được đánh giá có thể tương tác tự nhiên với con người, gần nhất là mô hình OpenAI o1 "với khả năng lập luận". Dù vậy, theo nhóm nghiên cứu của Apple, chúng chỉ đơn thuần là "khớp mẫu tinh vi" thay vì "thực sự suy luận logic".

Mô hình ngôn ngữ lớn (LLM) là tập hợp các trí tuệ nhân tạo (AI) tiên tiến. Được thiết kế có khả năng xử lý, hiểu và tạo ra văn bản, ngôn ngữ tự nhiên giống như con người. Chúng được xây dựng dựa trên cơ sở của các kiến thức. Và thường được huấn luyện trên lượng lớn dữ liệu như sách, trang web, bài báo cáo.

Trong vài năm qua, nhiều LLM như ChatGPT đã phát triển đến mức nhiều người dùng bắt đầu tự hỏi liệu họ có thực sự sở hữu trí thông minh hay không. Trong nỗ lực mới này, nhóm tại Apple đã giải quyết câu hỏi bằng cách cho rằng, câu trả lời nằm ở khả năng của một sinh vật thông minh, hoặc máy móc, để hiểu được những sắc thái hiện diện trong những tình huống đơn giản, đòi hỏi phải có lý luận logic.

Một sắc thái như vậy là khả năng tách thông tin có liên quan khỏi thông tin không liên quan. Ví dụ, nếu một đứa trẻ hỏi cha mẹ có bao nhiêu quả táo trong một túi, đồng thời lưu ý rằng một số quả quá nhỏ để ăn, thì cả đứa trẻ và cha mẹ đều hiểu rằng, kích thước của những quả táo không liên quan gì đến số lượng chúng có mặt. Điều này là do cả hai đều có khả năng suy luận logic. Tuy nhiên đối với máy móc thì chúng chưa thực sự có khả năng đó.

Trong nghiên cứu mới này, các nhà nghiên cứu đã kiểm tra khả năng hiểu thực sự những gì được yêu cầu của một số LLM bằng cách gián tiếp yêu cầu họ bỏ qua những thông tin không liên quan.

Việc thử nghiệm của họ bao gồm việc hỏi nhiều LLM hàng trăm câu hỏi đã từng được sử dụng trước đây như một phương tiện để kiểm tra khả năng của LLM, nhưng các nhà nghiên cứu cũng đưa vào một số thông tin không liên quan. Và họ thấy rằng, điều đó đủ để khiến các LLM đưa ra câu trả lời sai hoặc thậm chí vô nghĩa cho những câu hỏi mà trước đó chúng đã trả lời đúng.

Các nhà nghiên cứu cho rằng, điều này cho thấy các LLM không thực sự hiểu những gì nó được hỏi. Thay vào đó, nó nhận ra cấu trúc của một câu và sau đó đưa ra câu trả lời dựa trên những gì nó đã học được thông qua các thuật toán học máy.

Trưởng nhóm dự án, ông Mehrdad Farajtabar, nhấn mạnh rằng, ngay cả một thay đổi nhỏ như vậy cũng gây ra sự sụt giảm đáng kể về độ chính xác. Ông Farajtabar cho biết, điều này sẽ không thể xảy ra trong suy luận của con người - việc thay đổi tên trong một bài toán không ảnh hưởng đến khả năng giải bài của học sinh. Tuy nhiên, đối với các mô hình AI này, những thay đổi như vậy dẫn đến sự sụt giảm độ chính xác từ 10% trở lên, gây ra những lo ngại nghiêm trọng về tính ổn định của chúng.

Nói cách khác, khó có thể gọi các mô hình LLMs hiện nay là có khả năng suy luận, chúng chỉ đơn thuần làm theo các khuôn mẫu phức tạp có sẵn trong kho dữ liệu.

Những phát hiện này đặt ra một số vấn đề đáng lo ngại cho các ứng dụng AI trong các lĩnh vực như chăm sóc sức khỏe, ra quyết định và giáo dục, nơi tính nhất quán logic là điều bắt buộc. Nếu không cải thiện khả năng suy luận logic, các hệ thống AI hiện tại có thể gặp khó khăn khi hoạt động trong môi trường phức tạp hoặc quan trọng hơn.

Hiện các bên chưa đưa ra bình luận sau kết quả nghiên cứu của Apple.

Tin bài khác
Bước đi mới của ông lớn công nghệ Apple

Bước đi mới của ông lớn công nghệ Apple

Apple được cho là đang giảm phụ thuộc vào bên thứ 3, gồm cả Nvidia, giữa lúc nhà sản xuất iPhone vẫn phải hợp tác để vận hành tính năng của Apple Intelligence.
MacBook Air M4, iPhone SE 4 và iPad 11 sẽ là những sản phẩm đầu tiên của Apple trong năm 2025

MacBook Air M4, iPhone SE 4 và iPad 11 sẽ là những sản phẩm đầu tiên của Apple trong năm 2025

Apple dự kiến khởi đầu năm 2025 với MacBook Air nâng cấp sử dụng chip M4, theo sau đó là các sản phẩm như iPhone SE 4 và iPad thế hệ thứ 11.
Tổ chức đấu giá khối băng tần 700 MHz dùng cho mạng 4G và 5G

Tổ chức đấu giá khối băng tần 700 MHz dùng cho mạng 4G và 5G

Cả ba khối băng tần được đấu giá đều được quy hoạch để triển khai các hệ thống thông tin di động theo tiêu chuẩn IMT-Advanced và các phiên bản tiếp theo.
Hướng dẫn cách xác thực tài khoản Facebook

Hướng dẫn cách xác thực tài khoản Facebook

Việc xác thực số điện thoại cho tài khoản Facebook không chỉ giúp người dùng tuân thủ quy định pháp luật mà còn tăng cường bảo mật và đảm bảo quyền lợi.
Chiến lược mới của Amazon để chinh phục thị trường giá rẻ

Chiến lược mới của Amazon để chinh phục thị trường giá rẻ

Ứng dụng gian hàng Haul là câu trả lời của Amazon cho sự bùng nổ của các ứng dụng từ Trung Quốc như Temu của PDD Holdings và nhà bán lẻ thời trang nhanh Shein.
Galaxy Tab S10 FE sắp trình làng với thiết kế tối giản và cấu hình cải tiến

Galaxy Tab S10 FE sắp trình làng với thiết kế tối giản và cấu hình cải tiến

Galaxy Tab S10 FE có thể sẽ tiếp tục duy trì thiết kế tối giản và thanh lịch của thế hệ tiền nhiệm cùng một số cải tiến về cấu hình.
VinFast sẽ áp dụng chính sách miễn phí sạc pin tới hết tháng 6/2027

VinFast sẽ áp dụng chính sách miễn phí sạc pin tới hết tháng 6/2027

Chính sách miễn phí sạc pin kéo dài của VinFast được kỳ vọng sẽ thuyết phục người tiêu dùng chuyển đổi sang xe điện, góp phần kiến tạo môi trường xanh bền vững.
Mỹ mở cuộc điều tra về sản xuất chip của Trung Quốc

Mỹ mở cuộc điều tra về sản xuất chip của Trung Quốc

Cuộc điều tra nhằm đánh giá mức độ phụ thuộc của Mỹ vào chip cũ của Trung Quốc, dùng trong ôtô, máy rửa chén, mạng viễn thông và vũ khí quân sự.
Dịch vụ taxi bay đầu tiên trên thế giới sẽ được triển khai tại Abu Dhabi

Dịch vụ taxi bay đầu tiên trên thế giới sẽ được triển khai tại Abu Dhabi

Những chiếc taxi bay này có thể đạt tốc độ 240 km/h, vận chuyển tối đa bốn hành khách trên mỗi chuyến và cắt giảm tới 80% thời gian di chuyển.
Cảnh báo lừa đảo qua thiệp chúc mừng Giáng sinh trên email giả mạo

Cảnh báo lừa đảo qua thiệp chúc mừng Giáng sinh trên email giả mạo

Các đối tượng giả mạo email, sử dụng logo của các sàn thương mại điện tử uy tín như Amazon, Shopee, Taobao và gửi đi dưới dạng thiệp chúc mừng Giáng Sinh.
AirPods Pro 3 sẽ có khả năng theo dõi nhịp tim và sức khỏe?

AirPods Pro 3 sẽ có khả năng theo dõi nhịp tim và sức khỏe?

AirPods Pro 3 sẽ sớm thành thiết bị theo dõi sức khỏe độc lập, dành cho người không muốn đeo Apple Watch mà vẫn có thể sử dụng các tính năng theo dõi sức khỏe.
Google bị cáo buộc vi phạm luật chống độc quyền tại Nhật Bản

Google bị cáo buộc vi phạm luật chống độc quyền tại Nhật Bản

Google được cho là đã yêu cầu các nhà sản xuất điện thoại phải cài đặt Google Play của mình như một phần của gói ứng dụng tìm kiếm trên trình duyệt web Chrome.
Quy mô thị trường thương mại điện tử Việt Nam vượt 25 tỷ USD

Quy mô thị trường thương mại điện tử Việt Nam vượt 25 tỷ USD

Trong khu vực, quy mô thương mại điện tử Việt Nam hiện chỉ sau 2 nước là Indonesia (65 tỷ USD) và Thái Lan (26 tỷ USD).
OpenAI thử nghiệm các mô hình AI lý luận mới

OpenAI thử nghiệm các mô hình AI lý luận mới

Với dự định thử nghiệm và ra mắt mô hình mới, OpenAI tiếp tục củng cố vị thế tiên phong ở lĩnh vực AI của mình, đồng thời đặt ra thách thức lớn cho các đối thủ.
Netflix chỉ phổ biến phim, gỡ các chương trình truyền hình chiếu tại Việt Nam

Netflix chỉ phổ biến phim, gỡ các chương trình truyền hình chiếu tại Việt Nam

Việc gỡ bỏ các chương trình truyền hình tại Việt Nam sẽ đem tới bất lợi đáng kể cho Netflix, do dịch vụ này thu hút nhờ các chương trình thực tế hay TV show,...