Thứ bảy 28/12/2024 17:47
Hotline: 024.355.63.010
Email: banbientap.dnhn@gmail.com
Kinh tế số

Quá trình đào tạo AI của OpenAI và Meta bị kiện vì vấn đề bản quyền

10/07/2023 18:57
Các vụ kiện này đã nhấn mạnh những rủi ro pháp lý mà nhà phát triển chatbot AI gặp phải khi sử dụng kho tài liệu có bản quyền để tạo ứng dụng.
Ảnh minh họa
Ảnh minh họa.

Diễn viên hài Sarah Silverman và hai tác giả đã đệ đơn kiện Meta Platforms và OpenAI vi phạm bản quyền với cáo buộc sử dụng nội dung của họ mà không được phép để đào tạo các mô hình ngôn ngữ trí tuệ nhân tạo (AI).

Các vụ kiện tập thể được Sarah Silverman, Richard Kadrey, Christopher Golden đệ trình tại tòa án liên bang San Francisco (Mỹ), cáo buộc công ty mẹ Facebook và nhà sản xuất ChatGPT đã sử dụng tài liệu có bản quyền của họ để huấn luyện các bot trò chuyện mà không được phép.

Cụ thể, Silverman, Kadrey và Golden cáo buộc Meta và OpenAI đã sử dụng sách của họ mà không được phép để phát triển mô hình ngôn ngữ lớn, thứ mà các nhà sản xuất quảng cáo là công cụ mạnh mẽ để tự động hóa các tác vụ bằng cách sao chép cuộc trò chuyện của con người.

Trong vụ kiện chống lại Meta, các nguyên đơn cáo buộc rằng thông tin rò rỉ về hoạt động kinh doanh trí tuệ nhân tạo của công ty cho thấy tác phẩm của họ đã bị sử dụng trái phép. Trong khi vụ kiện chống lại OpenAI cáo buộc rằng, bản tóm tắt công việc của nguyên đơn do ChatGPT tạo ra cho thấy bot đã được đào tạo về nội dung có bản quyền của họ.

“Các bản tóm tắt có một số chi tiết sai” nhưng vẫn cho thấy rằng ChatGPT “giữ lại kiến thức về các tác phẩm cụ thể trong tập dữ liệu đào tạo”, hồ sơ vụ kiện cho biết.

Meta Platforms và OpenAI (công ty khởi nghiệp được Microsoft đầu tư hàng tỉ USD) không trả lời ngay lập tức khi được đề nghị bình luận về chuyện này.

Các vụ kiện này đã nhấn mạnh những rủi ro pháp lý mà nhà phát triển chatbot AI gặp phải khi sử dụng kho tài liệu có bản quyền để tạo ứng dụng mang lại phản hồi thực tế cho truy vấn của người dùng.

Trước đó, hãng luật Clarkson (ở bang California, Mỹ) đã tiến hành vụ kiện tập thể chống lại OpenAI, cáo buộc công ty này vi phạm nghiêm trọng bản quyền và quyền riêng tư của vô số người khi sử dụng dữ liệu thu thập được từ internet để huấn luyện công nghệ của mình.

Theo vụ kiện dài 157 trang từ Clarkson, OpenAI đã vi phạm các luật về quyền riêng tư bằng cách thu thập bí mật 300 tỉ từ trên internet, bao gồm "sách, bài viết, trang web, bài đăng, thông tin cá nhân mà không có sự cho phép", để huấn luyện mô hình ngôn ngữ lớn.

Clarkson muốn đại diện cho “những người thực sự có thông tin bị đánh cắp và sử dụng sai mục đích thương mại để tạo ra công nghệ rất mạnh mẽ này”, theo Ryan Clarkson - thành viên quản lý của công ty luật.

Clarkson đệ trình vụ kiện lên tòa án liên bang ở quận phía bắc California hôm 28.6.

Đầu tháng 5, ba học giả Kent Chang, Mackenzie Cramer, Sandeep Soni và David Bamman tại Đại học California ở thành phố Berkeley (Mỹ) cũng đã phát hiện ChatGPT cùng mô hình ngôn ngữ lớn GPT-4 của OpenAI ghi nhớ nội dung hàng trăm cuốn sách có bản quyền.

Các học giả này mô tả về khả năng ghi nhớ của ChatGPT/GPT-4 với các tài liệu có bản quyền trong bài viết Speak, Memory: An Archaeology of Books Known to ChatGPT/GPT-4.

“Chúng tôi thấy rằng các mô hình OpenAI đã ghi nhớ một bộ sưu tập lớn các tài liệu có bản quyền và mức độ ghi nhớ này liên quan đến tần suất xuất hiện của các đoạn văn trong những cuốn sách đó”, các nhà nghiên cứu này giải thích.

Có thể thấy, các chương trình AI sáng tạo như chatbot ChatGPT của OpenAI và trình tạo hình ảnh DALL-E 2, cũng như các trình tạo hình ảnh khác như: Stable Diffusion và Midjourney của Stability AI đều không ngừng phát triển. Tất cả thể hiện khả năng sáng tạo vô tận và sản xuất nội dung ngày càng tinh vi, phức tạp hơn của AI. Để làm được điều đó, trí tuệ nhân tạo AI cần thu thập lượng lớn dữ liệu bao gồm: văn bản, hình ảnh, video,…

Mặt khác, thật không dễ để kiểm soát data đầu vào mà AI tổng hợp thu thập và học tập, bởi hầu hết mọi thứ mô hình này có được đều là dữ liệu trên Internet. Vì thế, sẽ rất khó phân biệt đúng sai nếu những AI “lấy nhầm” nội dung lậu.

Thu Phương (t/h)

Tin bài khác
Galaxy S27 có thể là dòng điện thoại đầu tiên sử dụng chip 2nm của Samsung

Galaxy S27 có thể là dòng điện thoại đầu tiên sử dụng chip 2nm của Samsung

Việc phát triển chip 2nm giúp Samsung củng cố vị thế trong lĩnh vực sản xuất bán dẫn và đảm bảo khả năng cạnh tranh của các sản phẩm chủ lực như Galaxy S27.
Hàn Quốc đẩy nhanh khởi công trung tâm sản xuất chip lớn nhất thế giới

Hàn Quốc đẩy nhanh khởi công trung tâm sản xuất chip lớn nhất thế giới

Dự án dự kiến sẽ thu hút tới 246,4 tỷ USD vốn đầu tư tư nhân, tạo ra 1,6 triệu việc làm và tạo ra sản lượng sản xuất khoảng 271,5 tỷ USD.
Galaxy S25 Slim: Đột phá công nghệ với camera thiết kế siêu mỏng

Galaxy S25 Slim: Đột phá công nghệ với camera thiết kế siêu mỏng

Galaxy S25 Slim sẽ có cụm 3 camera sau, với camera chính độ phân giải 200 megapixel, vượt trội so với iPhone 17 Air của Apple, dự kiến chỉ có một camera.
Tham vọng iPhone 18 với màn hình không viền của Apple đứng trước nhiều thử thách

Tham vọng iPhone 18 với màn hình không viền của Apple đứng trước nhiều thử thách

iPhone 18 với màn hình không viền dự kiến ra mắt vào năm 2026. Tuy nhiên, các cuộc đàm phán với nhà cung cấp vẫn chưa hoàn tất, khiến khả năng trì hoãn rất cao.
BWF Ventures cam kết đóng góp cho cộng đồng doanh nghiệp Việt Nam vươn tầm quốc tế và kiến tạo tương lai số hóa

BWF Ventures cam kết đóng góp cho cộng đồng doanh nghiệp Việt Nam vươn tầm quốc tế và kiến tạo tương lai số hóa

Vừa qua, Hội nghị VDCA Conference 2024 tổ chức tại TP.HCM đã thu hút hơn 500 CEO, chuyên gia, nhà lãnh đạo cùng hơn 1.000 khán giả. Đây là sự kiện thường niên lớn nhất trong lĩnh vực công nghệ số và truyền thông. Với chủ đề "Pioneering Digital Frontiers – Innovate For Tomorrow", 12 diễn giả nổi tiếng đã chia sẻ 20 chuyên đề chuyên sâu, tập trung vào các xu hướng hàng đầu trong marketing, chuyển đổi số, và công nghệ AI.
Bước đi mới của ông lớn công nghệ Apple

Bước đi mới của ông lớn công nghệ Apple

Apple được cho là đang giảm phụ thuộc vào bên thứ 3, gồm cả Nvidia, giữa lúc nhà sản xuất iPhone vẫn phải hợp tác để vận hành tính năng của Apple Intelligence.
Vì sao Apple không phát triển công cụ tìm kiếm ?

Vì sao Apple không phát triển công cụ tìm kiếm ?

Mặc dù quyết định của Apple có thể khiến một số người dùng tiếc nuối, nhưng khi nhìn vào các ưu tiên chiến lược của công ty, quyết định này hoàn toàn có cơ sở.
MacBook Air M4, iPhone SE 4 và iPad 11 sẽ là những sản phẩm đầu tiên của Apple trong năm 2025

MacBook Air M4, iPhone SE 4 và iPad 11 sẽ là những sản phẩm đầu tiên của Apple trong năm 2025

Apple dự kiến khởi đầu năm 2025 với MacBook Air nâng cấp sử dụng chip M4, theo sau đó là các sản phẩm như iPhone SE 4 và iPad thế hệ thứ 11.
Tổ chức đấu giá khối băng tần 700 MHz dùng cho mạng 4G và 5G

Tổ chức đấu giá khối băng tần 700 MHz dùng cho mạng 4G và 5G

Cả ba khối băng tần được đấu giá đều được quy hoạch để triển khai các hệ thống thông tin di động theo tiêu chuẩn IMT-Advanced và các phiên bản tiếp theo.
Hướng dẫn cách xác thực tài khoản Facebook

Hướng dẫn cách xác thực tài khoản Facebook

Việc xác thực số điện thoại cho tài khoản Facebook không chỉ giúp người dùng tuân thủ quy định pháp luật mà còn tăng cường bảo mật và đảm bảo quyền lợi.
Chiến lược mới của Amazon để chinh phục thị trường giá rẻ

Chiến lược mới của Amazon để chinh phục thị trường giá rẻ

Ứng dụng gian hàng Haul là câu trả lời của Amazon cho sự bùng nổ của các ứng dụng từ Trung Quốc như Temu của PDD Holdings và nhà bán lẻ thời trang nhanh Shein.
Galaxy Tab S10 FE sắp trình làng với thiết kế tối giản và cấu hình cải tiến

Galaxy Tab S10 FE sắp trình làng với thiết kế tối giản và cấu hình cải tiến

Galaxy Tab S10 FE có thể sẽ tiếp tục duy trì thiết kế tối giản và thanh lịch của thế hệ tiền nhiệm cùng một số cải tiến về cấu hình.
VinFast sẽ áp dụng chính sách miễn phí sạc pin tới hết tháng 6/2027

VinFast sẽ áp dụng chính sách miễn phí sạc pin tới hết tháng 6/2027

Chính sách miễn phí sạc pin kéo dài của VinFast được kỳ vọng sẽ thuyết phục người tiêu dùng chuyển đổi sang xe điện, góp phần kiến tạo môi trường xanh bền vững.
Mỹ mở cuộc điều tra về sản xuất chip của Trung Quốc

Mỹ mở cuộc điều tra về sản xuất chip của Trung Quốc

Cuộc điều tra nhằm đánh giá mức độ phụ thuộc của Mỹ vào chip cũ của Trung Quốc, dùng trong ôtô, máy rửa chén, mạng viễn thông và vũ khí quân sự.
Apple tiến gần tới mức định giá 4.000 tỷ USD

Apple tiến gần tới mức định giá 4.000 tỷ USD

Hiện tại, Apple có giá trị vốn hóa khoảng 3.860 tỷ USD, lớn hơn tổng giá trị thị trường chứng khoán của Đức và Thụy Sĩ cộng lại.