Thứ tư 30/10/2024 10:20
Hotline: 024.355.63.010
Kinh tế số

Apple, Nvidia và Anthropic bị chỉ trích vì sử dụng trái phép dữ liệu YouTube để đào tạo AI

18/07/2024 12:14
Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.
aa
Ảnh minh họa
Ảnh minh họa.

Wall Street Journal dẫn kết quả mới đây của cuộc điều tra từ Proof News cho thấy, Apple, Nvidia và Anthropic đã sử dụng bộ dữ liệu tạo bởi công ty phi lợi nhuận có tên EleutherAI, chứa hơn 173.000 các bản ghi lại nội dung video YouTube của hơn 48.000 kênh mà không hề có sự xin phép chủ sở hữu hay nhà sáng tạo nội dung.

Mặc dù tập dữ liệu không chứa hình ảnh hay video, song các nội dung được lấy lại từ những nhà sáng tạo nội dung hàng đầu trên nền tảng như Marques Brownlee và MrBeast, cũng như các nhà xuất bản tin tức lớn như The New York Times, BBC và ABC News. Ngoài ra, còn có phụ đề từ các video thuộc về Engadget.

“Apple sử dụng dữ liệu từ một số công ty để huấn luyện cho AI của họ. Một trong số đó là các dữ liệu, bản ghi từ các video trên YouTube, bao gồm cả của tôi”, Brownlee, một người có sức ảnh hưởng trên YouTube đăng bài trên X.

Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.

Apple, NVIDIA, Anthropic và EleutherAI đã không trả lời yêu cầu bình luận từ Engadget.

Người đứng đầu bộ phận AI và học máy tại Apple, ông John Giannandrea, cũng từng phát biểu rằng, "lượng lớn dữ liệu đào tạo thực sự được tạo ra bởi chính Apple" nhưng không đi vào chi tiết.

Gã khổng lồ công nghệ Thung lũng Silicon cũng được cho là đã ký thỏa thuận với Shutterstock và Photobucket nhằm cấp phép cho hình ảnh đào tạo dữ liệu AI, nhưng chưa xác nhận công khai mối quan hệ hợp tác. Trong khi Apple Intelligence cố gắng luôn cố gắng nhấn mạnh cách tiếp cận tập trung nhiều hơn vào quyền riêng tư thông qua bộ xử lý trên thiết bị và điện toán đám mây tùy chỉnh, thì dường như nguyên tắc cơ bản khi thu thập dữ liệu nền tảng cho mô hình AI của công ty không khác gì so với đa số đối thủ cạnh tranh.

Đầu tháng này, các nghệ sĩ và nhiếp ảnh gia đã chỉ trích Apple vì đã không tiết lộ nguồn dữ liệu đào tạo cho Apple Intelligence, công ty sở hữu công nghệ AI sắp ra mắt trên hàng triệu thiết bị Apple trong năm nay.

YouTube, kho lưu trữ video lớn nhất thế giới, là một kho vàng không chỉ có bản ghi mà còn cả âm thanh, video và hình ảnh, khiến nó trở thành một bộ dữ liệu hấp dẫn để đào tạo các mô hình AI. Đầu năm nay, Giám đốc công nghệ của OpenAI, Mira Murati, đã né tránh các câu hỏi từ The Wall Street Journal về việc liệu công ty có sử dụng video YouTube để đào tạo Sora, công cụ tạo video AI sắp ra mắt của OpenAI hay không. Murati cho biết vào thời điểm đó: “Tôi sẽ không đi sâu vào chi tiết về dữ liệu đã được sử dụng, nhưng đó là dữ liệu được cấp phép hoặc có sẵn công khai.

Giám đốc điều hành Alphabet Sundar Pichai cũng cho biết, các công ty sử dụng dữ liệu từ YouTube để đào tạo các mô hình AI của họ sẽ vi phạm điều khoản dịch vụ của nền tảng này.

Mới đây, Apple đã phải nộp phạt 210 triệu won (hơn 4 tỷ đồng) sau khi bị Ủy ban Truyền thông Hàn Quốc KCC cáo buộc thu thập dữ liệu vị trí mà không có sự đồng ý của người dùng. Hành vi của Apple vi phạm điều khoản liên quan dữ liệu vị trí và các chính sách khác của Hàn Quốc. Ngoài Apple, KCC cũng phạt Google, nhưng ở mức 3 triệu won (60 triệu đồng).

Thu Trà (t/h)

TAGS:

Tin bài khác
Microsoft tố Google hạ uy tín công ty tại châu Âu bằng chiến dịch ngầm

Microsoft tố Google hạ uy tín công ty tại châu Âu bằng chiến dịch ngầm

Việc Microsoft tố Google mở ra xung đột mới giữa 2 công ty đang cạnh tranh trong lĩnh vực hạ tầng đám mây, cũng như quảng cáo trực tuyến và phần mềm công việc.
Có bao nhiêu % dân số thế giới chưa được tiếp cận với internet di động?

Có bao nhiêu % dân số thế giới chưa được tiếp cận với internet di động?

Thời đại 4.0 “bùng nổ” việc sử dụng internet di động là nhu cầu thiết yếu, nhưng hiện nay có bao % dân số thế giới chưa được tiếp cận với internet di động?
Mỹ siết đầu tư AI vào Trung Quốc: Động thái chiến lược nhằm bảo vệ an ninh

Mỹ siết đầu tư AI vào Trung Quốc: Động thái chiến lược nhằm bảo vệ an ninh

Việc Mỹ siết đầu tư AI vào Trung Quốc nhằm ngăn chặn công nghệ và nguồn vốn Mỹ có thể bị sử dụng cho các mục tiêu quân sự hoặc an ninh quốc gia của Trung Quốc.
Apple Intelligence ra mắt trên iOS 18.1: Người dùng có thể trải nghiệm tính năng gì?

Apple Intelligence ra mắt trên iOS 18.1: Người dùng có thể trải nghiệm tính năng gì?

Trên iOS 18.1, lần đầu Apple cung cấp tính năng ghi âm cuộc gọi, sau đó Apple Intelligence có thể hỗ trợ chuyển giọng nói thành văn bản, tóm tắt nội dung chính.
Vì sao iPhone 16 không được phép tiếp thị tại Indonesia?

Vì sao iPhone 16 không được phép tiếp thị tại Indonesia?

Đây là trở ngại lớn đối với Apple, vốn đang tận hưởng doanh số bán hàng tốt của sản phẩm chủ lực là iPhone 16, đặc biệt khi nhu cầu tăng cao tại Trung Quốc.
Nguyên nhân gì khiến tốc độ 5G chưa ổn định, có lúc chậm hơn 4G?

Nguyên nhân gì khiến tốc độ 5G chưa ổn định, có lúc chậm hơn 4G?

Trước phản hồi của một số người dùng về việc gặp khó khăn trong truy cập và tốc độ mạng 5G chậm, đại diện Viettel đã đưa ra lời giải thích để làm rõ vấn đề này.
Apple chật vật giữ thị phần tại Trung Quốc giữa cuộc đua smartphone khốc liệt

Apple chật vật giữ thị phần tại Trung Quốc giữa cuộc đua smartphone khốc liệt

Apple đã phải đối mặt với thêm nhiều trở ngại ở thị trường Trung Quốc, gồm cả lệnh hạn chế sử dụng iPhone của một số cơ quan chính phủ.
Viettel An Giang ra mắt mạng 5G đầu tiên tại Việt Nam, đánh dấu 20 năm hành trình kết nối công nghệ

Viettel An Giang ra mắt mạng 5G đầu tiên tại Việt Nam, đánh dấu 20 năm hành trình kết nối công nghệ

Viettel chính thức khai trương mạng 5G đầu tiên tại Việt Nam, trùng với dịp kỷ niệm 20 năm kinh doanh dịch vụ di động và hướng tới 80 năm ngày thành lập QĐND.
Apple có thể đã yêu cầu đối tác cắt giảm sản lượng iPhone 16

Apple có thể đã yêu cầu đối tác cắt giảm sản lượng iPhone 16

Các chuyên gia chỉ ra rằng, việc thiếu đổi mới về phần cứng là một trong những nguyên nhân khiến nhu cầu đối với các mẫu iPhone mới của Apple trở nên giảm sút.
Chính sách hoa hồng mới của Temu liệu có thực sự hấp dẫn người dùng Việt?

Chính sách hoa hồng mới của Temu liệu có thực sự hấp dẫn người dùng Việt?

Vừa qua, Temu – sàn thương mại điện tử của Trung Quốc đã tung ra mức hoa hồng hấp dẫn khi cho người dùng tại Việt Nam đăng ký chương trình tiếp thị liên kết.
Phát hiện chip của TSMC được sử dụng trong các máy chủ AI của Huawei

Phát hiện chip của TSMC được sử dụng trong các máy chủ AI của Huawei

Theo báo cáo, một khách hàng bên thứ ba của TSMC đã cung cấp chip cho Huawei. Hiện chưa rõ khách hàng này có trụ sở ở đâu và hành động có chủ đích hay không.
EVNSPC trao đổi kinh nghiệm về quản lí lưới điện thông minh với Công ty Energy Pool (Pháp)

EVNSPC trao đổi kinh nghiệm về quản lí lưới điện thông minh với Công ty Energy Pool (Pháp)

Sáng 23/10, EVNSPC làm việc với Công ty Energy Pool, trao đổi về kinh nghiệm, giải pháp trong quản lý lưới điện thông minh và khả năng hợp tác giữa hai bên.
Bà Rịa- Vũng Tàu: Đẩy mạnh tuyên truyền phòng, chống lừa đảo trên không gian mạng

Bà Rịa- Vũng Tàu: Đẩy mạnh tuyên truyền phòng, chống lừa đảo trên không gian mạng

Để nâng cao kỹ năng phòng, chống lừa đảo trực tuyến cho người dân, UBND tỉnh Bà Rịa - Vũng Tàu đã triển khai nhiều biện pháp chủ động ứng phó với các thách thức từ không gian mạng.
Ngành hàng nào dẫn đầu về doanh số trên sàn thương mại điện tử trong quý III?

Ngành hàng nào dẫn đầu về doanh số trên sàn thương mại điện tử trong quý III?

Quý III, thị trường thương mại điện tử Việt Nam ghi nhận sự phát triển mạnh mẽ trong các ngành hàng như làm đẹp, giày dép nam, bách hóa - thực phẩm, thời trang.
Smartphone gập ba của Samsung có thể ra mắt vào năm 2025

Smartphone gập ba của Samsung có thể ra mắt vào năm 2025

Việc sản phẩm được phát hành hay không phụ thuộc vào quyết định từ bộ phận Mobile eXperience của Samsung Electronics, bộ phận phụ trách thiết bị gập của hãng.