Thứ tư 18/03/2026 20:53
Hotline: 024.355.63.010
Kinh tế số

Apple, Nvidia và Anthropic bị chỉ trích vì sử dụng trái phép dữ liệu YouTube để đào tạo AI

18/07/2024 12:14
Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.
Ảnh minh họa
Ảnh minh họa.

Wall Street Journal dẫn kết quả mới đây của cuộc điều tra từ Proof News cho thấy, Apple, Nvidia và Anthropic đã sử dụng bộ dữ liệu tạo bởi công ty phi lợi nhuận có tên EleutherAI, chứa hơn 173.000 các bản ghi lại nội dung video YouTube của hơn 48.000 kênh mà không hề có sự xin phép chủ sở hữu hay nhà sáng tạo nội dung.

Mặc dù tập dữ liệu không chứa hình ảnh hay video, song các nội dung được lấy lại từ những nhà sáng tạo nội dung hàng đầu trên nền tảng như Marques Brownlee và MrBeast, cũng như các nhà xuất bản tin tức lớn như The New York Times, BBC và ABC News. Ngoài ra, còn có phụ đề từ các video thuộc về Engadget.

“Apple sử dụng dữ liệu từ một số công ty để huấn luyện cho AI của họ. Một trong số đó là các dữ liệu, bản ghi từ các video trên YouTube, bao gồm cả của tôi”, Brownlee, một người có sức ảnh hưởng trên YouTube đăng bài trên X.

Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.

Apple, NVIDIA, Anthropic và EleutherAI đã không trả lời yêu cầu bình luận từ Engadget.

Người đứng đầu bộ phận AI và học máy tại Apple, ông John Giannandrea, cũng từng phát biểu rằng, "lượng lớn dữ liệu đào tạo thực sự được tạo ra bởi chính Apple" nhưng không đi vào chi tiết.

Gã khổng lồ công nghệ Thung lũng Silicon cũng được cho là đã ký thỏa thuận với Shutterstock và Photobucket nhằm cấp phép cho hình ảnh đào tạo dữ liệu AI, nhưng chưa xác nhận công khai mối quan hệ hợp tác. Trong khi Apple Intelligence cố gắng luôn cố gắng nhấn mạnh cách tiếp cận tập trung nhiều hơn vào quyền riêng tư thông qua bộ xử lý trên thiết bị và điện toán đám mây tùy chỉnh, thì dường như nguyên tắc cơ bản khi thu thập dữ liệu nền tảng cho mô hình AI của công ty không khác gì so với đa số đối thủ cạnh tranh.

Đầu tháng này, các nghệ sĩ và nhiếp ảnh gia đã chỉ trích Apple vì đã không tiết lộ nguồn dữ liệu đào tạo cho Apple Intelligence, công ty sở hữu công nghệ AI sắp ra mắt trên hàng triệu thiết bị Apple trong năm nay.

YouTube, kho lưu trữ video lớn nhất thế giới, là một kho vàng không chỉ có bản ghi mà còn cả âm thanh, video và hình ảnh, khiến nó trở thành một bộ dữ liệu hấp dẫn để đào tạo các mô hình AI. Đầu năm nay, Giám đốc công nghệ của OpenAI, Mira Murati, đã né tránh các câu hỏi từ The Wall Street Journal về việc liệu công ty có sử dụng video YouTube để đào tạo Sora, công cụ tạo video AI sắp ra mắt của OpenAI hay không. Murati cho biết vào thời điểm đó: “Tôi sẽ không đi sâu vào chi tiết về dữ liệu đã được sử dụng, nhưng đó là dữ liệu được cấp phép hoặc có sẵn công khai.

Giám đốc điều hành Alphabet Sundar Pichai cũng cho biết, các công ty sử dụng dữ liệu từ YouTube để đào tạo các mô hình AI của họ sẽ vi phạm điều khoản dịch vụ của nền tảng này.

Mới đây, Apple đã phải nộp phạt 210 triệu won (hơn 4 tỷ đồng) sau khi bị Ủy ban Truyền thông Hàn Quốc KCC cáo buộc thu thập dữ liệu vị trí mà không có sự đồng ý của người dùng. Hành vi của Apple vi phạm điều khoản liên quan dữ liệu vị trí và các chính sách khác của Hàn Quốc. Ngoài Apple, KCC cũng phạt Google, nhưng ở mức 3 triệu won (60 triệu đồng).

Thu Trà (t/h)

TAGS:

Tin bài khác
Nvidia đặt cược vào “AI vận hành”, dự báo thị trường chip đạt 1.000 tỷ USD

Nvidia đặt cược vào “AI vận hành”, dự báo thị trường chip đạt 1.000 tỷ USD

Tại hội nghị công nghệ GTC 2026 diễn ra ở San Jose (Mỹ), CEO Jensen Huang công bố bước chuyển chiến lược quan trọng của Nvidia: tập trung vào giai đoạn vận hành AI (AI inference), nơi các mô hình trí tuệ nhân tạo được triển khai vào thực tế.
Samsung đối mặt nguy cơ thua lỗ lần đầu ở mảng di động dù Galaxy S26 bán chạy

Samsung đối mặt nguy cơ thua lỗ lần đầu ở mảng di động dù Galaxy S26 bán chạy

Dù Galaxy S26 đạt doanh số khả quan, Samsung vẫn phải đối mặt bài toán lớn hơn: làm sao duy trì lợi nhuận trong một thị trường smartphone ngày càng cạnh tranh và chi phí ngày càng cao.
Oppo Find X9 Ultra rò rỉ camera 10x: Khẩu độ lớn hơn, tham vọng dẫn đầu nhiếp ảnh di động

Oppo Find X9 Ultra rò rỉ camera 10x: Khẩu độ lớn hơn, tham vọng dẫn đầu nhiếp ảnh di động

Oppo Find X9 Ultra lộ thông tin camera 10x periscope khẩu độ f/3.5, cảm biến telephoto 200MP và hệ thống camera nâng cấp mạnh, hứa hẹn cạnh tranh trực tiếp trong phân khúc flagship cao cấp.
Công nghệ UAV bầy đàn hỗ trợ chữa cháy trong đô thị

Công nghệ UAV bầy đàn hỗ trợ chữa cháy trong đô thị

Công ty CT UAV, thành viên của CT Group, đang phát triển hệ thống UAV bầy đàn chữa cháy mang tên Fire Swarm, hướng đến giải quyết bài toán xử lý hỏa hoạn tại các khu vực ngõ nhỏ, hẻm sâu – nơi phương tiện cứu hỏa truyền thống khó tiếp cận.
Xuất hiện khái niệm “drone chúa” mang hàng nghìn UAV

Xuất hiện khái niệm “drone chúa” mang hàng nghìn UAV

Những nền tảng máy bay không người lái siêu tải trọng, có khả năng mang theo hàng trăm đến hàng nghìn UAV cỡ nhỏ, có thể sớm xuất hiện trong tương lai gần.
Xiaomi 17 Ultra có gì mới khi sở hữu camera 200MP và pin 6000mAh?

Xiaomi 17 Ultra có gì mới khi sở hữu camera 200MP và pin 6000mAh?

Xiaomi 17 Ultra là mẫu smartphone flagship mới được giới thiệu trong năm 2026, tiếp tục kế thừa định hướng công nghệ cao cấp của dòng Xiaomi Ultra.
Internet Việt Nam sẵn sàng cho “kinh tế tầm thấp”

Internet Việt Nam sẵn sàng cho “kinh tế tầm thấp”

Sự phát triển nhanh của hạ tầng viễn thông đang đưa Internet Việt Nam trở thành một trong những nền tảng quan trọng thúc đẩy kinh tế số, đặc biệt là các mô hình kinh tế mới như kinh tế tầm thấp (Low Altitude Economy – LAE).
Apple Music bắt đầu gắn nhãn nội dung AI trong âm nhạc

Apple Music bắt đầu gắn nhãn nội dung AI trong âm nhạc

Nền tảng nghe nhạc trực tuyến Apple Music vừa triển khai hệ thống “thẻ minh bạch” (transparency tags) nhằm giúp người dùng nhận biết liệu nội dung âm nhạc họ đang nghe có được tạo ra bằng trí tuệ nhân tạo (AI) hay không.
Làn sóng rời ChatGPT gây chú ý

Làn sóng rời ChatGPT gây chú ý

Một làn sóng người dùng tuyên bố ngừng sử dụng ChatGPT đang lan truyền trên mạng xã hội, làm dấy lên những cuộc tranh luận về niềm tin, minh bạch và sự cạnh tranh trong thị trường trí tuệ nhân tạo (AI) tạo sinh. Diễn biến này được cho là có thể tạo áp lực mới lên OpenAI – đơn vị phát triển nền tảng ChatGPT – trong bối cảnh nhiều dịch vụ AI khác đang nổi lên mạnh mẽ.
Samsung Galaxy S27: Cảm biến 200MP có thể sẽ được nâng cấp vào năm tới?

Samsung Galaxy S27: Cảm biến 200MP có thể sẽ được nâng cấp vào năm tới?

Khi Galaxy S26 còn chưa kịp “hạ nhiệt”, các tin rò rỉ đầu tiên về Galaxy S27 đã xuất hiện, tập trung vào một điểm quen mà vẫn gây tò mò: camera chính 200MP. Theo các nguồn rò rỉ trên Weibo được các trang công nghệ quốc tế tổng hợp, Samsung có thể giữ nguyên độ phân giải 200MP nhưng đổi cách “làm HDR” bằng công nghệ LOFIC để cải thiện ảnh trong môi trường tương phản mạnh.
Elon Musk quảng bá Grok là AI “không thức tỉnh”

Elon Musk quảng bá Grok là AI “không thức tỉnh”

Tỷ phú công nghệ Elon Musk gần đây tiếp tục quảng bá phiên bản mới nhất của chatbot trí tuệ nhân tạo Grok 4.20, đồng thời chỉ trích nhiều nền tảng AI lớn hiện nay là “yếu kém” và quá thận trọng trong cách trả lời.
Apple tung iPhone 17e: Tăng sức mạnh, thêm màu mới, giá từ 15,6 triệu đồng

Apple tung iPhone 17e: Tăng sức mạnh, thêm màu mới, giá từ 15,6 triệu đồng

Apple chính thức giới thiệu iPhone 17e với chip A19 thế hệ mới, camera 48MP, bộ nhớ tiêu chuẩn 256GB và hỗ trợ MagSafe. Dù được nâng cấp mạnh về cấu hình và tính năng, mẫu máy này vẫn giữ mức giá khởi điểm từ 15,6 triệu đồng, hướng đến phân khúc người dùng phổ thông cao cấp.
TP.Hồ Chí Minh: Sẽ tiên phong phát triển mô hình xúc tiến đầu tư số

TP.Hồ Chí Minh: Sẽ tiên phong phát triển mô hình xúc tiến đầu tư số

Công nghệ số sẽ được UBND TP.Hồ Chí Minh đưa vào ứng dụng trong lĩnh vực xúc tiến đầu tư nhằm giảm bớt các thủ tục và tăng cường các tiện ích cho cộng đồng doanh nghiệp.
Samsung đặt cược agentic AI với Galaxy S26, hợp tác Google phát triển “hệ điều hành AI”

Samsung đặt cược agentic AI với Galaxy S26, hợp tác Google phát triển “hệ điều hành AI”

Samsung ra mắt Galaxy S26 với trọng tâm agentic AI, tích hợp Perplexity, Gemini và phát triển “hệ điều hành AI” cùng Google, mở ra cuộc đua smartphone cao cấp 2026.
Galaxy S26 Ultra lộ diện trước giờ G

Galaxy S26 Ultra lộ diện trước giờ G

Chỉ vài ngày trước khi Samsung chính thức ra mắt dòng Galaxy S26 vào ngày 25/2, một cửa hàng tại Dubai đã bất ngờ đưa mẫu Galaxy S26 Ultra lên kệ. Sự cố “mở bán sớm” này khiến toàn bộ thiết kế và một số tính năng quan trọng của thiết bị bị lộ, thu hút sự quan tâm của cộng đồng công nghệ và giới kinh doanh thiết bị di động toàn cầu.