Thứ năm 25/06/2026 17:23
Hotline: 024.355.63.010
Kinh tế số

Apple, Nvidia và Anthropic bị chỉ trích vì sử dụng trái phép dữ liệu YouTube để đào tạo AI

18/07/2024 12:14
Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.
Ảnh minh họa
Ảnh minh họa.

Wall Street Journal dẫn kết quả mới đây của cuộc điều tra từ Proof News cho thấy, Apple, Nvidia và Anthropic đã sử dụng bộ dữ liệu tạo bởi công ty phi lợi nhuận có tên EleutherAI, chứa hơn 173.000 các bản ghi lại nội dung video YouTube của hơn 48.000 kênh mà không hề có sự xin phép chủ sở hữu hay nhà sáng tạo nội dung.

Mặc dù tập dữ liệu không chứa hình ảnh hay video, song các nội dung được lấy lại từ những nhà sáng tạo nội dung hàng đầu trên nền tảng như Marques Brownlee và MrBeast, cũng như các nhà xuất bản tin tức lớn như The New York Times, BBC và ABC News. Ngoài ra, còn có phụ đề từ các video thuộc về Engadget.

“Apple sử dụng dữ liệu từ một số công ty để huấn luyện cho AI của họ. Một trong số đó là các dữ liệu, bản ghi từ các video trên YouTube, bao gồm cả của tôi”, Brownlee, một người có sức ảnh hưởng trên YouTube đăng bài trên X.

Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.

Apple, NVIDIA, Anthropic và EleutherAI đã không trả lời yêu cầu bình luận từ Engadget.

Người đứng đầu bộ phận AI và học máy tại Apple, ông John Giannandrea, cũng từng phát biểu rằng, "lượng lớn dữ liệu đào tạo thực sự được tạo ra bởi chính Apple" nhưng không đi vào chi tiết.

Gã khổng lồ công nghệ Thung lũng Silicon cũng được cho là đã ký thỏa thuận với Shutterstock và Photobucket nhằm cấp phép cho hình ảnh đào tạo dữ liệu AI, nhưng chưa xác nhận công khai mối quan hệ hợp tác. Trong khi Apple Intelligence cố gắng luôn cố gắng nhấn mạnh cách tiếp cận tập trung nhiều hơn vào quyền riêng tư thông qua bộ xử lý trên thiết bị và điện toán đám mây tùy chỉnh, thì dường như nguyên tắc cơ bản khi thu thập dữ liệu nền tảng cho mô hình AI của công ty không khác gì so với đa số đối thủ cạnh tranh.

Đầu tháng này, các nghệ sĩ và nhiếp ảnh gia đã chỉ trích Apple vì đã không tiết lộ nguồn dữ liệu đào tạo cho Apple Intelligence, công ty sở hữu công nghệ AI sắp ra mắt trên hàng triệu thiết bị Apple trong năm nay.

YouTube, kho lưu trữ video lớn nhất thế giới, là một kho vàng không chỉ có bản ghi mà còn cả âm thanh, video và hình ảnh, khiến nó trở thành một bộ dữ liệu hấp dẫn để đào tạo các mô hình AI. Đầu năm nay, Giám đốc công nghệ của OpenAI, Mira Murati, đã né tránh các câu hỏi từ The Wall Street Journal về việc liệu công ty có sử dụng video YouTube để đào tạo Sora, công cụ tạo video AI sắp ra mắt của OpenAI hay không. Murati cho biết vào thời điểm đó: “Tôi sẽ không đi sâu vào chi tiết về dữ liệu đã được sử dụng, nhưng đó là dữ liệu được cấp phép hoặc có sẵn công khai.

Giám đốc điều hành Alphabet Sundar Pichai cũng cho biết, các công ty sử dụng dữ liệu từ YouTube để đào tạo các mô hình AI của họ sẽ vi phạm điều khoản dịch vụ của nền tảng này.

Mới đây, Apple đã phải nộp phạt 210 triệu won (hơn 4 tỷ đồng) sau khi bị Ủy ban Truyền thông Hàn Quốc KCC cáo buộc thu thập dữ liệu vị trí mà không có sự đồng ý của người dùng. Hành vi của Apple vi phạm điều khoản liên quan dữ liệu vị trí và các chính sách khác của Hàn Quốc. Ngoài Apple, KCC cũng phạt Google, nhưng ở mức 3 triệu won (60 triệu đồng).

Thu Trà (t/h)

TAGS:

Tin bài khác
Australia mạnh tay với mạng xã hội

Australia mạnh tay với mạng xã hội

Thủ tướng Australia Anthony Albanese khẳng định Canberra cần tiếp tục củng cố lệnh cấm mạng xã hội đối với người dưới 16 tuổi, trong bối cảnh các nền tảng công nghệ bị thúc ép phải chịu trách nhiệm lớn hơn về an toàn trực tuyến.
Anthropic ra mắt Claude Tag, mở rộng AI cho môi trường làm việc

Anthropic ra mắt Claude Tag, mở rộng AI cho môi trường làm việc

Anthropic vừa giới thiệu Claude Tag, công cụ AI mới có khả năng tham gia các cuộc trao đổi trên nền tảng nhắn tin và cộng tác dành cho doanh nghiệp Slack, hỗ trợ theo dõi thông tin và cập nhật công việc trong tổ chức.
Google biến Gemini thành nền tảng AI "tất cả trong một" cho người dùng

Google biến Gemini thành nền tảng AI "tất cả trong một" cho người dùng

Google đang phát triển Gemini từ một chatbot thành trợ lý AI đa năng, hỗ trợ người dùng nghiên cứu, học tập, làm việc và sáng tạo nội dung trên cùng một nền tảng.
Qualcomm bắt tay Meta, đặt mục tiêu doanh thu trung tâm dữ liệu AI 15 tỷ USD

Qualcomm bắt tay Meta, đặt mục tiêu doanh thu trung tâm dữ liệu AI 15 tỷ USD

Qualcomm đang tăng tốc trong cuộc đua chip AI khi đạt thỏa thuận cung cấp bộ xử lý trung tâm dữ liệu cho Meta, đồng thời đặt mục tiêu thu về 15 tỷ USD từ mảng kinh doanh mới này vào năm tài chính 2029.
AI Smart Fire Detector: Khi AI bắt đầu làm việc của một lính cứu hỏa giỏi nhất thế giới

AI Smart Fire Detector: Khi AI bắt đầu làm việc của một lính cứu hỏa giỏi nhất thế giới

Có một sự thật đáng sợ mà hầu hết mọi người không nhận ra cho đến khi quá muộn, đó là phần lớn thiệt hại trong các vụ hỏa hoạn không xảy ra vào lúc đám cháy bùng phát dữ dội nhất, mà xảy ra vì con người phát hiện ra nguy hiểm quá chậm. Một tia lửa điện nhỏ trong phòng kỹ thuật, một thiết bị quá nhiệt trong trung tâm dữ liệu, một ổ cắm chập điện trong căn hộ lúc nửa đêm, một đám khói âm ỉ phía sau bức tường, tất cả những tín hiệu ấy đều có thể được ngăn chặn từ sớm, nhưng khi con người nhìn thấy ngọn lửa, mọi thứ thường đã qua thời điểm có thể kiểm soát được.
Giá chip AI Nvidia tăng vọt trên thị trường chợ đen Trung Quốc

Giá chip AI Nvidia tăng vọt trên thị trường chợ đen Trung Quốc

Các biện pháp kiểm soát xuất khẩu của Mỹ cùng động thái siết nhập khẩu từ Trung Quốc đang khiến nguồn cung chip AI Nvidia ngày càng khan hiếm, đẩy giá thiết bị trên thị trường chợ đen tăng mạnh và làm chi phí tính toán AI tại Trung Quốc leo thang.
Khi không có ai chăm sóc người già, người ốm, LG trình làng giải pháp CLOiD cho nỗi đau thế kỷ

Khi không có ai chăm sóc người già, người ốm, LG trình làng giải pháp CLOiD cho nỗi đau thế kỷ

Có một “nỗi đau” thế kỷ đang âm thầm diễn ra trên khắp thế giới mà không nhiều người nhận ra cho đến khi điều đó chạm đến chính gia đình mình. Con người đang sống lâu hơn, nhưng lại ngày càng thiếu người chăm sóc.
EU chuẩn bị siết điều tra Meta vì lo ngại mạng xã hội gây nghiện với trẻ em

EU chuẩn bị siết điều tra Meta vì lo ngại mạng xã hội gây nghiện với trẻ em

Ủy ban châu Âu được cho là đang chuẩn bị đưa ra kết luận sơ bộ trong cuộc điều tra đối với Meta, với cáo buộc Facebook và Instagram sử dụng các thiết kế có thể khiến người dùng trẻ tuổi bị cuốn vào nền tảng.
Luật sư AI đầu tiên thắng kiện tại tòa án Anh

Luật sư AI đầu tiên thắng kiện tại tòa án Anh

Một công ty luật dùng trí tuệ nhân tạo để chuẩn bị hồ sơ kiện tụng vừa giành chiến thắng đầu tiên tại tòa án Anh, đánh dấu bước tiến đáng chú ý của AI trong ngành pháp lý.
HostVN bắt tay Blackwall, đưa công nghệ bảo vệ lưu lượng web châu Âu vào Việt Nam

HostVN bắt tay Blackwall, đưa công nghệ bảo vệ lưu lượng web châu Âu vào Việt Nam

Việt Nam trở thành thị trường đầu tiên của Blackwall tại Đông Nam Á khi công ty an ninh mạng đến từ Estonia lựa chọn HostVN làm đối tác chiến lược, mở đường đưa công nghệ bảo vệ lưu lượng web cấp doanh nghiệp đến cộng đồng doanh nghiệp trong nước.
Thời của smartphone Android 8GB RAM đã hết và chiếc bẫy lỗi thời ngay khi bóc hộp!

Thời của smartphone Android 8GB RAM đã hết và chiếc bẫy lỗi thời ngay khi bóc hộp!

Kỷ nguyên trí tuệ nhân tạo (AI) trên di động đang châm ngòi cho một cuộc chạy đua vũ trang phần cứng khốc liệt, ép người dùng phải thay đổi tư duy mua sắm. Cây bút Robert Triggs từ chuyên trang công nghệ Android Authority khẳng định việc xuống tiền mua smartphone RAM 8GB vào năm 2026 là một sai lầm lớn. Sự xuất hiện của các mô hình AI vận hành trực tiếp trên máy như Gemini Nano hay Apple Intelligence với dung lượng phình to liên tục đang biến 12GB RAM từ mức "thừa thãi" trở thành tiêu chuẩn tối thiểu bắt buộc nếu người dùng không muốn bị gạt ra khỏi các trải nghiệm công nghệ mới.
Kính thông minh Ray-Ban Meta và tham vọng thay đổi thế giới sau iPhone

Kính thông minh Ray-Ban Meta và tham vọng thay đổi thế giới sau iPhone

Ray-Ban Meta không còn là một chiếc kính thông minh mới. Sản phẩm đã xuất hiện trên thị trường hơn một năm và được báo chí thế giới nhắc đến rất nhiều. Nhưng những diễn biến mới nhất trong năm 2026 đang khiến giới công nghệ nhìn sản phẩm này dưới một góc độ hoàn toàn khác.
Pháp ra mắt Robot Eno của Genesis AI: Trợ lý đắc lực mới của ngành công nghiệp toàn cầu

Pháp ra mắt Robot Eno của Genesis AI: Trợ lý đắc lực mới của ngành công nghiệp toàn cầu

Có một câu hỏi mà ngành robot toàn cầu hiếm khi đặt ra một cách thẳng thắn: nếu mục tiêu cuối cùng là giúp con người làm việc hiệu quả hơn, tại sao robot nhất thiết phải có hai chân, một gương mặt và một giọng nói để trông giống con người? Trong khi Tesla, Figure và nhiều tên tuổi lớn vẫn đang đầu tư hàng tỷ USD để dạy robot bước đi như con người, một startup non trẻ tại Paris lại chọn hướng tiếp cận hoàn toàn khác.
Tham vọng lập “bản đồ thanh toán khu vực”, NAPAS đẩy mạnh phủ sóng QR xuyên biên giới

Tham vọng lập “bản đồ thanh toán khu vực”, NAPAS đẩy mạnh phủ sóng QR xuyên biên giới

Tại hội thảo "Thanh toán thông minh trong kỷ nguyên số", Công ty cổ phần Thanh toán quốc gia (NAPAS) cho biết đang đẩy mạnh triển khai hai giải pháp chiến lược là VietQRPay (nội địa) và VietQRGlobal (xuyên biên giới). Đây là bước đi nhằm đón đầu làn sóng phục hồi của du lịch toàn cầu, khắc phục các hạn chế chi phí của phương thức thanh toán bằng thẻ hay tiền mặt truyền thống, đồng thời đưa Việt Nam hội nhập sâu hơn vào hệ sinh thái thanh toán số quốc tế.
AI của Anthropic châm ngòi cảnh báo ở Nhà Trắng

AI của Anthropic châm ngòi cảnh báo ở Nhà Trắng

Những cảnh báo an ninh quanh Anthropic cho thấy chính quyền Mỹ đang siết chặt hơn với các mô hình AI tiên tiến, trong khi vẫn phải cân nhắc mục tiêu duy trì lợi thế công nghệ trước Trung Quốc. Đây là trọng tâm trong cuộc phỏng vấn giữa Tổng thống Donald Trump với hãng tin Axios hôm 19/6 (giờ địa phương).