Thứ bảy 23/05/2026 02:19
Hotline: 024.355.63.010
Kinh tế số

Apple, Nvidia và Anthropic bị chỉ trích vì sử dụng trái phép dữ liệu YouTube để đào tạo AI

18/07/2024 12:14
Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.
Ảnh minh họa
Ảnh minh họa.

Wall Street Journal dẫn kết quả mới đây của cuộc điều tra từ Proof News cho thấy, Apple, Nvidia và Anthropic đã sử dụng bộ dữ liệu tạo bởi công ty phi lợi nhuận có tên EleutherAI, chứa hơn 173.000 các bản ghi lại nội dung video YouTube của hơn 48.000 kênh mà không hề có sự xin phép chủ sở hữu hay nhà sáng tạo nội dung.

Mặc dù tập dữ liệu không chứa hình ảnh hay video, song các nội dung được lấy lại từ những nhà sáng tạo nội dung hàng đầu trên nền tảng như Marques Brownlee và MrBeast, cũng như các nhà xuất bản tin tức lớn như The New York Times, BBC và ABC News. Ngoài ra, còn có phụ đề từ các video thuộc về Engadget.

“Apple sử dụng dữ liệu từ một số công ty để huấn luyện cho AI của họ. Một trong số đó là các dữ liệu, bản ghi từ các video trên YouTube, bao gồm cả của tôi”, Brownlee, một người có sức ảnh hưởng trên YouTube đăng bài trên X.

Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.

Apple, NVIDIA, Anthropic và EleutherAI đã không trả lời yêu cầu bình luận từ Engadget.

Người đứng đầu bộ phận AI và học máy tại Apple, ông John Giannandrea, cũng từng phát biểu rằng, "lượng lớn dữ liệu đào tạo thực sự được tạo ra bởi chính Apple" nhưng không đi vào chi tiết.

Gã khổng lồ công nghệ Thung lũng Silicon cũng được cho là đã ký thỏa thuận với Shutterstock và Photobucket nhằm cấp phép cho hình ảnh đào tạo dữ liệu AI, nhưng chưa xác nhận công khai mối quan hệ hợp tác. Trong khi Apple Intelligence cố gắng luôn cố gắng nhấn mạnh cách tiếp cận tập trung nhiều hơn vào quyền riêng tư thông qua bộ xử lý trên thiết bị và điện toán đám mây tùy chỉnh, thì dường như nguyên tắc cơ bản khi thu thập dữ liệu nền tảng cho mô hình AI của công ty không khác gì so với đa số đối thủ cạnh tranh.

Đầu tháng này, các nghệ sĩ và nhiếp ảnh gia đã chỉ trích Apple vì đã không tiết lộ nguồn dữ liệu đào tạo cho Apple Intelligence, công ty sở hữu công nghệ AI sắp ra mắt trên hàng triệu thiết bị Apple trong năm nay.

YouTube, kho lưu trữ video lớn nhất thế giới, là một kho vàng không chỉ có bản ghi mà còn cả âm thanh, video và hình ảnh, khiến nó trở thành một bộ dữ liệu hấp dẫn để đào tạo các mô hình AI. Đầu năm nay, Giám đốc công nghệ của OpenAI, Mira Murati, đã né tránh các câu hỏi từ The Wall Street Journal về việc liệu công ty có sử dụng video YouTube để đào tạo Sora, công cụ tạo video AI sắp ra mắt của OpenAI hay không. Murati cho biết vào thời điểm đó: “Tôi sẽ không đi sâu vào chi tiết về dữ liệu đã được sử dụng, nhưng đó là dữ liệu được cấp phép hoặc có sẵn công khai.

Giám đốc điều hành Alphabet Sundar Pichai cũng cho biết, các công ty sử dụng dữ liệu từ YouTube để đào tạo các mô hình AI của họ sẽ vi phạm điều khoản dịch vụ của nền tảng này.

Mới đây, Apple đã phải nộp phạt 210 triệu won (hơn 4 tỷ đồng) sau khi bị Ủy ban Truyền thông Hàn Quốc KCC cáo buộc thu thập dữ liệu vị trí mà không có sự đồng ý của người dùng. Hành vi của Apple vi phạm điều khoản liên quan dữ liệu vị trí và các chính sách khác của Hàn Quốc. Ngoài Apple, KCC cũng phạt Google, nhưng ở mức 3 triệu won (60 triệu đồng).

Thu Trà (t/h)

TAGS:

Tin bài khác
Nhà mạng lớn nhất Đông Nam Á tăng mạnh đầu tư AI và trung tâm dữ liệu

Nhà mạng lớn nhất Đông Nam Á tăng mạnh đầu tư AI và trung tâm dữ liệu

Tập đoàn viễn thông Singtel dự kiến nâng chi vốn lên khoảng 3 tỷ SGD trong năm tài chính mới, trong đó 1,2 tỷ SGD sẽ được dành cho AI và hạ tầng trung tâm dữ liệu, cho thấy cuộc đua xây dựng hạ tầng trí tuệ nhân tạo tại châu Á đang ngày càng nóng lên.
VNPT bắt tay "gã khổng lồ" KDDI: Cuộc đổ bộ của mạng di động số Povo vào Việt Nam

VNPT bắt tay "gã khổng lồ" KDDI: Cuộc đổ bộ của mạng di động số Povo vào Việt Nam

Cái bắt tay chiến lược giữa VNPT và KDDI (Nhật Bản) ký ngày 20/5/2026 hứa hẹn làm bùng nổ thị trường viễn thông cuối năm nay bằng một thương hiệu di động số hoàn toàn mới. iệc nhập khẩu trực tiếp tư duy cá nhân hóa từ thương hiệu đình đám "povo", VNPT không chỉ nhắm vào nhóm khách hàng Gen Z mà còn muốn tái định nghĩa lại cách người Việt sử dụng dịch vụ di động thông qua ứng dụng số hóa 100%.
Google siết hạn mức Gemini, tác vụ AI nặng sẽ hao lượt nhanh hơn

Google siết hạn mức Gemini, tác vụ AI nặng sẽ hao lượt nhanh hơn

Google vừa áp dụng cơ chế giới hạn mới cho Gemini theo mức tiêu tốn tài nguyên xử lý, khiến nhiều người dùng phản ứng vì hạn mức bị giảm nhanh hơn trước.
Google ra mắt AI giúp chuyển ứng dụng từ iPhone sang Android nhanh hơn

Google ra mắt AI giúp chuyển ứng dụng từ iPhone sang Android nhanh hơn

Google vừa giới thiệu công cụ AI mới giúp lập trình viên chuyển ứng dụng từ iPhone sang Android nhanh hơn, qua đó rút ngắn khoảng cách ứng dụng giữa hai hệ điều hành di động lớn nhất thế giới.
Starbucks dừng chương trình AI kiểm kê hàng tồn kho sau 9 tháng triển khai

Starbucks dừng chương trình AI kiểm kê hàng tồn kho sau 9 tháng triển khai

Thương hiệu cà phê nổi tiếng Starbucks đã chấm dứt công cụ AI hỗ trợ kiểm kê tại các cửa hàng ở Bắc Mỹ sau khi hệ thống liên tục ghi nhận sai sót trong quá trình vận hành.
Hơn 100 công nghệ xanh quy tụ tại Techmart 2026 và cơ hội đổi mới cho doanh nghiệp

Hơn 100 công nghệ xanh quy tụ tại Techmart 2026 và cơ hội đổi mới cho doanh nghiệp

Trong bối cảnh các rào cản kỹ thuật về môi trường tại các thị trường quốc tế ngày càng siết chặt, chuyển đổi xanh đã trở thành tấm vé thông hành bắt buộc cho mọi doanh nghiệp tham gia chuỗi cung ứng toàn cầu. Để hỗ trợ bài toán sống còn này, ngày 21/5, dưới sự chỉ đạo của Sở Khoa học và Công nghệ Thành phố Hồ Chí Minh, Sàn Giao dịch Công nghệ Thành phố Hồ Chí Minh đã chính thức khai mạc Chợ công nghệ và thiết bị (Techmart) chuyên ngành công nghệ xanh và tuần hoàn năm 2026.
Nvidia lập đỉnh doanh thu nhờ làn sóng AI agent

Nvidia lập đỉnh doanh thu nhờ làn sóng AI agent

Sự bùng nổ của các tác nhân AI (AI agent) cùng nhu cầu điện toán trung tâm dữ liệu tăng mạnh đã giúp Nvidia ghi nhận quý kinh doanh cao nhất lịch sử, với doanh thu vượt 81 tỷ USD và lợi nhuận tăng vọt ngoài kỳ vọng của Phố Wall.
Gemini Omni và tham vọng tạo ra AI “hiểu thế giới” của Google

Gemini Omni và tham vọng tạo ra AI “hiểu thế giới” của Google

Không chỉ dừng ở việc tạo video bằng AI, Gemini Omni cho thấy Google đang theo đuổi mục tiêu xây dựng một hệ thống có khả năng hiểu và mô phỏng thế giới thực theo cách gần giống con người hơn.
TP. Hồ Chí Minh lần đầu lọt Top 100 hệ sinh thái khởi nghiệp toàn cầu, vượt mục tiêu trước 4 năm

TP. Hồ Chí Minh lần đầu lọt Top 100 hệ sinh thái khởi nghiệp toàn cầu, vượt mục tiêu trước 4 năm

TP. Hồ Chí Minh lần đầu tiên góp mặt trong Top 100 hệ sinh thái khởi nghiệp sáng tạo năng động nhất thế giới, đánh dấu cột mốc quan trọng trong hành trình xây dựng đô thị đổi mới sáng tạo và khẳng định vị thế đầu tàu công nghệ, khởi nghiệp của Việt Nam trên bản đồ toàn cầu.
Google và Blackstone hợp tác: Doanh nghiệp toàn cầu sẽ vận hành ra sao?

Google và Blackstone hợp tác: Doanh nghiệp toàn cầu sẽ vận hành ra sao?

Có một câu hỏi rất đáng suy nghĩ đang xuất hiện trong giới công nghệ và quản trị toàn cầu, nếu một ngày nào đó doanh nghiệp không còn phải mua phần mềm, không cần xây trung tâm dữ liệu, không cần đầu tư đội ngũ kỹ thuật khổng lồ mà chỉ cần bật một “công tắc” để sử dụng trí tuệ nhân tạo như sử dụng điện, điều gì sẽ xảy ra?
Apple tăng tốc AI trên iOS 27, bổ sung loạt công cụ viết thông minh cho Siri

Apple tăng tốc AI trên iOS 27, bổ sung loạt công cụ viết thông minh cho Siri

Theo Bloomberg, Apple đang chuẩn bị nâng cấp mạnh mẽ Siri và bộ Writing Tools trên iOS 27, với nhiều tính năng AI hỗ trợ viết, chỉnh sửa và kiểm tra ngữ pháp ngay trên thiết bị.
Meta lên kế hoạch tái cấu trúc quy mô lớn, cắt giảm 10% nhân sự toàn cầu

Meta lên kế hoạch tái cấu trúc quy mô lớn, cắt giảm 10% nhân sự toàn cầu

Meta dự kiến sa thải khoảng 10% nhân sự toàn cầu, đồng thời điều chuyển 7.000 nhân viên sang các dự án AI trong kế hoạch tái cấu trúc quy mô lớn đang gây nhiều tranh cãi nội bộ.
Cuộc đua toàn cầu mới bắt đầu khi quyền lực thế kỷ 21 không còn nằm ở dầu mỏ

Cuộc đua toàn cầu mới bắt đầu khi quyền lực thế kỷ 21 không còn nằm ở dầu mỏ

Trong nhiều năm, khi nhắc tới cạnh tranh Mỹ – Trung, thế giới thường nghĩ tới chiến tranh thương mại, thuế quan hay căng thẳng địa chính trị. Nhưng hiện nay, một nỗi lo lớn hơn nhiều đang âm thầm xuất hiện trong giới công nghệ, tài chính và hoạch định chiến lược toàn cầu. Quyền lực thế kỷ 21 không còn nằm ở dầu mỏ mà nằm ở đâu?
Google và Blackstone thành lập liên doanh điện toán đám mây AI

Google và Blackstone thành lập liên doanh điện toán đám mây AI

Google và Blackstone đã thành lập liên doanh điện toán đám mây AI tại Mỹ, với vốn chủ sở hữu ban đầu 5 tỷ USD từ Blackstone và mục tiêu đưa 500 MW công suất trung tâm dữ liệu vào hoạt động từ năm 2027.
Bảo vệ dữ liệu cá nhân trước làn sóng lừa đảo công nghệ AI

Bảo vệ dữ liệu cá nhân trước làn sóng lừa đảo công nghệ AI

Trong kỷ nguyên số, dữ liệu đang trở thành loại “tài sản mới” có giá trị không thua kém vốn, tài nguyên hay nhân lực. Với lĩnh vực ngân hàng – tài chính.