Thứ tư 24/06/2026 01:28
Hotline: 024.355.63.010
Kinh tế số

Apple, Nvidia và Anthropic bị chỉ trích vì sử dụng trái phép dữ liệu YouTube để đào tạo AI

18/07/2024 12:14
Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.
Ảnh minh họa
Ảnh minh họa.

Wall Street Journal dẫn kết quả mới đây của cuộc điều tra từ Proof News cho thấy, Apple, Nvidia và Anthropic đã sử dụng bộ dữ liệu tạo bởi công ty phi lợi nhuận có tên EleutherAI, chứa hơn 173.000 các bản ghi lại nội dung video YouTube của hơn 48.000 kênh mà không hề có sự xin phép chủ sở hữu hay nhà sáng tạo nội dung.

Mặc dù tập dữ liệu không chứa hình ảnh hay video, song các nội dung được lấy lại từ những nhà sáng tạo nội dung hàng đầu trên nền tảng như Marques Brownlee và MrBeast, cũng như các nhà xuất bản tin tức lớn như The New York Times, BBC và ABC News. Ngoài ra, còn có phụ đề từ các video thuộc về Engadget.

“Apple sử dụng dữ liệu từ một số công ty để huấn luyện cho AI của họ. Một trong số đó là các dữ liệu, bản ghi từ các video trên YouTube, bao gồm cả của tôi”, Brownlee, một người có sức ảnh hưởng trên YouTube đăng bài trên X.

Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.

Apple, NVIDIA, Anthropic và EleutherAI đã không trả lời yêu cầu bình luận từ Engadget.

Người đứng đầu bộ phận AI và học máy tại Apple, ông John Giannandrea, cũng từng phát biểu rằng, "lượng lớn dữ liệu đào tạo thực sự được tạo ra bởi chính Apple" nhưng không đi vào chi tiết.

Gã khổng lồ công nghệ Thung lũng Silicon cũng được cho là đã ký thỏa thuận với Shutterstock và Photobucket nhằm cấp phép cho hình ảnh đào tạo dữ liệu AI, nhưng chưa xác nhận công khai mối quan hệ hợp tác. Trong khi Apple Intelligence cố gắng luôn cố gắng nhấn mạnh cách tiếp cận tập trung nhiều hơn vào quyền riêng tư thông qua bộ xử lý trên thiết bị và điện toán đám mây tùy chỉnh, thì dường như nguyên tắc cơ bản khi thu thập dữ liệu nền tảng cho mô hình AI của công ty không khác gì so với đa số đối thủ cạnh tranh.

Đầu tháng này, các nghệ sĩ và nhiếp ảnh gia đã chỉ trích Apple vì đã không tiết lộ nguồn dữ liệu đào tạo cho Apple Intelligence, công ty sở hữu công nghệ AI sắp ra mắt trên hàng triệu thiết bị Apple trong năm nay.

YouTube, kho lưu trữ video lớn nhất thế giới, là một kho vàng không chỉ có bản ghi mà còn cả âm thanh, video và hình ảnh, khiến nó trở thành một bộ dữ liệu hấp dẫn để đào tạo các mô hình AI. Đầu năm nay, Giám đốc công nghệ của OpenAI, Mira Murati, đã né tránh các câu hỏi từ The Wall Street Journal về việc liệu công ty có sử dụng video YouTube để đào tạo Sora, công cụ tạo video AI sắp ra mắt của OpenAI hay không. Murati cho biết vào thời điểm đó: “Tôi sẽ không đi sâu vào chi tiết về dữ liệu đã được sử dụng, nhưng đó là dữ liệu được cấp phép hoặc có sẵn công khai.

Giám đốc điều hành Alphabet Sundar Pichai cũng cho biết, các công ty sử dụng dữ liệu từ YouTube để đào tạo các mô hình AI của họ sẽ vi phạm điều khoản dịch vụ của nền tảng này.

Mới đây, Apple đã phải nộp phạt 210 triệu won (hơn 4 tỷ đồng) sau khi bị Ủy ban Truyền thông Hàn Quốc KCC cáo buộc thu thập dữ liệu vị trí mà không có sự đồng ý của người dùng. Hành vi của Apple vi phạm điều khoản liên quan dữ liệu vị trí và các chính sách khác của Hàn Quốc. Ngoài Apple, KCC cũng phạt Google, nhưng ở mức 3 triệu won (60 triệu đồng).

Thu Trà (t/h)

TAGS:

Tin bài khác
EU chuẩn bị siết điều tra Meta vì lo ngại mạng xã hội gây nghiện với trẻ em

EU chuẩn bị siết điều tra Meta vì lo ngại mạng xã hội gây nghiện với trẻ em

Ủy ban châu Âu được cho là đang chuẩn bị đưa ra kết luận sơ bộ trong cuộc điều tra đối với Meta, với cáo buộc Facebook và Instagram sử dụng các thiết kế có thể khiến người dùng trẻ tuổi bị cuốn vào nền tảng.
Luật sư AI đầu tiên thắng kiện tại tòa án Anh

Luật sư AI đầu tiên thắng kiện tại tòa án Anh

Một công ty luật dùng trí tuệ nhân tạo để chuẩn bị hồ sơ kiện tụng vừa giành chiến thắng đầu tiên tại tòa án Anh, đánh dấu bước tiến đáng chú ý của AI trong ngành pháp lý.
HostVN bắt tay Blackwall, đưa công nghệ bảo vệ lưu lượng web châu Âu vào Việt Nam

HostVN bắt tay Blackwall, đưa công nghệ bảo vệ lưu lượng web châu Âu vào Việt Nam

Việt Nam trở thành thị trường đầu tiên của Blackwall tại Đông Nam Á khi công ty an ninh mạng đến từ Estonia lựa chọn HostVN làm đối tác chiến lược, mở đường đưa công nghệ bảo vệ lưu lượng web cấp doanh nghiệp đến cộng đồng doanh nghiệp trong nước.
Thời của smartphone Android 8GB RAM đã hết và chiếc bẫy lỗi thời ngay khi bóc hộp!

Thời của smartphone Android 8GB RAM đã hết và chiếc bẫy lỗi thời ngay khi bóc hộp!

Kỷ nguyên trí tuệ nhân tạo (AI) trên di động đang châm ngòi cho một cuộc chạy đua vũ trang phần cứng khốc liệt, ép người dùng phải thay đổi tư duy mua sắm. Cây bút Robert Triggs từ chuyên trang công nghệ Android Authority khẳng định việc xuống tiền mua smartphone RAM 8GB vào năm 2026 là một sai lầm lớn. Sự xuất hiện của các mô hình AI vận hành trực tiếp trên máy như Gemini Nano hay Apple Intelligence với dung lượng phình to liên tục đang biến 12GB RAM từ mức "thừa thãi" trở thành tiêu chuẩn tối thiểu bắt buộc nếu người dùng không muốn bị gạt ra khỏi các trải nghiệm công nghệ mới.
Kính thông minh Ray-Ban Meta và tham vọng thay đổi thế giới sau iPhone

Kính thông minh Ray-Ban Meta và tham vọng thay đổi thế giới sau iPhone

Ray-Ban Meta không còn là một chiếc kính thông minh mới. Sản phẩm đã xuất hiện trên thị trường hơn một năm và được báo chí thế giới nhắc đến rất nhiều. Nhưng những diễn biến mới nhất trong năm 2026 đang khiến giới công nghệ nhìn sản phẩm này dưới một góc độ hoàn toàn khác.
Pháp ra mắt Robot Eno của Genesis AI: Trợ lý đắc lực mới của ngành công nghiệp toàn cầu

Pháp ra mắt Robot Eno của Genesis AI: Trợ lý đắc lực mới của ngành công nghiệp toàn cầu

Có một câu hỏi mà ngành robot toàn cầu hiếm khi đặt ra một cách thẳng thắn: nếu mục tiêu cuối cùng là giúp con người làm việc hiệu quả hơn, tại sao robot nhất thiết phải có hai chân, một gương mặt và một giọng nói để trông giống con người? Trong khi Tesla, Figure và nhiều tên tuổi lớn vẫn đang đầu tư hàng tỷ USD để dạy robot bước đi như con người, một startup non trẻ tại Paris lại chọn hướng tiếp cận hoàn toàn khác.
Tham vọng lập “bản đồ thanh toán khu vực”, NAPAS đẩy mạnh phủ sóng QR xuyên biên giới

Tham vọng lập “bản đồ thanh toán khu vực”, NAPAS đẩy mạnh phủ sóng QR xuyên biên giới

Tại hội thảo "Thanh toán thông minh trong kỷ nguyên số", Công ty cổ phần Thanh toán quốc gia (NAPAS) cho biết đang đẩy mạnh triển khai hai giải pháp chiến lược là VietQRPay (nội địa) và VietQRGlobal (xuyên biên giới). Đây là bước đi nhằm đón đầu làn sóng phục hồi của du lịch toàn cầu, khắc phục các hạn chế chi phí của phương thức thanh toán bằng thẻ hay tiền mặt truyền thống, đồng thời đưa Việt Nam hội nhập sâu hơn vào hệ sinh thái thanh toán số quốc tế.
AI của Anthropic châm ngòi cảnh báo ở Nhà Trắng

AI của Anthropic châm ngòi cảnh báo ở Nhà Trắng

Những cảnh báo an ninh quanh Anthropic cho thấy chính quyền Mỹ đang siết chặt hơn với các mô hình AI tiên tiến, trong khi vẫn phải cân nhắc mục tiêu duy trì lợi thế công nghệ trước Trung Quốc. Đây là trọng tâm trong cuộc phỏng vấn giữa Tổng thống Donald Trump với hãng tin Axios hôm 19/6 (giờ địa phương).
Giải pháp tối ưu quản trị dòng tiền và nâng cao trải nghiệm khách hàng từ máy POS

Giải pháp tối ưu quản trị dòng tiền và nâng cao trải nghiệm khách hàng từ máy POS

Sự dịch chuyển trong thói quen tiêu dùng không tiền mặt thúc đẩy các cơ sở kinh doanh đưa máy POS vào vận hành chuyên nghiệp, giúp tự động hóa quy trình kế toán và giảm thiểu sai sót trong quản lý tài chính.
Việt Nam đề xuất mô hình "Hub-and-Nodes" để định hình chiến lược công nghệ lượng tử

Việt Nam đề xuất mô hình "Hub-and-Nodes" để định hình chiến lược công nghệ lượng tử

Tại hội thảo khoa học diễn ra ở Thành phố Hồ Chí Minh, các chuyên gia hàng đầu đã thảo luận về giải pháp giúp Việt Nam bứt phá trong kỷ nguyên công nghệ mới, trong đó nhấn mạnh ba định hướng trọng tâm và khung kiến trúc chiến lược mạng lưới lượng tử quốc gia.
Robot quản gia Ballie tận tụy của Samsung: Một thành viên gia đình của nhà thông minh

Robot quản gia Ballie tận tụy của Samsung: Một thành viên gia đình của nhà thông minh

Có một câu hỏi mà ngành công nghệ toàn cầu đã loay hoay đi tìm lời giải suốt hơn một thập kỷ qua: làm sao để một ngôi nhà thực sự trở nên thông minh, chứ không chỉ là một ngôi nhà chứa đầy thiết bị thông minh? Các tập đoàn công nghệ lớn từ Mỹ, Hàn Quốc đến Trung Quốc đã đổ hàng tỷ USD vào camera kết nối, loa thông minh, cảm biến, robot hút bụi, khóa cửa điện tử hay điều hòa, bình nước nóng, rèm cửa, thiết bị chiếu sáng… điều khiển từ xa. Thế nhưng nghịch lý là càng nhiều thiết bị xuất hiện trong nhà, cuộc sống của người dùng phổ thông lại càng trở nên phức tạp, khó dùng hơn thay vì đơn giản.
Google Gemini, NotebookLM - Công cụ AI hỗ trợ học tập, làm việc và sáng tạo hiệu quả

Google Gemini, NotebookLM - Công cụ AI hỗ trợ học tập, làm việc và sáng tạo hiệu quả

Ngày 18/6, Google tổ chức buổi chia sẻ về “AI for Learning” cập nhật công nghệ mới nhất, mang đến góc nhìn trực quan, hữu ích, góp phần hỗ trợ thiết thực cho công việc biên tập, sáng tạo nội dung cũng như tác nghiệp hằng ngày.
Khu công nghệ cao TP. Hồ Chí Minh: Ưu tiên các dự án công nghệ chiến lược

Khu công nghệ cao TP. Hồ Chí Minh: Ưu tiên các dự án công nghệ chiến lược

Dòng vốn FDI hơn 11 tỷ USD đang tạo động lực quan trọng cho Khu Công nghệ cao TP. H Chí Minh chuyển dịch từ gia công sang các lĩnh vực công nghệ chiến lược như AI, bán dẫn và trung tâm dữ liệu.
CEO Anthropic kêu gọi G7 không chia rẽ trong phát triển AI

CEO Anthropic kêu gọi G7 không chia rẽ trong phát triển AI

Ông Dario Amodei – CEO của Anthropic – kêu gọi các nước G7 tăng phối hợp trong phát triển AI tiên tiến, trong bối cảnh Mỹ chặn Anthropic xuất khẩu hai mô hình mới vì lo ngại an ninh quốc gia.
Chiến lược xây dựng 10 doanh nghiệp công nghệ tỷ USD của Việt Nam đến năm 2030

Chiến lược xây dựng 10 doanh nghiệp công nghệ tỷ USD của Việt Nam đến năm 2030

Làm thế nào để Việt Nam sở hữu 10 doanh nghiệp công nghệ có doanh thu tỷ USD, sở hữu bằng sáng chế quốc tế và đưa quốc gia lọt vào top 3 Đông Nam Á về trí tuệ nhân tạo (AI)? Câu trả lời nằm ở bộ khung tiêu chuẩn khắt khe cùng những cơ chế thử nghiệm đột phá vừa được ban hành, hứa hẹn thay đổi hoàn toàn diện mạo hạ tầng số nước nhà trước năm 2030.