Thứ hai 08/06/2026 23:49
Hotline: 024.355.63.010
Kinh tế số

Apple, Nvidia và Anthropic bị chỉ trích vì sử dụng trái phép dữ liệu YouTube để đào tạo AI

18/07/2024 12:14
Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.
Ảnh minh họa
Ảnh minh họa.

Wall Street Journal dẫn kết quả mới đây của cuộc điều tra từ Proof News cho thấy, Apple, Nvidia và Anthropic đã sử dụng bộ dữ liệu tạo bởi công ty phi lợi nhuận có tên EleutherAI, chứa hơn 173.000 các bản ghi lại nội dung video YouTube của hơn 48.000 kênh mà không hề có sự xin phép chủ sở hữu hay nhà sáng tạo nội dung.

Mặc dù tập dữ liệu không chứa hình ảnh hay video, song các nội dung được lấy lại từ những nhà sáng tạo nội dung hàng đầu trên nền tảng như Marques Brownlee và MrBeast, cũng như các nhà xuất bản tin tức lớn như The New York Times, BBC và ABC News. Ngoài ra, còn có phụ đề từ các video thuộc về Engadget.

“Apple sử dụng dữ liệu từ một số công ty để huấn luyện cho AI của họ. Một trong số đó là các dữ liệu, bản ghi từ các video trên YouTube, bao gồm cả của tôi”, Brownlee, một người có sức ảnh hưởng trên YouTube đăng bài trên X.

Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.

Apple, NVIDIA, Anthropic và EleutherAI đã không trả lời yêu cầu bình luận từ Engadget.

Người đứng đầu bộ phận AI và học máy tại Apple, ông John Giannandrea, cũng từng phát biểu rằng, "lượng lớn dữ liệu đào tạo thực sự được tạo ra bởi chính Apple" nhưng không đi vào chi tiết.

Gã khổng lồ công nghệ Thung lũng Silicon cũng được cho là đã ký thỏa thuận với Shutterstock và Photobucket nhằm cấp phép cho hình ảnh đào tạo dữ liệu AI, nhưng chưa xác nhận công khai mối quan hệ hợp tác. Trong khi Apple Intelligence cố gắng luôn cố gắng nhấn mạnh cách tiếp cận tập trung nhiều hơn vào quyền riêng tư thông qua bộ xử lý trên thiết bị và điện toán đám mây tùy chỉnh, thì dường như nguyên tắc cơ bản khi thu thập dữ liệu nền tảng cho mô hình AI của công ty không khác gì so với đa số đối thủ cạnh tranh.

Đầu tháng này, các nghệ sĩ và nhiếp ảnh gia đã chỉ trích Apple vì đã không tiết lộ nguồn dữ liệu đào tạo cho Apple Intelligence, công ty sở hữu công nghệ AI sắp ra mắt trên hàng triệu thiết bị Apple trong năm nay.

YouTube, kho lưu trữ video lớn nhất thế giới, là một kho vàng không chỉ có bản ghi mà còn cả âm thanh, video và hình ảnh, khiến nó trở thành một bộ dữ liệu hấp dẫn để đào tạo các mô hình AI. Đầu năm nay, Giám đốc công nghệ của OpenAI, Mira Murati, đã né tránh các câu hỏi từ The Wall Street Journal về việc liệu công ty có sử dụng video YouTube để đào tạo Sora, công cụ tạo video AI sắp ra mắt của OpenAI hay không. Murati cho biết vào thời điểm đó: “Tôi sẽ không đi sâu vào chi tiết về dữ liệu đã được sử dụng, nhưng đó là dữ liệu được cấp phép hoặc có sẵn công khai.

Giám đốc điều hành Alphabet Sundar Pichai cũng cho biết, các công ty sử dụng dữ liệu từ YouTube để đào tạo các mô hình AI của họ sẽ vi phạm điều khoản dịch vụ của nền tảng này.

Mới đây, Apple đã phải nộp phạt 210 triệu won (hơn 4 tỷ đồng) sau khi bị Ủy ban Truyền thông Hàn Quốc KCC cáo buộc thu thập dữ liệu vị trí mà không có sự đồng ý của người dùng. Hành vi của Apple vi phạm điều khoản liên quan dữ liệu vị trí và các chính sách khác của Hàn Quốc. Ngoài Apple, KCC cũng phạt Google, nhưng ở mức 3 triệu won (60 triệu đồng).

Thu Trà (t/h)

TAGS:

Tin bài khác
Thủ tướng Anh yêu cầu các hãng công nghệ tăng biện pháp bảo vệ trẻ em trên thiết bị số

Thủ tướng Anh yêu cầu các hãng công nghệ tăng biện pháp bảo vệ trẻ em trên thiết bị số

Chính phủ Anh đang gia tăng sức ép đối với các tập đoàn công nghệ lớn nhằm sớm triển khai công cụ bảo vệ trẻ em trên điện thoại và máy tính bảng, trong bối cảnh nhiều quốc gia châu Âu cũng đẩy mạnh kiểm soát việc trẻ vị thành niên tiếp cận nội dung độc hại trên không gian mạng.
Trung Quốc cảnh báo nguy cơ rò rỉ dữ liệu từ các nền tảng trung gian AI

Trung Quốc cảnh báo nguy cơ rò rỉ dữ liệu từ các nền tảng trung gian AI

Trung Quốc cảnh báo các nền tảng trung gian AI có thể trở thành mắt xích làm gia tăng nguy cơ rò rỉ dữ liệu, lộ thông tin cá nhân và phát sinh các rủi ro an ninh mạng nếu không được quản lý chặt chẽ.
Nvidia bắt tay SK Hynix, Naver và Doosan để mở rộng hạ tầng AI tại Hàn Quốc

Nvidia bắt tay SK Hynix, Naver và Doosan để mở rộng hạ tầng AI tại Hàn Quốc

Các thỏa thuận mới với SK Hynix, Naver và Doosan cho thấy Nvidia đang đẩy mạnh hiện diện tại Hàn Quốc - một mắt xích quan trọng trong chuỗi cung ứng bán dẫn toàn cầu - trong bối cảnh cuộc đua đầu tư trung tâm dữ liệu và hạ tầng AI tiếp tục tăng tốc.
Threads: Kênh đối thoại mới doanh nghiệp không nên bỏ lỡ

Threads: Kênh đối thoại mới doanh nghiệp không nên bỏ lỡ

Threads đang nổi lên như nền tảng đối thoại tiềm năng, giúp doanh nghiệp xây dựng thương hiệu, kết nối khách hàng và mở rộng hoạt động marketing số.
Thanh toán xuyên biên giới trên máy POS Payoo

Thanh toán xuyên biên giới trên máy POS Payoo

VietQRGlobal cho phép du khách quốc tế có thể thanh toán xuyên biên giới trên máy POS Payoo bằng chính ứng dụng ngân hàng, hoặc ví điện tử của quốc gia họ…
Thanh toán số tăng tốc, Việt Nam hướng tới giá trị giao dịch không tiền mặt gấp 30 lần GDP

Thanh toán số tăng tốc, Việt Nam hướng tới giá trị giao dịch không tiền mặt gấp 30 lần GDP

Thanh toán số đang trở thành hạ tầng thiết yếu của nền kinh tế số, khi giá trị giao dịch không dùng tiền mặt tại Việt Nam đã đạt mức gấp 28 lần GDP và tiếp tục tăng trưởng mạnh trong những tháng đầu năm 2026. Đây là một trong những thông tin đáng chú ý được đưa ra tại Hội thảo “Thanh toán thông minh trong kỷ nguyên số” diễn ra ngày 6/6 tại TP.HCM.
CEO Nvidia: Robot sẽ là động lực tăng trưởng mới của Hàn Quốc

CEO Nvidia: Robot sẽ là động lực tăng trưởng mới của Hàn Quốc

CEO Nvidia Jensen Huang cho rằng robot sẽ trở thành ngành công nghiệp tăng trưởng lớn tiếp theo của Hàn Quốc, đồng thời cho biết Nvidia sẽ mở rộng hợp tác về AI, robot và sản xuất tiên tiến với các doanh nghiệp nước này.
Amazon ra mắt robot AI thế hệ mới, tăng tốc tự động hóa kho hàng

Amazon ra mắt robot AI thế hệ mới, tăng tốc tự động hóa kho hàng

Theo Reuters, Amazon vừa giới thiệu thế hệ robot di động mới tích hợp trí tuệ nhân tạo (AI), có khả năng tiếp nhận và phản hồi các chỉ dẫn bằng ngôn ngữ tự nhiên của con người.
Ứng dụng công nghệ để nâng cao hiệu quả giám sát giao dịch thương mại điện tử

Ứng dụng công nghệ để nâng cao hiệu quả giám sát giao dịch thương mại điện tử

Thương mại điện tử phát triển nhanh chóng mang lại nhiều tiện ích nhưng cũng đặt ra không ít thách thức về kiểm soát chất lượng hàng hóa và xử lý tranh chấp. Việc tăng cường định danh người bán, chia sẻ dữ liệu liên thông giữa các cơ quan quản lý và áp dụng quy trình xử lý khiếu nại nghiêm ngặt được xem là những giải pháp then chốt nhằm thiết lập môi trường kinh doanh trực tuyến minh bạch.
Anh siết quản lý AI, yêu cầu Google tăng quyền kiểm soát nội dung cho website

Anh siết quản lý AI, yêu cầu Google tăng quyền kiểm soát nội dung cho website

Cơ quan quản lý cạnh tranh Anh đề xuất Google cho phép các website lựa chọn không đưa nội dung vào các tính năng tìm kiếm sử dụng AI nhằm bảo vệ quyền lợi của nhà xuất bản và đơn vị sáng tạo nội dung.
ROAD TO AI 2026 – Doanh nghiệp đặt hàng tìm thế hệ kỹ sư AI tương lai

ROAD TO AI 2026 – Doanh nghiệp đặt hàng tìm thế hệ kỹ sư AI tương lai

Trong bối cảnh Trí tuệ nhân tạo (AI) đang trở thành động lực quan trọng thúc đẩy tăng trưởng kinh tế và đổi mới sáng tạo trên toàn cầu, việc đào tạo nguồn nhân lực AI có khả năng giải quyết các bài toán thực tiễn đang trở thành yêu cầu cấp thiết đối với Việt Nam.
OpenAI mở rộng Codex với loạt công cụ mới cho môi trường doanh nghiệp

OpenAI mở rộng Codex với loạt công cụ mới cho môi trường doanh nghiệp

OpenAI vừa bổ sung nhiều tính năng mới cho Codex, hướng tới nhóm người dùng doanh nghiệp và lao động tri thức ngoài lĩnh vực lập trình.
Maldives đề xuất cấm trẻ dưới 16 tuổi truy cập một số nền tảng mạng xã hội

Maldives đề xuất cấm trẻ dưới 16 tuổi truy cập một số nền tảng mạng xã hội

Maldives đang lên kế hoạch cấm trẻ em dưới 16 tuổi truy cập một số nền tảng mạng xã hội nhằm tăng cường bảo vệ thanh thiếu niên trước các rủi ro trên môi trường số.
Sun Group triển khai Sun Express - trải nghiệm thủ tục an ninh và lên tàu bay không chạm tại Cảng HKQT Phú Quốc

Sun Group triển khai Sun Express - trải nghiệm thủ tục an ninh và lên tàu bay không chạm tại Cảng HKQT Phú Quốc

Từ ngày 1/6/2026, Cảng HKQT Phú Quốc chính thức triển khai toàn trình Sun Express, hệ thống sinh trắc học và cửa tự động sử dụng công nghệ nhận diện khuôn mặt, cho phép hành khách thực hiện thủ tục an ninh và lên tàu bay nhanh chóng, an toàn, không chạm.
Nvidia mở rộng mặt trận AI, tung chip mới cho laptop Windows

Nvidia mở rộng mặt trận AI, tung chip mới cho laptop Windows

Nvidia giới thiệu chip RTX Spark cho laptop và PC chạy Windows, hướng tới thế hệ máy tính AI có khả năng xử lý các tác vụ phức tạp như siêu máy tính.