Thứ sáu 19/09/2025 15:50
Hotline: 024.355.63.010
Kinh tế số

Apple, Nvidia và Anthropic bị chỉ trích vì sử dụng trái phép dữ liệu YouTube để đào tạo AI

18/07/2024 12:14
Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.
Ảnh minh họa
Ảnh minh họa.

Wall Street Journal dẫn kết quả mới đây của cuộc điều tra từ Proof News cho thấy, Apple, Nvidia và Anthropic đã sử dụng bộ dữ liệu tạo bởi công ty phi lợi nhuận có tên EleutherAI, chứa hơn 173.000 các bản ghi lại nội dung video YouTube của hơn 48.000 kênh mà không hề có sự xin phép chủ sở hữu hay nhà sáng tạo nội dung.

Mặc dù tập dữ liệu không chứa hình ảnh hay video, song các nội dung được lấy lại từ những nhà sáng tạo nội dung hàng đầu trên nền tảng như Marques Brownlee và MrBeast, cũng như các nhà xuất bản tin tức lớn như The New York Times, BBC và ABC News. Ngoài ra, còn có phụ đề từ các video thuộc về Engadget.

“Apple sử dụng dữ liệu từ một số công ty để huấn luyện cho AI của họ. Một trong số đó là các dữ liệu, bản ghi từ các video trên YouTube, bao gồm cả của tôi”, Brownlee, một người có sức ảnh hưởng trên YouTube đăng bài trên X.

Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.

Apple, NVIDIA, Anthropic và EleutherAI đã không trả lời yêu cầu bình luận từ Engadget.

Người đứng đầu bộ phận AI và học máy tại Apple, ông John Giannandrea, cũng từng phát biểu rằng, "lượng lớn dữ liệu đào tạo thực sự được tạo ra bởi chính Apple" nhưng không đi vào chi tiết.

Gã khổng lồ công nghệ Thung lũng Silicon cũng được cho là đã ký thỏa thuận với Shutterstock và Photobucket nhằm cấp phép cho hình ảnh đào tạo dữ liệu AI, nhưng chưa xác nhận công khai mối quan hệ hợp tác. Trong khi Apple Intelligence cố gắng luôn cố gắng nhấn mạnh cách tiếp cận tập trung nhiều hơn vào quyền riêng tư thông qua bộ xử lý trên thiết bị và điện toán đám mây tùy chỉnh, thì dường như nguyên tắc cơ bản khi thu thập dữ liệu nền tảng cho mô hình AI của công ty không khác gì so với đa số đối thủ cạnh tranh.

Đầu tháng này, các nghệ sĩ và nhiếp ảnh gia đã chỉ trích Apple vì đã không tiết lộ nguồn dữ liệu đào tạo cho Apple Intelligence, công ty sở hữu công nghệ AI sắp ra mắt trên hàng triệu thiết bị Apple trong năm nay.

YouTube, kho lưu trữ video lớn nhất thế giới, là một kho vàng không chỉ có bản ghi mà còn cả âm thanh, video và hình ảnh, khiến nó trở thành một bộ dữ liệu hấp dẫn để đào tạo các mô hình AI. Đầu năm nay, Giám đốc công nghệ của OpenAI, Mira Murati, đã né tránh các câu hỏi từ The Wall Street Journal về việc liệu công ty có sử dụng video YouTube để đào tạo Sora, công cụ tạo video AI sắp ra mắt của OpenAI hay không. Murati cho biết vào thời điểm đó: “Tôi sẽ không đi sâu vào chi tiết về dữ liệu đã được sử dụng, nhưng đó là dữ liệu được cấp phép hoặc có sẵn công khai.

Giám đốc điều hành Alphabet Sundar Pichai cũng cho biết, các công ty sử dụng dữ liệu từ YouTube để đào tạo các mô hình AI của họ sẽ vi phạm điều khoản dịch vụ của nền tảng này.

Mới đây, Apple đã phải nộp phạt 210 triệu won (hơn 4 tỷ đồng) sau khi bị Ủy ban Truyền thông Hàn Quốc KCC cáo buộc thu thập dữ liệu vị trí mà không có sự đồng ý của người dùng. Hành vi của Apple vi phạm điều khoản liên quan dữ liệu vị trí và các chính sách khác của Hàn Quốc. Ngoài Apple, KCC cũng phạt Google, nhưng ở mức 3 triệu won (60 triệu đồng).

Thu Trà (t/h)

TAGS:

Tin bài khác
Tốc độ Internet Việt Nam bứt phá, lọt Top 10 toàn cầu

Tốc độ Internet Việt Nam bứt phá, lọt Top 10 toàn cầu

Tốc độ Internet cố định của Việt Nam đạt 261,8 Mbps trong tháng 8/2025, vươn lên hạng 10 thế giới, đánh dấu cột mốc lịch sử sau gần 30 năm hiện diện và giúp quốc gia vượt nhiều nước phát triển về kết nối.
Việt Nam dẫn đầu xuất khẩu hàng hóa sáng tạo

Việt Nam dẫn đầu xuất khẩu hàng hóa sáng tạo

Theo Báo cáo Chỉ số Đổi mới sáng tạo toàn cầu (Global Innovation Index – GII) 2025 của Tổ chức Sở hữu trí tuệ thế giới (WIPO), Việt Nam giữ hạng 44 nhưng nổi bật với ba chỉ số đứng đầu toàn cầu: nhập khẩu công nghệ cao, xuất khẩu công nghệ cao và xuất khẩu hàng hóa sáng tạo.
Du lịch Đà Nẵng: Tăng tương tác với dịch vụ truyền hình đột phá

Du lịch Đà Nẵng: Tăng tương tác với dịch vụ truyền hình đột phá

VNPT Đà Nẵng thông tin vừa tổ chức hội thảo “Truyền hình đột phá” nhằm giới thiệu dịch vụ truyền hình tương tác đa dạng hóa với các cơ sở lưu trú du lịch, khách sạn nghỉ dưỡng tại địa bàn.
Vị Phó Giáo sư bỏ “xứ sở giàu nhất thế giới” sang Việt Nam bồi dưỡng tài năng công nghệ

Vị Phó Giáo sư bỏ “xứ sở giàu nhất thế giới” sang Việt Nam bồi dưỡng tài năng công nghệ

“Chúng tôi không chỉ đào tạo kỹ sư mà còn đào tạo người dẫn dắt”, là tôn chỉ mà Phó Giáo sư Ali Al-Dulaimi mang theo trong hành trình giáo dục tại Việt Nam. Với vai trò Trưởng khoa Khoa học Máy tính & Công nghệ tại Trường Đại học Anh Quốc Việt Nam (BUV), ông đang từng bước hiện thực hóa triết lý giáo dục gắn với thực tiễn, đổi mới sáng tạo và phát triển bền vững cho thế hệ công nghệ trẻ.
PCI 2.0: Công cụ mới thúc đẩy năng lực cạnh tranh và phát triển kinh tế tư nhân

PCI 2.0: Công cụ mới thúc đẩy năng lực cạnh tranh và phát triển kinh tế tư nhân

PCI 2.0 được coi là bước tiến quan trọng trong nghiên cứu, phản ánh thực trạng kinh tế tư nhân và góp phần cải thiện năng lực điều hành kinh tế địa phương.
Phát triển hệ sinh thái AI tại Việt Nam: Cần hợp tác công – tư

Phát triển hệ sinh thái AI tại Việt Nam: Cần hợp tác công – tư

Chia sẻ với Tạp chí Doanh nghiệp và Hội nhập, ông Nguyễn Tử Quảng - Chủ tịch Tập đoàn công nghệ Bkav cho rằng, để khai thác dữ liệu và phát triển hệ sinh thái trí tuệ nhân tạo (AI) tại Việt Nam, chỉ có hợp tác công - tư mới mang lại hiệu quả.
Cảnh báo rò rỉ dữ liệu khách hàng bị rao bán bởi tin tặc quốc tế - Người dân và Doanh nghiệp cần hành động ngay

Cảnh báo rò rỉ dữ liệu khách hàng bị rao bán bởi tin tặc quốc tế - Người dân và Doanh nghiệp cần hành động ngay

Ngày 11/9/2025, Trung tâm Thông tin Tín dụng Quốc gia Việt Nam (CIC) thuộc Ngân hàng Nhà nước đã phát đi công văn khẩn gửi tới toàn bộ hệ thống tổ chức tín dụng, cảnh báo nguy cơ dữ liệu khách hàng bị rao bán trên các diễn đàn tin tặc quốc tế. Dù hệ thống vận hành hiện tại vẫn bình thường và chưa ghi nhận thiệt hại cụ thể, sự kiện này lập tức trở thành tâm điểm quan ngại khi xuất hiện thông tin nhóm hacker khét tiếng ShinyHunters có thể đứng sau.
Trí tuệ nhân tạo và dữ liệu: Nhân tố cốt lõi quyết định sức cạnh tranh

Trí tuệ nhân tạo và dữ liệu: Nhân tố cốt lõi quyết định sức cạnh tranh

Chia sẻ tại Hội thảo “Chiến lược AI và Kiến trúc dữ liệu quốc gia, tổ chức và doanh nghiệp” (ASDA 1), các diễn giả đều có chung quan điểm: Trí tuệ nhân tạo (AI) và dữ liệu không còn là lĩnh vực công nghệ thuần túy, mà là nhân tố cốt lõi quyết định chủ quyền, sức cạnh tranh và vị thế quốc gia trong kỷ nguyên mới.
Nvidia củng cố ngôi đầu GPU, chiếm 94% thị phần toàn cầu quý II/2025

Nvidia củng cố ngôi đầu GPU, chiếm 94% thị phần toàn cầu quý II/2025

Theo Jon Peddie Research (JPR), Nvidia chiếm 94% thị phần GPU toàn cầu trong quý II/2025, nhờ làn sóng mua sắm sớm của người dùng nhằm tránh thuế nhập khẩu.
Lần đầu tiên khí tài công nghệ cao của Viettel xuất hiện tại lễ diễu binh kỷ niệm Quốc khánh 2/9

Lần đầu tiên khí tài công nghệ cao của Viettel xuất hiện tại lễ diễu binh kỷ niệm Quốc khánh 2/9

Các khí tài công nghệ cao do Tập đoàn Công nghiệp - Viễn thông Quân đội (Viettel) nghiên cứu, thiết kế và sản xuất đã lần đầu tiên xuất hiện đầy ấn tượng tại Quảng trường Ba Đình lịch sử trong khuôn khổ Lễ diễu binh, diễu hành kỷ niệm 80 năm Cách mạng Tháng Tám và Quốc khánh 2/9.
Bộ đôi thiết giáp hiện đại XTC-02 và XCB-01 do Việt Nam chế tạo, gây ấn tượng mạnh tại A80

Bộ đôi thiết giáp hiện đại XTC-02 và XCB-01 do Việt Nam chế tạo, gây ấn tượng mạnh tại A80

Liên tục xuất hiện trong các buổi hợp luyện, sơ duyệt và tổng duyệt lễ diễu binh, diễu hành kỷ niệm 80 năm Cách mạng Tháng Tám thành công và Quốc khánh 2.9 (A80), hai dòng xe thiết giáp hiện đại do Việt Nam tự nghiên cứu và chế tạo – XTC-02 và XCB-01 – đã trở thành tâm điểm chú ý, đặc biệt đối với giới trẻ yêu công nghệ và quốc phòng.
Google vừa ban hành chính sách bảo mật mới, "chặn đường" app crack và app giả mạo

Google vừa ban hành chính sách bảo mật mới, "chặn đường" app crack và app giả mạo

Từ tháng 9/2026, Google sẽ yêu cầu mọi ứng dụng phát hành ngoài Google Play phải gắn với tài khoản nhà phát triển đã được xác minh. Chính sách này không cấm cài đặt ứng dụng ngoài, nhưng sẽ khiến phần mềm bẻ khóa (crack), phiên bản ứng dụng đã chỉnh sửa (mod) và các ứng dụng “lậu” khó có thể tồn tại.
Đà Nẵng khởi động ký kết hợp tác công nghệ số và đồng tiền số

Đà Nẵng khởi động ký kết hợp tác công nghệ số và đồng tiền số

Sở Khoa học và Công nghệ Thành phố Đà Nẵng thông tin, hai hợp đồng phát triển, xây dựng tài chính công nghệ số, đồng tiền số đầu tiên trong sách lược đổi mới sáng tạo và tài chính khu vực của Đà Nẵng đã được ký kết trong ngày 27/8/2025.
Nvidia lập kỷ lục doanh thu nhờ chip AI Blackwell, Trung Quốc vẫn là thách thức lớn

Nvidia lập kỷ lục doanh thu nhờ chip AI Blackwell, Trung Quốc vẫn là thách thức lớn

Nvidia vừa công bố báo cáo tài chính quý II/2025 với doanh thu kỷ lục 46,7 tỷ USD, tăng 56% so với cùng kỳ năm trước. Dù chip Blackwell giúp công ty bùng nổ trên toàn cầu, thị trường Trung Quốc vẫn là nỗi lo lớn trong chiến lược dài hạn.
Việt Nam học được gì từ quốc gia dầu mỏ trở thành ‘thủ phủ AI’ dẫn đầu thế giới?

Việt Nam học được gì từ quốc gia dầu mỏ trở thành ‘thủ phủ AI’ dẫn đầu thế giới?

Từng nổi tiếng là "đầu não dầu mỏ" tại vùng Vịnh, Các Tiểu vương quốc Ả Rập Thống nhất (UAE) giờ đây đang tái định hình vị thế toàn cầu, trở thành một trong ba quốc gia dẫn đầu về trí tuệ nhân tạo (AI), chỉ đứng sau Mỹ.