Thứ sáu 31/10/2025 22:55
Hotline: 024.355.63.010
Kinh tế số

Apple, Nvidia và Anthropic bị chỉ trích vì sử dụng trái phép dữ liệu YouTube để đào tạo AI

18/07/2024 12:14
Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.
Ảnh minh họa
Ảnh minh họa.

Wall Street Journal dẫn kết quả mới đây của cuộc điều tra từ Proof News cho thấy, Apple, Nvidia và Anthropic đã sử dụng bộ dữ liệu tạo bởi công ty phi lợi nhuận có tên EleutherAI, chứa hơn 173.000 các bản ghi lại nội dung video YouTube của hơn 48.000 kênh mà không hề có sự xin phép chủ sở hữu hay nhà sáng tạo nội dung.

Mặc dù tập dữ liệu không chứa hình ảnh hay video, song các nội dung được lấy lại từ những nhà sáng tạo nội dung hàng đầu trên nền tảng như Marques Brownlee và MrBeast, cũng như các nhà xuất bản tin tức lớn như The New York Times, BBC và ABC News. Ngoài ra, còn có phụ đề từ các video thuộc về Engadget.

“Apple sử dụng dữ liệu từ một số công ty để huấn luyện cho AI của họ. Một trong số đó là các dữ liệu, bản ghi từ các video trên YouTube, bao gồm cả của tôi”, Brownlee, một người có sức ảnh hưởng trên YouTube đăng bài trên X.

Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.

Apple, NVIDIA, Anthropic và EleutherAI đã không trả lời yêu cầu bình luận từ Engadget.

Người đứng đầu bộ phận AI và học máy tại Apple, ông John Giannandrea, cũng từng phát biểu rằng, "lượng lớn dữ liệu đào tạo thực sự được tạo ra bởi chính Apple" nhưng không đi vào chi tiết.

Gã khổng lồ công nghệ Thung lũng Silicon cũng được cho là đã ký thỏa thuận với Shutterstock và Photobucket nhằm cấp phép cho hình ảnh đào tạo dữ liệu AI, nhưng chưa xác nhận công khai mối quan hệ hợp tác. Trong khi Apple Intelligence cố gắng luôn cố gắng nhấn mạnh cách tiếp cận tập trung nhiều hơn vào quyền riêng tư thông qua bộ xử lý trên thiết bị và điện toán đám mây tùy chỉnh, thì dường như nguyên tắc cơ bản khi thu thập dữ liệu nền tảng cho mô hình AI của công ty không khác gì so với đa số đối thủ cạnh tranh.

Đầu tháng này, các nghệ sĩ và nhiếp ảnh gia đã chỉ trích Apple vì đã không tiết lộ nguồn dữ liệu đào tạo cho Apple Intelligence, công ty sở hữu công nghệ AI sắp ra mắt trên hàng triệu thiết bị Apple trong năm nay.

YouTube, kho lưu trữ video lớn nhất thế giới, là một kho vàng không chỉ có bản ghi mà còn cả âm thanh, video và hình ảnh, khiến nó trở thành một bộ dữ liệu hấp dẫn để đào tạo các mô hình AI. Đầu năm nay, Giám đốc công nghệ của OpenAI, Mira Murati, đã né tránh các câu hỏi từ The Wall Street Journal về việc liệu công ty có sử dụng video YouTube để đào tạo Sora, công cụ tạo video AI sắp ra mắt của OpenAI hay không. Murati cho biết vào thời điểm đó: “Tôi sẽ không đi sâu vào chi tiết về dữ liệu đã được sử dụng, nhưng đó là dữ liệu được cấp phép hoặc có sẵn công khai.

Giám đốc điều hành Alphabet Sundar Pichai cũng cho biết, các công ty sử dụng dữ liệu từ YouTube để đào tạo các mô hình AI của họ sẽ vi phạm điều khoản dịch vụ của nền tảng này.

Mới đây, Apple đã phải nộp phạt 210 triệu won (hơn 4 tỷ đồng) sau khi bị Ủy ban Truyền thông Hàn Quốc KCC cáo buộc thu thập dữ liệu vị trí mà không có sự đồng ý của người dùng. Hành vi của Apple vi phạm điều khoản liên quan dữ liệu vị trí và các chính sách khác của Hàn Quốc. Ngoài Apple, KCC cũng phạt Google, nhưng ở mức 3 triệu won (60 triệu đồng).

Thu Trà (t/h)

TAGS:

Tin bài khác
Samsung xây dựng cơ sở sản xuất với 50.000 GPU Nvidia để tự động hóa quy trình làm chip

Samsung xây dựng cơ sở sản xuất với 50.000 GPU Nvidia để tự động hóa quy trình làm chip

Samsung, tập đoàn công nghệ hàng đầu Hàn Quốc, cho biết họ sẽ mua và triển khai 50.000 bộ xử lý đồ họa Nvidia. Số GPU này sẽ phục vụ việc tự động hóa sản xuất chip dành cho thiết bị di động và robot.
Tỉnh Hưng Yên tổ chức Diễn đàn về kinh tế dữ liệu, tạo sân chơi công nghệ

Tỉnh Hưng Yên tổ chức Diễn đàn về kinh tế dữ liệu, tạo sân chơi công nghệ

Ngày 29/10, UBND tỉnh Hưng Yên phối hợp với Hiệp hội Dữ liệu Quốc gia tổ chức Diễn đàn Khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số tỉnh Hưng Yên với chủ đề “Kinh tế dữ liệu, thúc đẩy đổi mới sáng tạo và phát triển bền vững”.
Tuần lễ Số quốc tế Việt Nam 2025: Quản trị trí tuệ nhân tạo, thúc đẩy hợp tác toàn cầu

Tuần lễ Số quốc tế Việt Nam 2025: Quản trị trí tuệ nhân tạo, thúc đẩy hợp tác toàn cầu

Tuần lễ Số quốc tế Việt Nam 2025 có chủ đề "Quản trị trí tuệ nhân tạo - AI Governance" nhằm thúc đẩy hợp tác, kết nối toàn cầu về công nghệ số và trí tuệ nhân tạo.
Camera AI – Bước tiến hiện đại trong quản lý giao thông đô thị TP. Hồ Chí Minh

Camera AI – Bước tiến hiện đại trong quản lý giao thông đô thị TP. Hồ Chí Minh

Tính từ ngày 01/09/2025 – 06/10/2025, sau gần một tháng triển khai hệ thống camera trí tuệ nhân tạo (AI) trong giám sát và xử lý vi phạm giao thông, Phòng CSGT TP. Hồ Chí Minh đã phát hiện, lập biên bản vi phạm hành chính, hoàn thiện hồ sơ 3.476 trường hợp.
Một nền tảng blockchain Việt sẽ giao dịch trên Kraken, mở đường cho công nghệ Việt Nam vào Mỹ

Một nền tảng blockchain Việt sẽ giao dịch trên Kraken, mở đường cho công nghệ Việt Nam vào Mỹ

U2U Network, nền tảng blockchain Layer-1 do đội ngũ kỹ sư Việt Nam phát triển, chính thức được Kraken – sàn giao dịch tài sản số Tier-1 có trụ sở tại Hoa Kỳ – thông báo niêm yết token U2U. Theo kế hoạch, U2U sẽ bắt đầu giao dịch trên Kraken vào ngày 17/10/2025.
Cảnh báo: 40% trung tâm dữ liệu AI có nguy cơ thiếu điện vào năm 2027

Cảnh báo: 40% trung tâm dữ liệu AI có nguy cơ thiếu điện vào năm 2027

Theo cảnh báo từ Gartner, đến năm 2027, khoảng 40% trung tâm dữ liệu AI trên toàn cầu có thể phải đối mặt với tình trạng thiếu điện – một thách thức có thể làm chậm lại toàn bộ tiến trình chuyển đổi số và tăng trưởng của nền kinh tế số.
Đà Nẵng đăng cai khởi động khoa học công nghệ hạt nhân

Đà Nẵng đăng cai khởi động khoa học công nghệ hạt nhân

Chính quyền thành phố Đà Nẵng thông tin đã phối hợp cùng Bộ Khoa học Công nghệ khai mạc Hội nghị Khoa học và Công nghệ hạt nhân Việt Nam lần thứ 16 (VINANST 16), bàn về năng lượng nguyên tử vào sáng nay 10/10/2025 tại cung hội nghị Furama.
Bí mật phía sau tờ tiền polymer: Hành trình làm chủ công nghệ của Việt Nam

Bí mật phía sau tờ tiền polymer: Hành trình làm chủ công nghệ của Việt Nam

Khi nói về tiền tệ, đa phần người dân chỉ quan tâm đến giá trị mệnh giá. Ít ai biết đằng sau tờ tiền còn là cả một hệ thống công nghệ bảo an khắt khe, gắn liền trực tiếp với an ninh quốc gia.
CC1 tiên phong nghiên cứu giải pháp công nghệ hiện đại, sẵn sàng đón đầu kỷ nguyên ngành đường sắt đô thị

CC1 tiên phong nghiên cứu giải pháp công nghệ hiện đại, sẵn sàng đón đầu kỷ nguyên ngành đường sắt đô thị

Ngày 27/9 vừa qua, Chủ tịch HĐQT CC1 – Ông Phan Hữu Duy Quốc cùng Chuyên gia cao cấp CC1 – Ông Lê Thanh Liêm đã tham dự Hội thảo khoa học trực tuyến với chủ đề “Giải pháp cầu cạn cho đường sắt đô thị, đường sắt tốc độ cao” do Tạp chí Xây dựng – Bộ Xây dựng phối hợp tổ chức.
GiHub đạt chứng chỉ SPIRE: Bước tiến mới cho tòa nhà thông minh Việt Nam

GiHub đạt chứng chỉ SPIRE: Bước tiến mới cho tòa nhà thông minh Việt Nam

Nằm trong chuỗi sự kiện công nghệ Galaxy of Innovation 2025 diễn ra từ ngày 25 - 26/9/2025, tại TP. Hồ Chí Minh, Trung tâm Đổi mới sáng tạo Galaxy Innovation Hub (GiHub) chính thức được công bố là Tòa nhà thông minh đầu tiên tại Việt Nam đạt chứng chỉ SPIRE.
Tốc độ Internet Việt Nam bứt phá, lọt Top 10 toàn cầu

Tốc độ Internet Việt Nam bứt phá, lọt Top 10 toàn cầu

Tốc độ Internet cố định của Việt Nam đạt 261,8 Mbps trong tháng 8/2025, vươn lên hạng 10 thế giới, đánh dấu cột mốc lịch sử sau gần 30 năm hiện diện và giúp quốc gia vượt nhiều nước phát triển về kết nối.
Việt Nam dẫn đầu xuất khẩu hàng hóa sáng tạo

Việt Nam dẫn đầu xuất khẩu hàng hóa sáng tạo

Theo Báo cáo Chỉ số Đổi mới sáng tạo toàn cầu (Global Innovation Index – GII) 2025 của Tổ chức Sở hữu trí tuệ thế giới (WIPO), Việt Nam giữ hạng 44 nhưng nổi bật với ba chỉ số đứng đầu toàn cầu: nhập khẩu công nghệ cao, xuất khẩu công nghệ cao và xuất khẩu hàng hóa sáng tạo.
Du lịch Đà Nẵng: Tăng tương tác với dịch vụ truyền hình đột phá

Du lịch Đà Nẵng: Tăng tương tác với dịch vụ truyền hình đột phá

VNPT Đà Nẵng thông tin vừa tổ chức hội thảo “Truyền hình đột phá” nhằm giới thiệu dịch vụ truyền hình tương tác đa dạng hóa với các cơ sở lưu trú du lịch, khách sạn nghỉ dưỡng tại địa bàn.
Vị Phó Giáo sư bỏ “xứ sở giàu nhất thế giới” sang Việt Nam bồi dưỡng tài năng công nghệ

Vị Phó Giáo sư bỏ “xứ sở giàu nhất thế giới” sang Việt Nam bồi dưỡng tài năng công nghệ

“Chúng tôi không chỉ đào tạo kỹ sư mà còn đào tạo người dẫn dắt”, là tôn chỉ mà Phó Giáo sư Ali Al-Dulaimi mang theo trong hành trình giáo dục tại Việt Nam. Với vai trò Trưởng khoa Khoa học Máy tính & Công nghệ tại Trường Đại học Anh Quốc Việt Nam (BUV), ông đang từng bước hiện thực hóa triết lý giáo dục gắn với thực tiễn, đổi mới sáng tạo và phát triển bền vững cho thế hệ công nghệ trẻ.
PCI 2.0: Công cụ mới thúc đẩy năng lực cạnh tranh và phát triển kinh tế tư nhân

PCI 2.0: Công cụ mới thúc đẩy năng lực cạnh tranh và phát triển kinh tế tư nhân

PCI 2.0 được coi là bước tiến quan trọng trong nghiên cứu, phản ánh thực trạng kinh tế tư nhân và góp phần cải thiện năng lực điều hành kinh tế địa phương.