Thứ tư 01/07/2026 03:40
Hotline: 024.355.63.010
Kinh tế số

Apple, Nvidia và Anthropic bị chỉ trích vì sử dụng trái phép dữ liệu YouTube để đào tạo AI

18/07/2024 12:14
Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.
Ảnh minh họa
Ảnh minh họa.

Wall Street Journal dẫn kết quả mới đây của cuộc điều tra từ Proof News cho thấy, Apple, Nvidia và Anthropic đã sử dụng bộ dữ liệu tạo bởi công ty phi lợi nhuận có tên EleutherAI, chứa hơn 173.000 các bản ghi lại nội dung video YouTube của hơn 48.000 kênh mà không hề có sự xin phép chủ sở hữu hay nhà sáng tạo nội dung.

Mặc dù tập dữ liệu không chứa hình ảnh hay video, song các nội dung được lấy lại từ những nhà sáng tạo nội dung hàng đầu trên nền tảng như Marques Brownlee và MrBeast, cũng như các nhà xuất bản tin tức lớn như The New York Times, BBC và ABC News. Ngoài ra, còn có phụ đề từ các video thuộc về Engadget.

“Apple sử dụng dữ liệu từ một số công ty để huấn luyện cho AI của họ. Một trong số đó là các dữ liệu, bản ghi từ các video trên YouTube, bao gồm cả của tôi”, Brownlee, một người có sức ảnh hưởng trên YouTube đăng bài trên X.

Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.

Apple, NVIDIA, Anthropic và EleutherAI đã không trả lời yêu cầu bình luận từ Engadget.

Người đứng đầu bộ phận AI và học máy tại Apple, ông John Giannandrea, cũng từng phát biểu rằng, "lượng lớn dữ liệu đào tạo thực sự được tạo ra bởi chính Apple" nhưng không đi vào chi tiết.

Gã khổng lồ công nghệ Thung lũng Silicon cũng được cho là đã ký thỏa thuận với Shutterstock và Photobucket nhằm cấp phép cho hình ảnh đào tạo dữ liệu AI, nhưng chưa xác nhận công khai mối quan hệ hợp tác. Trong khi Apple Intelligence cố gắng luôn cố gắng nhấn mạnh cách tiếp cận tập trung nhiều hơn vào quyền riêng tư thông qua bộ xử lý trên thiết bị và điện toán đám mây tùy chỉnh, thì dường như nguyên tắc cơ bản khi thu thập dữ liệu nền tảng cho mô hình AI của công ty không khác gì so với đa số đối thủ cạnh tranh.

Đầu tháng này, các nghệ sĩ và nhiếp ảnh gia đã chỉ trích Apple vì đã không tiết lộ nguồn dữ liệu đào tạo cho Apple Intelligence, công ty sở hữu công nghệ AI sắp ra mắt trên hàng triệu thiết bị Apple trong năm nay.

YouTube, kho lưu trữ video lớn nhất thế giới, là một kho vàng không chỉ có bản ghi mà còn cả âm thanh, video và hình ảnh, khiến nó trở thành một bộ dữ liệu hấp dẫn để đào tạo các mô hình AI. Đầu năm nay, Giám đốc công nghệ của OpenAI, Mira Murati, đã né tránh các câu hỏi từ The Wall Street Journal về việc liệu công ty có sử dụng video YouTube để đào tạo Sora, công cụ tạo video AI sắp ra mắt của OpenAI hay không. Murati cho biết vào thời điểm đó: “Tôi sẽ không đi sâu vào chi tiết về dữ liệu đã được sử dụng, nhưng đó là dữ liệu được cấp phép hoặc có sẵn công khai.

Giám đốc điều hành Alphabet Sundar Pichai cũng cho biết, các công ty sử dụng dữ liệu từ YouTube để đào tạo các mô hình AI của họ sẽ vi phạm điều khoản dịch vụ của nền tảng này.

Mới đây, Apple đã phải nộp phạt 210 triệu won (hơn 4 tỷ đồng) sau khi bị Ủy ban Truyền thông Hàn Quốc KCC cáo buộc thu thập dữ liệu vị trí mà không có sự đồng ý của người dùng. Hành vi của Apple vi phạm điều khoản liên quan dữ liệu vị trí và các chính sách khác của Hàn Quốc. Ngoài Apple, KCC cũng phạt Google, nhưng ở mức 3 triệu won (60 triệu đồng).

Thu Trà (t/h)

TAGS:

Tin bài khác
Doanh nghiệp cơ khí Việt tìm sức bật toàn cầu từ công nghệ sản xuất tiên tiến

Doanh nghiệp cơ khí Việt tìm sức bật toàn cầu từ công nghệ sản xuất tiên tiến

Trong bối cảnh chỉ số sản xuất công nghiệp ngành cơ khí ghi nhận mức tăng trưởng ấn tượng 11,3%, Triển lãm Quốc tế MTA Vietnam 2026 trở thành cầu nối chiến lược giúp doanh nghiệp nội địa tiếp cận công nghệ tự động hóa và các tiêu chuẩn khắt khe từ châu Âu.
Ba giải pháp AI của Viettel Solutions được vinh danh quốc tế

Ba giải pháp AI của Viettel Solutions được vinh danh quốc tế

Tập đoàn Công nghiệp - Viễn thông Quân đội (Viettel) tiếp tục khẳng định năng lực làm chủ công nghệ trí tuệ nhân tạo (AI) của doanh nghiệp nội địa trên đấu trường quốc tế, thông qua các giải pháp thực tiễn phục vụ bán lẻ, khoa học dữ liệu và giao thông thông minh.
Techcombank nâng tiêu chuẩn hệ điều hành và bảo mật trên ứng dụng ngân hàng số

Techcombank nâng tiêu chuẩn hệ điều hành và bảo mật trên ứng dụng ngân hàng số

Nhằm tăng cường an toàn thông tin và tuân thủ các quy định mới của Ngân hàng Nhà nước, từ ngày 1/7/2026, Techcombank chính thức áp dụng yêu cầu tối thiểu về hệ điều hành đối với thiết bị Android, đồng thời triển khai nâng cấp phương thức xác thực giao dịch.
Softel Solutions nâng cao năng lực bảo mật đám mây cùng AWS và Noventiq

Softel Solutions nâng cao năng lực bảo mật đám mây cùng AWS và Noventiq

Trước áp lực tăng trưởng nhanh của nền kinh tế số, việc hợp tác với Noventiq và AWS giúp doanh nghiệp viễn thông Việt Nam khắc phục hoàn toàn các lỗ hổng hệ thống nghiêm trọng, thiết lập kiến trúc an ninh mạng đồng bộ đạt tiêu chuẩn quốc tế.
Farm-ng Amiga: Chiếc máy kéo điện thông minh giúp ngành nông nghiệp toàn cầu tìm ra lời giải trong suốt một thế kỷ

Farm-ng Amiga: Chiếc máy kéo điện thông minh giúp ngành nông nghiệp toàn cầu tìm ra lời giải trong suốt một thế kỷ

Có một cuộc khủng hoảng đang xảy ra âm thầm trên những cánh đồng khắp thế giới, và người tiêu dùng thường chỉ nhận ra khi giá thực phẩm trên kệ siêu thị bắt đầu tăng không rõ lý do. Nông nghiệp đang đối mặt với tình trạng thiếu lao động nghiêm trọng, khi số người sẵn sàng và có khả năng làm việc trong các trang trại đang giảm dần theo từng năm, trong khi nhu cầu thực phẩm toàn cầu tiếp tục tăng theo đà dân số.
Tây Ninh phát triển hệ sinh thái UAV, đón cơ hội tăng trưởng mới

Tây Ninh phát triển hệ sinh thái UAV, đón cơ hội tăng trưởng mới

Tây Ninh đang từng bước hiện thực hóa mục tiêu trở thành trung tâm phát triển hệ sinh thái thiết bị bay không người lái (UAV) khi thúc đẩy hợp tác với doanh nghiệp Hàn Quốc và đồng thời hoàn thiện cơ chế thử nghiệm có kiểm soát (sandbox). Đây được xem là bước đi quan trọng để địa phương mở ra không gian tăng trưởng mới dựa trên công nghệ chiến lược.
Google mở miễn phí tính năng tạo ảnh cá nhân hóa trên Gemini

Google mở miễn phí tính năng tạo ảnh cá nhân hóa trên Gemini

Google vừa mở miễn phí tính năng tạo ảnh cá nhân hóa trên Gemini cho người dùng đủ điều kiện tại Mỹ, cho phép AI khai thác dữ liệu từ Google Photos và các dịch vụ Google để tạo hình ảnh phù hợp với từng người dùng.
Mỹ siết quản lý mạng xã hội, bảo vệ trẻ em trên không gian mạng

Mỹ siết quản lý mạng xã hội, bảo vệ trẻ em trên không gian mạng

Hạ viện Mỹ thông qua dự luật tăng cường an toàn trực tuyến cho trẻ em, trong bối cảnh nhiều quốc gia đang đẩy mạnh các biện pháp hạn chế mạng xã hội đối với người dùng vị thành niên.
Mỹ cho phép hơn 100 tổ chức truy cập mô hình AI Mythos 5 của Anthropic

Mỹ cho phép hơn 100 tổ chức truy cập mô hình AI Mythos 5 của Anthropic

Chính phủ Mỹ đã cho phép Anthropic phát hành trở lại mô hình AI Mythos 5 tới một số doanh nghiệp và tổ chức trong nước sau thời gian tạm dừng vì các lo ngại liên quan đến an ninh quốc gia.
Tencent “gom” gần 3 tỷ USD chip nhớ: CXMT được tiếp sức trước IPO bom tấn

Tencent “gom” gần 3 tỷ USD chip nhớ: CXMT được tiếp sức trước IPO bom tấn

Tencent được cho là đã khóa nguồn cung DRAM dài hạn từ CXMT bằng một thỏa thuận trị giá gần 3 tỷ USD, trong lúc cơn sốt AI khiến chip nhớ trở thành “hàng nóng” trên toàn cầu.
Doanh nghiệp và người dân hưởng lợi gì khi vận hành sàn giao dịch carbon trong nước

Doanh nghiệp và người dân hưởng lợi gì khi vận hành sàn giao dịch carbon trong nước

Không chỉ dừng lại ở một công cụ quản lý môi trường, thị trường carbon đóng vai trò như một đòn bẩy kinh tế mang lại nguồn thu trực tiếp cho doanh nghiệp và nâng cao chất lượng sống cho người dân.
GLM-5.2 của Zhipu AI gây chú ý với hiệu năng tiệm cận OpenAI và Anthropic

GLM-5.2 của Zhipu AI gây chú ý với hiệu năng tiệm cận OpenAI và Anthropic

Mô hình AI GLM-5.2 do Zhipu AI phát triển đang thu hút sự quan tâm khi đạt hiệu năng lập trình tiệm cận các mô hình AI hàng đầu của Mỹ, trong khi chi phí sử dụng được đánh giá thấp hơn đáng kể.
Miko: Người bạn AI đầu tiên của trẻ em trong thế giới ngày càng cô đơn

Miko: Người bạn AI đầu tiên của trẻ em trong thế giới ngày càng cô đơn

Ít bậc phụ huynh nào dám thừa nhận thẳng thắn rằng con cái của họ đang lớn lên trong một thế giới kết nối hơn bao giờ hết nhưng cũng cô đơn hơn nhiều thế hệ trước. Cha mẹ đi làm từ sáng đến tối, ông bà sống xa, anh chị em mỗi người một màn hình điện thoại. Không có sự kết nối nào trong gia đình, thậm chí những giờ học trực tuyến khó có thể thay thế sự hiện diện của một người thực sự lắng nghe.
Google “không đủ bán” Gemini cho Meta

Google “không đủ bán” Gemini cho Meta

Cơn sốt AI đang nóng đến mức ngay cả các “ông lớn” công nghệ cũng không còn dư dả năng lực tính toán để phục vụ mọi nhu cầu.
Apple lao vào "canh bạc" chip Trung Quốc

Apple lao vào "canh bạc" chip Trung Quốc

Financial Times dẫn các nguồn tin thân cận cho biết Apple đang tìm kiếm sự chấp thuận từ Washington để mua chip nhớ từ CXMT, trong bối cảnh giá bộ nhớ leo thang mạnh vì làn sóng đầu tư vào trí tuệ nhân tạo.