Thứ sáu 15/05/2026 22:43
Hotline: 024.355.63.010
Kinh tế số

Apple, Nvidia và Anthropic bị chỉ trích vì sử dụng trái phép dữ liệu YouTube để đào tạo AI

18/07/2024 12:14
Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.
Ảnh minh họa
Ảnh minh họa.

Wall Street Journal dẫn kết quả mới đây của cuộc điều tra từ Proof News cho thấy, Apple, Nvidia và Anthropic đã sử dụng bộ dữ liệu tạo bởi công ty phi lợi nhuận có tên EleutherAI, chứa hơn 173.000 các bản ghi lại nội dung video YouTube của hơn 48.000 kênh mà không hề có sự xin phép chủ sở hữu hay nhà sáng tạo nội dung.

Mặc dù tập dữ liệu không chứa hình ảnh hay video, song các nội dung được lấy lại từ những nhà sáng tạo nội dung hàng đầu trên nền tảng như Marques Brownlee và MrBeast, cũng như các nhà xuất bản tin tức lớn như The New York Times, BBC và ABC News. Ngoài ra, còn có phụ đề từ các video thuộc về Engadget.

“Apple sử dụng dữ liệu từ một số công ty để huấn luyện cho AI của họ. Một trong số đó là các dữ liệu, bản ghi từ các video trên YouTube, bao gồm cả của tôi”, Brownlee, một người có sức ảnh hưởng trên YouTube đăng bài trên X.

Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.

Apple, NVIDIA, Anthropic và EleutherAI đã không trả lời yêu cầu bình luận từ Engadget.

Người đứng đầu bộ phận AI và học máy tại Apple, ông John Giannandrea, cũng từng phát biểu rằng, "lượng lớn dữ liệu đào tạo thực sự được tạo ra bởi chính Apple" nhưng không đi vào chi tiết.

Gã khổng lồ công nghệ Thung lũng Silicon cũng được cho là đã ký thỏa thuận với Shutterstock và Photobucket nhằm cấp phép cho hình ảnh đào tạo dữ liệu AI, nhưng chưa xác nhận công khai mối quan hệ hợp tác. Trong khi Apple Intelligence cố gắng luôn cố gắng nhấn mạnh cách tiếp cận tập trung nhiều hơn vào quyền riêng tư thông qua bộ xử lý trên thiết bị và điện toán đám mây tùy chỉnh, thì dường như nguyên tắc cơ bản khi thu thập dữ liệu nền tảng cho mô hình AI của công ty không khác gì so với đa số đối thủ cạnh tranh.

Đầu tháng này, các nghệ sĩ và nhiếp ảnh gia đã chỉ trích Apple vì đã không tiết lộ nguồn dữ liệu đào tạo cho Apple Intelligence, công ty sở hữu công nghệ AI sắp ra mắt trên hàng triệu thiết bị Apple trong năm nay.

YouTube, kho lưu trữ video lớn nhất thế giới, là một kho vàng không chỉ có bản ghi mà còn cả âm thanh, video và hình ảnh, khiến nó trở thành một bộ dữ liệu hấp dẫn để đào tạo các mô hình AI. Đầu năm nay, Giám đốc công nghệ của OpenAI, Mira Murati, đã né tránh các câu hỏi từ The Wall Street Journal về việc liệu công ty có sử dụng video YouTube để đào tạo Sora, công cụ tạo video AI sắp ra mắt của OpenAI hay không. Murati cho biết vào thời điểm đó: “Tôi sẽ không đi sâu vào chi tiết về dữ liệu đã được sử dụng, nhưng đó là dữ liệu được cấp phép hoặc có sẵn công khai.

Giám đốc điều hành Alphabet Sundar Pichai cũng cho biết, các công ty sử dụng dữ liệu từ YouTube để đào tạo các mô hình AI của họ sẽ vi phạm điều khoản dịch vụ của nền tảng này.

Mới đây, Apple đã phải nộp phạt 210 triệu won (hơn 4 tỷ đồng) sau khi bị Ủy ban Truyền thông Hàn Quốc KCC cáo buộc thu thập dữ liệu vị trí mà không có sự đồng ý của người dùng. Hành vi của Apple vi phạm điều khoản liên quan dữ liệu vị trí và các chính sách khác của Hàn Quốc. Ngoài Apple, KCC cũng phạt Google, nhưng ở mức 3 triệu won (60 triệu đồng).

Thu Trà (t/h)

TAGS:

Tin bài khác
Máy bay A380 của Emirates được trang bị wi-fi Starlink

Máy bay A380 của Emirates được trang bị wi-fi Starlink

Tính đến thời điểm hiện tại, 25 chiếc Boeing 777-300ER đã được trang bị Starlink, và chiếc A380 đầu tiên cũng đã chính thức đi vào vận hành, đã có hơn 650.000 hành khách của Emirates được trải nghiệm dịch vụ kết nối hiện đại này trên các chuyến bay có trang bị Starlink.
Đà Nẵng số hóa di sản bằng VR360

Đà Nẵng số hóa di sản bằng VR360

Phường Hải Vân và Bàn Thạch (Đà Nẵng) đồng loạt triển khai nền tảng thực tế ảo VR360 để số hóa di tích lịch sử, văn hóa, mở hướng phát triển du lịch thông minh và đưa di sản đến gần hơn với cộng đồng, đặc biệt là giới trẻ.
YouTube ghi nhận hơn 2 tỉ giờ xem Shorts mỗi tháng trên TV

YouTube ghi nhận hơn 2 tỉ giờ xem Shorts mỗi tháng trên TV

Xu hướng xem video ngắn trên màn hình TV đang tăng mạnh khi YouTube ghi nhận hơn 2 tỉ giờ xem Shorts mỗi tháng, cho thấy nội dung dọc ngày càng mở rộng khỏi nền tảng điện thoại.
Đèn LED panel lên ngôi trong văn phòng hiện đại: Giải pháp tiết kiệm điện và nâng cao trải nghiệm làm việc

Đèn LED panel lên ngôi trong văn phòng hiện đại: Giải pháp tiết kiệm điện và nâng cao trải nghiệm làm việc

Đèn LED panel đang trở thành lựa chọn phổ biến trong các văn phòng hiện đại không chỉ giúp tiết kiệm điện năng tới 50-70% so với đèn huỳnh quang truyền thống, dòng đèn này còn ghi điểm nhờ khả năng chiếu sáng đồng đều, hạn chế chói lóa và phù hợp với nhiều mô hình không gian làm việc.
Mỹ duyệt bán chip H200 cho Trung Quốc, Nvidia vẫn mắc kẹt giữa thế đối đầu công nghệ

Mỹ duyệt bán chip H200 cho Trung Quốc, Nvidia vẫn mắc kẹt giữa thế đối đầu công nghệ

Dù Mỹ đã cho phép khoảng 10 công ty Trung Quốc mua chip AI H200 của Nvidia, các lô hàng vẫn chưa thể giao do trở ngại từ Bắc Kinh và những điều kiện kiểm soát phức tạp từ cả hai phía. Diễn biến này cho thấy Nvidia đang chịu sức ép ngày càng lớn trong cuộc cạnh tranh công nghệ giữa Mỹ và Trung Quốc.
Chuẩn hóa dữ liệu IoT giao thông, tăng tốc cho hạ tầng giao thông thông minh thông minh

Chuẩn hóa dữ liệu IoT giao thông, tăng tốc cho hạ tầng giao thông thông minh thông minh

Bộ Xây dựng vừa ban hành Kế hoạch triển khai Đề án “Ứng dụng Internet vạn vật (IoT) trong lĩnh vực giao thông thông minh”, đặt mục tiêu chuẩn hóa và liên thông toàn bộ dữ liệu IoT giao thông giữa Bộ Xây dựng, Bộ Công an và các địa phương vào giai đoạn 2029-2035.
Chỉ với một “chạm”, người dân TP.HCM có thể gửi phản ánh khẩn cấp đến Công an

Chỉ với một “chạm”, người dân TP.HCM có thể gửi phản ánh khẩn cấp đến Công an

Trong bối cảnh tình hình an ninh trật tự, tai nạn giao thông, cháy nổ và các sự cố khẩn cấp ngày càng diễn biến phức tạp, việc tiếp nhận thông tin nhanh chóng từ người dân đóng vai trò đặc biệt quan trọng trong công tác xử lý, cứu nạn và đảm bảo an toàn xã hội.
Coi chừng mất hàng chục triệu đồng vì chia sẻ link phim lậu, mod game

Coi chừng mất hàng chục triệu đồng vì chia sẻ link phim lậu, mod game

Cơn lốc quét vi phạm bản quyền trực tuyến đang nóng hơn bao giờ hết sau chỉ đạo khẩn của Thủ tướng. Việc "tiếp tay" phát tán nội dung lậu trên không gian mạng không còn là chuyện giải trí đơn thuần, mà đã trở thành hành vi vi phạm pháp luật có thể bị truy quét và xử phạt tới 20 triệu đồng.
Hà Nội tăng tốc ứng dụng công nghệ để “đánh thức” kinh tế đêm

Hà Nội tăng tốc ứng dụng công nghệ để “đánh thức” kinh tế đêm

Từ camera AI, bản đồ số đến thanh toán không tiền mặt, Hà Nội đang tăng tốc ứng dụng công nghệ và chuyển đổi số nhằm xây dựng hệ sinh thái kinh tế đêm hiện đại, an toàn, hướng tới trở thành động lực tăng trưởng mới của ngành dịch vụ và du lịch Thủ đô.
Sử dụng phần mềm lậu: Doanh nghiệp đối mặt án hình sự, phạt tiền trăm triệu

Sử dụng phần mềm lậu: Doanh nghiệp đối mặt án hình sự, phạt tiền trăm triệu

Bộ Văn hóa, Thể thao và Du lịch vừa phát đi văn bản tối khẩn, yêu cầu các tổ chức, doanh nghiệp rà soát, tuyệt đối không sử dụng chương trình máy tính không có bản quyền. Đây là động thái cụ thể nhằm thực hiện chỉ thị của Thủ tướng về đợt cao điểm ra quân, xử lý nghiêm các hành vi xâm phạm quyền sở hữu trí tuệ, trong đó Bộ Công an sẽ chủ trì việc xác minh, khởi tố các vụ án nghiêm trọng.
Làn sóng sa thải do AI bước vào giai đoạn mới: Doanh nghiệp cắt giảm con người để nuôi cỗ máy

Làn sóng sa thải do AI bước vào giai đoạn mới: Doanh nghiệp cắt giảm con người để nuôi cỗ máy

Nếu giai đoạn 2023–2025 mới chỉ là thời kỳ doanh nghiệp dùng AI như một công cụ tối ưu chi phí và hợp thức hóa các đợt cắt giảm hậu tăng trưởng nóng, thì năm 2026 đánh dấu bước chuyển sang một cấp độ quyết liệt hơn: AI bắt đầu trở thành trung tâm tái phân bổ vốn, cạnh tranh trực tiếp với ngân sách dành cho con người.
Truy vết dòng tiền, siết vi phạm sở hữu trí tuệ từ cửa khẩu đến không gian mạng

Truy vết dòng tiền, siết vi phạm sở hữu trí tuệ từ cửa khẩu đến không gian mạng

Sự bùng nổ của kinh tế số và vận tải xuyên biên giới đang khiến các hành vi xâm phạm quyền sở hữu trí tuệ ngày càng tinh vi. Trước thực tế này, Chính phủ đã phát lệnh mở đợt cao điểm từ ngày 7/5 đến 30/5/2026, đặt mục tiêu không chỉ lập lại trật tự trên không gian số mà còn siết chặt quản lý rủi ro trên toàn bộ chuỗi cung ứng hàng hóa.
Công nghệ bản sao số trong phát triển đô thị thông minh

Công nghệ bản sao số trong phát triển đô thị thông minh

Hội thảo chuyên đề “Công nghệ bản sao số trong phát triển đô thị thông minh” được tổ chức trong khuôn khổ sự kiện Diễn đàn và Triển lãm Quốc tế Đô thị Thông minh Châu Á tại Việt Nam - Smart City Asia 2026. Sự kiện quy tụ các nhà quản lý, chuyên gia công nghệ, đại diện doanh nghiệp trong và ngoài nước nhằm thảo luận về vai trò của công nghệ bản sao số trong xây dựng chính quyền số và phát triển đô thị bền vững.
OpenAI tung siêu mẫu GPT-5.5 Instant: ChatGPT chính thức có "trí nhớ dài hạn"

OpenAI tung siêu mẫu GPT-5.5 Instant: ChatGPT chính thức có "trí nhớ dài hạn"

OpenAI vừa chính thức phát hành GPT-5.5 Instant, thay thế hoàn toàn phiên bản 5.3 để trở thành model mặc định trên ChatGPT. Điểm đột phá nhất không chỉ nằm ở điểm số Benchmark vượt trội mà còn ở khả năng quản lý ngữ cảnh: ChatGPT giờ đây có thể tự tìm kiếm lại các tệp cũ, nội dung Gmail và lịch sử trò chuyện để phản hồi chính xác, giảm thiểu tối đa tình trạng "bịa chuyện".
10 nhóm công nghệ chiến lược định hình trụ cột tăng trưởng mới từ 1/7/2026

10 nhóm công nghệ chiến lược định hình trụ cột tăng trưởng mới từ 1/7/2026

Quyết định số 21/2026/QĐ-TTg do Hồ Quốc Dũng ký ban hành đã xác lập 10 nhóm công nghệ chiến lược cùng 30 sản phẩm trọng điểm, tạo nền tảng thúc đẩy đổi mới sáng tạo, nâng cao năng lực cạnh tranh quốc gia và mở ra không gian phát triển mới cho doanh nghiệp.