Apple, Nvidia và Anthropic bị chỉ trích vì sử dụng trái phép dữ liệu YouTube để đào tạo AI

18/07/2024 12:14

Công nghệ

Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.

Wall Street Journal dẫn kết quả mới đây của cuộc điều tra từ Proof News cho thấy, Apple, Nvidia và Anthropic đã sử dụng bộ dữ liệu tạo bởi công ty phi lợi nhuận có tên EleutherAI, chứa hơn 173.000 các bản ghi lại nội dung video YouTube của hơn 48.000 kênh mà không hề có sự xin phép chủ sở hữu hay nhà sáng tạo nội dung.

Mặc dù tập dữ liệu không chứa hình ảnh hay video, song các nội dung được lấy lại từ những nhà sáng tạo nội dung hàng đầu trên nền tảng như Marques Brownlee và MrBeast, cũng như các nhà xuất bản tin tức lớn như The New York Times, BBC và ABC News. Ngoài ra, còn có phụ đề từ các video thuộc về Engadget.

“Apple sử dụng dữ liệu từ một số công ty để huấn luyện cho AI của họ. Một trong số đó là các dữ liệu, bản ghi từ các video trên YouTube, bao gồm cả của tôi”, Brownlee, một người có sức ảnh hưởng trên YouTube đăng bài trên X.

Apple, NVIDIA, Anthropic và EleutherAI đã không trả lời yêu cầu bình luận từ Engadget.

Người đứng đầu bộ phận AI và học máy tại Apple, ông John Giannandrea, cũng từng phát biểu rằng, "lượng lớn dữ liệu đào tạo thực sự được tạo ra bởi chính Apple" nhưng không đi vào chi tiết.

Gã khổng lồ công nghệ Thung lũng Silicon cũng được cho là đã ký thỏa thuận với Shutterstock và Photobucket nhằm cấp phép cho hình ảnh đào tạo dữ liệu AI, nhưng chưa xác nhận công khai mối quan hệ hợp tác. Trong khi Apple Intelligence cố gắng luôn cố gắng nhấn mạnh cách tiếp cận tập trung nhiều hơn vào quyền riêng tư thông qua bộ xử lý trên thiết bị và điện toán đám mây tùy chỉnh, thì dường như nguyên tắc cơ bản khi thu thập dữ liệu nền tảng cho mô hình AI của công ty không khác gì so với đa số đối thủ cạnh tranh.

Đầu tháng này, các nghệ sĩ và nhiếp ảnh gia đã chỉ trích Apple vì đã không tiết lộ nguồn dữ liệu đào tạo cho Apple Intelligence, công ty sở hữu công nghệ AI sắp ra mắt trên hàng triệu thiết bị Apple trong năm nay.

YouTube, kho lưu trữ video lớn nhất thế giới, là một kho vàng không chỉ có bản ghi mà còn cả âm thanh, video và hình ảnh, khiến nó trở thành một bộ dữ liệu hấp dẫn để đào tạo các mô hình AI. Đầu năm nay, Giám đốc công nghệ của OpenAI, Mira Murati, đã né tránh các câu hỏi từ The Wall Street Journal về việc liệu công ty có sử dụng video YouTube để đào tạo Sora, công cụ tạo video AI sắp ra mắt của OpenAI hay không. Murati cho biết vào thời điểm đó: “Tôi sẽ không đi sâu vào chi tiết về dữ liệu đã được sử dụng, nhưng đó là dữ liệu được cấp phép hoặc có sẵn công khai.

Giám đốc điều hành Alphabet Sundar Pichai cũng cho biết, các công ty sử dụng dữ liệu từ YouTube để đào tạo các mô hình AI của họ sẽ vi phạm điều khoản dịch vụ của nền tảng này.

Mới đây, Apple đã phải nộp phạt 210 triệu won (hơn 4 tỷ đồng) sau khi bị Ủy ban Truyền thông Hàn Quốc KCC cáo buộc thu thập dữ liệu vị trí mà không có sự đồng ý của người dùng. Hành vi của Apple vi phạm điều khoản liên quan dữ liệu vị trí và các chính sách khác của Hàn Quốc. Ngoài Apple, KCC cũng phạt Google, nhưng ở mức 3 triệu won (60 triệu đồng).

Thu Trà (t/h)

TAGS:

Youtube

Bài liên quan

Google dừng hỗ trợ YouTube trên nhiều điện thoại Android đời cũ

Google mở rộng Chế độ AI, cho phép tương tác trực tiếp với nhiều ứng dụng phổ biến

Threads lần đầu gỡ nội dung vi phạm theo yêu cầu của Việt Nam

Tin bài khác

Apple đau đầu vì làn sóng săn lỗi bằng AI

03/08/2026 16:17

AI đang khiến cuộc săn lỗi bảo mật bước sang giai đoạn mới: phát hiện nhanh hơn, nhưng cũng tạo ra làn sóng báo cáo nhiễu buộc Apple phải siết lại quy trình tiếp nhận.

Samsung dự báo thiếu chip RAM đến năm 2028, người dùng có thể phải trả giá cao hơn

03/08/2026 16:15

Samsung dự báo tình trạng thiếu chip nhớ RAM sẽ tiếp tục kéo dài đến ít nhất năm 2028 khi nhu cầu phục vụ trí tuệ nhân tạo (AI) tăng mạnh. Điều này có thể khiến giá linh kiện và nhiều thiết bị điện tử tiếp tục chịu áp lực tăng.

OpenAI vượt mốc 1 tỷ người dùng, ChatGPT tiếp tục bứt phá

03/08/2026 14:42

OpenAI chính thức vượt mốc 1 tỷ người dùng hoạt động, đồng thời tiếp tục giảm giá các mô hình GPT-5.6 nhằm mở rộng khả năng tiếp cận AI.

Big Tech trước sức ép chia sẻ lợi ích với báo chí Australia

03/08/2026 14:40

Chính phủ Australia đang điều chỉnh cơ chế buộc các nền tảng kỹ thuật số chia sẻ lợi ích với báo chí, song cách tính phí mới dựa trên doanh thu quảng cáo được cho là có thể làm giảm sức ép tài chính đối với Big Tech và khiến các cơ quan báo chí lo ngại.

Ai đủ điều kiện được OpenAI cấp miễn phí ChatGPT bản mạnh nhất?

03/08/2026 11:14

OpenAI triển khai chương trình ChatGPT for Academic Researchers, cấp miễn phí quyền truy cập các mô hình AI mạnh nhất cho 100.000 nhà nghiên cứu tại các cơ sở học thuật nhằm hỗ trợ nghiên cứu khoa học, toán học và kỹ thuật.

Microsoft làm mới Windows 11 với giao diện WinUI 3

03/08/2026 10:30

Microsoft tiếp tục hiện đại hóa Windows 11 khi thay thế các hộp thoại cũ bằng giao diện WinUI 3, hướng tới trải nghiệm đồng bộ, cải thiện hiệu năng và tăng tính ổn định của hệ điều hành.

Amazon nắm 5% OpenAI sau khoản đầu tư 50 tỷ USD, cuộc đua AI tiếp tục nóng lên

01/08/2026 20:53

Việc Amazon hoàn tất giải ngân toàn bộ 50 tỷ USD vào OpenAI không chỉ giúp tập đoàn Mỹ trở thành một trong những cổ đông lớn của nhà phát triển ChatGPT, mà còn mở ra giai đoạn hợp tác sâu hơn về hạ tầng điện toán đám mây và chip AI. Động thái này phản ánh cuộc cạnh tranh ngày càng quyết liệt trên thị trường trí tuệ nhân tạo toàn cầu.

Google vừa tung công cụ AI tạo ảnh vệ tinh, hơn 24 giờ sau đã phải gỡ bỏ

01/08/2026 11:03

Chỉ sau hơn 24 giờ ra mắt, Google đã phải rút lại tính năng cho phép tạo ảnh AI ngay trên Google Earth, sau khi công cụ này bị cảnh báo có thể biến các hình ảnh vệ tinh giả thành “bằng chứng” rất khó phân biệt trên mạng xã hội.

Khi AI vượt khỏi “lồng kính” thử nghiệm an ninh mạng

31/07/2026 09:25

Từ những phòng thử nghiệm tưởng như được kiểm soát tuyệt đối, các mô hình AI tiên tiến đã bất ngờ chạm tới hệ thống thật ngoài đời. Những sự cố liên tiếp tại Anthropic và OpenAI không chỉ là sai sót kỹ thuật, mà còn đặt ra câu hỏi cấp bách về giới hạn an toàn khi trí tuệ nhân tạo được trao năng lực tự hành trong không gian mạng.

Việt Nam thành bệ phóng mô hình đổi mới sáng tạo vươn tầm quốc tế

30/07/2026 14:50

Tại VGIC 2026, lãnh đạo MB nhận định Việt Nam đang đứng trước cơ hội lớn để bứt phá nhờ công nghệ, đồng thời có thể trở thành nơi thử nghiệm, hoàn thiện và đưa các mô hình đổi mới sáng tạo ra toàn cầu.

AI mã nguồn mở Trung Quốc tăng tốc, tạo sức ép lên OpenAI và Anthropic

30/07/2026 14:45

Sự phát triển của các mô hình AI mã nguồn mở từ Trung Quốc, tiêu biểu là Kimi K3, đang thu hẹp khoảng cách với các đối thủ Mỹ và buộc những công ty như OpenAI, Anthropic phải xem xét lại chiến lược phát triển.

Australia kiện Telegram vì chậm gỡ nội dung cực đoan

30/07/2026 09:59

Cơ quan quản lý Internet Australia khởi kiện Telegram do bị cáo buộc không kịp thời gỡ bỏ các nội dung cổ súy khủng bố, trong bối cảnh nền tảng nhắn tin này và nhà sáng lập Pavel Durov tiếp tục đối mặt sức ép pháp lý tại nhiều quốc gia.

Ông lớn Big Four dùng AI viết báo cáo, để lộ chú thích giả và dấu vết ChatGPT

29/07/2026 17:05

Hàng loạt báo cáo về AI và xe điện của PwC bị phát hiện chứa chú thích giả, nguồn dẫn sai và cả dấu vết ChatGPT, làm dấy lên câu hỏi về cách các “ông lớn” tư vấn toàn cầu sử dụng trí tuệ nhân tạo trong chính sản phẩm nghiên cứu của mình.

iOS 27 bổ sung Call Context, tự hiển thị thông tin khi gọi doanh nghiệp

29/07/2026 15:18

iOS 27 mang đến tính năng Call Context giúp iPhone tự động hiển thị thông tin liên quan khi người dùng gọi đến doanh nghiệp, hỗ trợ tra cứu nhanh và nâng cao trải nghiệm liên lạc.

Lệnh hạn chế trẻ em dùng mạng xã hội ở Australia đối mặt thách thức thực thi

29/07/2026 14:40

Trước áp lực bảo vệ trẻ em trên không gian mạng, Australia đang đẩy mạnh thực thi lệnh hạn chế người dưới 16 tuổi sử dụng mạng xã hội. Tuy nhiên, nỗ lực này vấp phải sự phản ứng quyết liệt từ các tập đoàn công nghệ lớn, làm dấy lên tranh luận về quyền quản lý của chính phủ, trách nhiệm của nền tảng số và hiệu quả thực tế của các biện pháp kiểm soát độ tuổi.

Xem thêm

Đọc nhiều

Apple, Nvidia và Anthropic bị chỉ trích vì sử dụng trái phép dữ liệu YouTube để đào tạo AI

Google dừng hỗ trợ YouTube trên nhiều điện thoại Android đời cũ

Google mở rộng Chế độ AI, cho phép tương tác trực tiếp với nhiều ứng dụng phổ biến

Threads lần đầu gỡ nội dung vi phạm theo yêu cầu của Việt Nam

Apple đau đầu vì làn sóng săn lỗi bằng AI

Samsung dự báo thiếu chip RAM đến năm 2028, người dùng có thể phải trả giá cao hơn

OpenAI vượt mốc 1 tỷ người dùng, ChatGPT tiếp tục bứt phá

Big Tech trước sức ép chia sẻ lợi ích với báo chí Australia

Ai đủ điều kiện được OpenAI cấp miễn phí ChatGPT bản mạnh nhất?

Microsoft làm mới Windows 11 với giao diện WinUI 3

Amazon nắm 5% OpenAI sau khoản đầu tư 50 tỷ USD, cuộc đua AI tiếp tục nóng lên

Google vừa tung công cụ AI tạo ảnh vệ tinh, hơn 24 giờ sau đã phải gỡ bỏ

Khi AI vượt khỏi “lồng kính” thử nghiệm an ninh mạng

Việt Nam thành bệ phóng mô hình đổi mới sáng tạo vươn tầm quốc tế

AI mã nguồn mở Trung Quốc tăng tốc, tạo sức ép lên OpenAI và Anthropic

Australia kiện Telegram vì chậm gỡ nội dung cực đoan

Ông lớn Big Four dùng AI viết báo cáo, để lộ chú thích giả và dấu vết ChatGPT

iOS 27 bổ sung Call Context, tự hiển thị thông tin khi gọi doanh nghiệp

Lệnh hạn chế trẻ em dùng mạng xã hội ở Australia đối mặt thách thức thực thi

iPhone 18 Pro Max lộ cấu hình: Chip A20 Pro 2nm, AI mạnh hơn, camera nâng cấp

Apple phát hành iOS 26.6, tăng cường bảo mật và tối ưu Spotlight

iOS 27 bổ sung Call Context, tự hiển thị thông tin khi gọi doanh nghiệp

Ông lớn Big Four dùng AI viết báo cáo, để lộ chú thích giả và dấu vết ChatGPT

Claude Opus 5 ra mắt, AI lập trình mạnh hơn nhưng vẫn giữ nguyên giá

Qualcomm tăng giá chip từ tháng 9, nguy cơ đẩy giá thiết bị công nghệ tiếp tục leo thang