Thứ năm 01/01/2026 19:36
Hotline: 024.355.63.010
Email: banbientap.dnhn@gmail.com
Kinh tế số

Apple, Nvidia và Anthropic bị chỉ trích vì sử dụng trái phép dữ liệu YouTube để đào tạo AI

18/07/2024 12:14
Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.
Ảnh minh họa
Ảnh minh họa.

Wall Street Journal dẫn kết quả mới đây của cuộc điều tra từ Proof News cho thấy, Apple, Nvidia và Anthropic đã sử dụng bộ dữ liệu tạo bởi công ty phi lợi nhuận có tên EleutherAI, chứa hơn 173.000 các bản ghi lại nội dung video YouTube của hơn 48.000 kênh mà không hề có sự xin phép chủ sở hữu hay nhà sáng tạo nội dung.

Mặc dù tập dữ liệu không chứa hình ảnh hay video, song các nội dung được lấy lại từ những nhà sáng tạo nội dung hàng đầu trên nền tảng như Marques Brownlee và MrBeast, cũng như các nhà xuất bản tin tức lớn như The New York Times, BBC và ABC News. Ngoài ra, còn có phụ đề từ các video thuộc về Engadget.

“Apple sử dụng dữ liệu từ một số công ty để huấn luyện cho AI của họ. Một trong số đó là các dữ liệu, bản ghi từ các video trên YouTube, bao gồm cả của tôi”, Brownlee, một người có sức ảnh hưởng trên YouTube đăng bài trên X.

Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.

Apple, NVIDIA, Anthropic và EleutherAI đã không trả lời yêu cầu bình luận từ Engadget.

Người đứng đầu bộ phận AI và học máy tại Apple, ông John Giannandrea, cũng từng phát biểu rằng, "lượng lớn dữ liệu đào tạo thực sự được tạo ra bởi chính Apple" nhưng không đi vào chi tiết.

Gã khổng lồ công nghệ Thung lũng Silicon cũng được cho là đã ký thỏa thuận với Shutterstock và Photobucket nhằm cấp phép cho hình ảnh đào tạo dữ liệu AI, nhưng chưa xác nhận công khai mối quan hệ hợp tác. Trong khi Apple Intelligence cố gắng luôn cố gắng nhấn mạnh cách tiếp cận tập trung nhiều hơn vào quyền riêng tư thông qua bộ xử lý trên thiết bị và điện toán đám mây tùy chỉnh, thì dường như nguyên tắc cơ bản khi thu thập dữ liệu nền tảng cho mô hình AI của công ty không khác gì so với đa số đối thủ cạnh tranh.

Đầu tháng này, các nghệ sĩ và nhiếp ảnh gia đã chỉ trích Apple vì đã không tiết lộ nguồn dữ liệu đào tạo cho Apple Intelligence, công ty sở hữu công nghệ AI sắp ra mắt trên hàng triệu thiết bị Apple trong năm nay.

YouTube, kho lưu trữ video lớn nhất thế giới, là một kho vàng không chỉ có bản ghi mà còn cả âm thanh, video và hình ảnh, khiến nó trở thành một bộ dữ liệu hấp dẫn để đào tạo các mô hình AI. Đầu năm nay, Giám đốc công nghệ của OpenAI, Mira Murati, đã né tránh các câu hỏi từ The Wall Street Journal về việc liệu công ty có sử dụng video YouTube để đào tạo Sora, công cụ tạo video AI sắp ra mắt của OpenAI hay không. Murati cho biết vào thời điểm đó: “Tôi sẽ không đi sâu vào chi tiết về dữ liệu đã được sử dụng, nhưng đó là dữ liệu được cấp phép hoặc có sẵn công khai.

Giám đốc điều hành Alphabet Sundar Pichai cũng cho biết, các công ty sử dụng dữ liệu từ YouTube để đào tạo các mô hình AI của họ sẽ vi phạm điều khoản dịch vụ của nền tảng này.

Mới đây, Apple đã phải nộp phạt 210 triệu won (hơn 4 tỷ đồng) sau khi bị Ủy ban Truyền thông Hàn Quốc KCC cáo buộc thu thập dữ liệu vị trí mà không có sự đồng ý của người dùng. Hành vi của Apple vi phạm điều khoản liên quan dữ liệu vị trí và các chính sách khác của Hàn Quốc. Ngoài Apple, KCC cũng phạt Google, nhưng ở mức 3 triệu won (60 triệu đồng).

Thu Trà (t/h)

TAGS:

Tin bài khác
Đà Nẵng phê duyệt thử nghiệm có kiểm soát giải pháp chuyển đổi tài sản số theo mô hình không lưu ký

Đà Nẵng phê duyệt thử nghiệm có kiểm soát giải pháp chuyển đổi tài sản số theo mô hình không lưu ký

Đà Nẵng phê duyệt thử nghiệm giải pháp MIMO chuyển đổi tài sản số không lưu ký, mở đường cho quản lý tài sản số minh bạch, an toàn, hiệu quả.
Thị trường Crypto Việt Nam giảm sâu do nhà đầu tư cẩn trọng

Thị trường Crypto Việt Nam giảm sâu do nhà đầu tư cẩn trọng

Năm 2025 khép lại với một nghịch lý rõ rệt của thị trường crypto tại Việt Nam: trong khi khung pháp lý lần đầu được lộ diện tương đối rõ ràng nhưng tâm lý nhà đầu tư lại trở nên nguội lạnh, thận trọng và kém hưng phấn hơn hẳn so với năm 2024. Khi Bitcoin điều chỉnh sâu gần 30% từ đỉnh lịch sử 126.000 USD, phần đông người tham gia thị trường không còn giữ được tâm thế lạc quan như những chu kỳ trước.
Zalo và quyền riêng tư đến làn sóng dời bỏ âm thầm: Người dùng không còn lựa chọn?

Zalo và quyền riêng tư đến làn sóng dời bỏ âm thầm: Người dùng không còn lựa chọn?

Việc Zalo đồng loạt gửi yêu cầu người dùng chấp thuận điều khoản sử dụng và thu thập dữ liệu cá nhân mới đang tạo ra một chuyển động đáng chú ý trong cộng đồng người dùng. Không ồn ào phản đối, không kêu gọi tẩy chay, nhưng một làn sóng rời bỏ âm thầm đang diễn ra, khi nhiều cá nhân và doanh nghiệp chuyển sang sử dụng các ứng dụng khác như WhatsApp, Telegram...
Luật Bảo vệ dữ liệu cá nhân 2025: Người dân lần đầu có quyền yêu cầu doanh nghiệp xóa dữ liệu

Luật Bảo vệ dữ liệu cá nhân 2025: Người dân lần đầu có quyền yêu cầu doanh nghiệp xóa dữ liệu

Luật Bảo vệ dữ liệu cá nhân 2025 có hiệu lực từ 1/1/2026, lần đầu trao cho người dân quyền yêu cầu doanh nghiệp xóa dữ liệu, siết chặt trách nhiệm của mạng xã hội và cấm mua bán dữ liệu cá nhân trái phép.
Kim Oanh Group hợp tác đối tác công nghệ, tiên phong ứng dụng AI và Robotic trong quản lý vận hành dự án

Kim Oanh Group hợp tác đối tác công nghệ, tiên phong ứng dụng AI và Robotic trong quản lý vận hành dự án

TP.HCM, ngày 18/12/2025, Kim Oanh Group đã chính thức ký kết thỏa thuận hợp tác chiến lược cùng AirCity, thành lập liên doanh K-City – đơn vị tiên phong ứng dụng các giải pháp công nghệ hiện đại như Trí tuệ nhân tạo (AI) và Robot tự hành (Robotic) trong công tác quản lý vận hành bất động sản, đặc biệt tại phân khúc nhà ở xã hội (NOXH).
Công nghệ AI, Deepfake đang bị lợi dụng để thao túng tâm lý và trục lợi tinh vi

Công nghệ AI, Deepfake đang bị lợi dụng để thao túng tâm lý và trục lợi tinh vi

Theo ông Vũ Hoàng Liên - Chủ tịch Hiệp hội Internet Việt Nam, Công nghệ AI, Deepfake đang bị lợi dụng để trở thành công cụ thao túng tâm lý và trục Theo ông Vũ Hoàng Liên - Chủ tịch Hiệp hội Internet Việt Nam, Công nghệ AI, Deepfake đang bị lợi dụng để trở thành công cụ thao túng tâm lý và trục lợi tinh vi.
AI – Đòn bẩy nâng cấp năng lực sản xuất trong không gian phát triển mới của TP. Hồ Chí Minh

AI – Đòn bẩy nâng cấp năng lực sản xuất trong không gian phát triển mới của TP. Hồ Chí Minh

Trong bối cảnh TP. Hồ Chí Minh mở rộng không gian phát triển, hướng tới mô hình siêu đô thị đa trung tâm, trí tuệ nhân tạo đang trở thành “chìa khóa” giúp ngành sản xuất nâng cấp năng lực cạnh tranh và thích ứng với yêu cầu tăng trưởng xanh. Hội thảo “Ứng dụng AI: Tối ưu quy trình trong sản xuất” do ITPC phối hợp với Trường Đại học Anh Quốc Việt Nam tổ chức đã phác họa rõ bức tranh cơ hội, thách thức và lộ trình triển khai AI, từ đó gợi mở hướng đi thực chất cho cộng đồng doanh nghiệp trong giai đoạn chuyển đổi mới.
Australia cấm trẻ em dưới 16 tuổi dùng mạng xã hội, mở ra tiền lệ quản lý mới trên thế giới

Australia cấm trẻ em dưới 16 tuổi dùng mạng xã hội, mở ra tiền lệ quản lý mới trên thế giới

Từ ngày 10/12, Australia chính thức cấm trẻ em dưới 16 tuổi sử dụng mạng xã hội và yêu cầu 10 nền tảng lớn như TikTok, YouTube, Instagram, Facebook phải chặn truy cập ngay trước nửa đêm.
Công nghệ 2025: Khi AI, siêu ứng dụng và thế giới số trở thành “mạch sống” hằng ngày

Công nghệ 2025: Khi AI, siêu ứng dụng và thế giới số trở thành “mạch sống” hằng ngày

Năm 2025 đang chứng kiến một bước chuyển sâu sắc trong đời sống xã hội, khi công nghệ không còn đơn thuần là công cụ hỗ trợ mà dần trở thành “hạ tầng vô hình” chi phối cách con người sống, làm việc, học tập, mua sắm và giải trí.
Xu hướng đăng nhập không cần mật khẩu

Xu hướng đăng nhập không cần mật khẩu

Việc đăng nhập không dùng mật khẩu – từng được xem là một lựa chọn mang tính thử nghiệm – nay đang dần trở thành tiêu chuẩn mới trong ngành công nghệ.
TECHFEST 2025: Khởi nghiệp sáng tạo toàn dân, động lực tăng trưởng mới

TECHFEST 2025: Khởi nghiệp sáng tạo toàn dân, động lực tăng trưởng mới

TECHFEST Việt Nam 2025 với chủ đề "Khởi nghiệp sáng tạo toàn dân - Động lực tăng trưởng mới” sẽ diễn ra tại Phố đi bộ Hồ Hoàn Kiếm, Hà Nội từ ngày 12 - 14/12.
Doanh nghiệp Việt có đang phòng thủ chậm?

Doanh nghiệp Việt có đang phòng thủ chậm?

Khi công nghệ đang được sử dụng không chỉ cho mục đích “tốt”, hoạt động an ninh mạng bước vào giai đoạn mà ranh giới giữa “an toàn” và “bị xâm nhập” trở nên mờ nhạt hơn bao giờ hết. Các kỹ thuật tấn công hiện đại dựa trên AI và phi kỹ thuật đang khiến phần lớn tổ chức không thể phát hiện sớm rủi ro, tạo ra khoảng trống nguy hiểm giữa thực tế và những gì hệ thống bảo mật báo cáo.
Người dùng Việt tự kiểm chứng chất lượng Internet

Người dùng Việt tự kiểm chứng chất lượng Internet

Nếu trước đây, việc lựa chọn nhà mạng phần lớn dựa trên quảng cáo hoặc cảm nhận chủ quan, thì hiện nay, người dùng đã bắt đầu đặt dữ liệu thực tế làm trung tâm.
TS. Chử Đức Hoàng: Chính sách đột phá mở đường để DNNN làm chủ công nghệ lõi

TS. Chử Đức Hoàng: Chính sách đột phá mở đường để DNNN làm chủ công nghệ lõi

TS. Chử Đức Hoàng cho rằng Việt Nam đang sở hữu đòn bẩy chính sách trị giá 25.000 tỷ mỗi năm cùng cơ chế sandbox mới, tạo cơ hội để DNNN tiên phong làm chủ AI, bán dẫn và chuyển đổi số.
Phát triển nguồn lực và công dân số khởi nghiệp: Việt Nam cần thêm 700.000 nhân sự an ninh mạng

Phát triển nguồn lực và công dân số khởi nghiệp: Việt Nam cần thêm 700.000 nhân sự an ninh mạng

Sự kiện “Ngày hội Sinh viên & Chung khảo Cuộc thi Sinh viên An ninh mạng 2025” (CSCV 2025) đã trở thành tâm điểm chú ý của cộng đồng công nghệ, quy tụ hơn 3.000 sinh viên, hơn 50 doanh nghiệp công nghệ và hàng trăm chuyên gia an toàn thông tin đã diễn ra ngày 15/11, tại Hà Nội.