Thứ sáu 01/05/2026 22:59
Hotline: 024.355.63.010
Kinh tế số

Apple, Nvidia và Anthropic bị chỉ trích vì sử dụng trái phép dữ liệu YouTube để đào tạo AI

18/07/2024 12:14
Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.
Ảnh minh họa
Ảnh minh họa.

Wall Street Journal dẫn kết quả mới đây của cuộc điều tra từ Proof News cho thấy, Apple, Nvidia và Anthropic đã sử dụng bộ dữ liệu tạo bởi công ty phi lợi nhuận có tên EleutherAI, chứa hơn 173.000 các bản ghi lại nội dung video YouTube của hơn 48.000 kênh mà không hề có sự xin phép chủ sở hữu hay nhà sáng tạo nội dung.

Mặc dù tập dữ liệu không chứa hình ảnh hay video, song các nội dung được lấy lại từ những nhà sáng tạo nội dung hàng đầu trên nền tảng như Marques Brownlee và MrBeast, cũng như các nhà xuất bản tin tức lớn như The New York Times, BBC và ABC News. Ngoài ra, còn có phụ đề từ các video thuộc về Engadget.

“Apple sử dụng dữ liệu từ một số công ty để huấn luyện cho AI của họ. Một trong số đó là các dữ liệu, bản ghi từ các video trên YouTube, bao gồm cả của tôi”, Brownlee, một người có sức ảnh hưởng trên YouTube đăng bài trên X.

Trước đó, CEO YouTube Neal Mohan khẳng định, việc các công ty sử dụng dữ liệu của YouTube để đào tạo các mô hình AI là vi phạm các điều khoản và dịch vụ của nền tảng này.

Apple, NVIDIA, Anthropic và EleutherAI đã không trả lời yêu cầu bình luận từ Engadget.

Người đứng đầu bộ phận AI và học máy tại Apple, ông John Giannandrea, cũng từng phát biểu rằng, "lượng lớn dữ liệu đào tạo thực sự được tạo ra bởi chính Apple" nhưng không đi vào chi tiết.

Gã khổng lồ công nghệ Thung lũng Silicon cũng được cho là đã ký thỏa thuận với Shutterstock và Photobucket nhằm cấp phép cho hình ảnh đào tạo dữ liệu AI, nhưng chưa xác nhận công khai mối quan hệ hợp tác. Trong khi Apple Intelligence cố gắng luôn cố gắng nhấn mạnh cách tiếp cận tập trung nhiều hơn vào quyền riêng tư thông qua bộ xử lý trên thiết bị và điện toán đám mây tùy chỉnh, thì dường như nguyên tắc cơ bản khi thu thập dữ liệu nền tảng cho mô hình AI của công ty không khác gì so với đa số đối thủ cạnh tranh.

Đầu tháng này, các nghệ sĩ và nhiếp ảnh gia đã chỉ trích Apple vì đã không tiết lộ nguồn dữ liệu đào tạo cho Apple Intelligence, công ty sở hữu công nghệ AI sắp ra mắt trên hàng triệu thiết bị Apple trong năm nay.

YouTube, kho lưu trữ video lớn nhất thế giới, là một kho vàng không chỉ có bản ghi mà còn cả âm thanh, video và hình ảnh, khiến nó trở thành một bộ dữ liệu hấp dẫn để đào tạo các mô hình AI. Đầu năm nay, Giám đốc công nghệ của OpenAI, Mira Murati, đã né tránh các câu hỏi từ The Wall Street Journal về việc liệu công ty có sử dụng video YouTube để đào tạo Sora, công cụ tạo video AI sắp ra mắt của OpenAI hay không. Murati cho biết vào thời điểm đó: “Tôi sẽ không đi sâu vào chi tiết về dữ liệu đã được sử dụng, nhưng đó là dữ liệu được cấp phép hoặc có sẵn công khai.

Giám đốc điều hành Alphabet Sundar Pichai cũng cho biết, các công ty sử dụng dữ liệu từ YouTube để đào tạo các mô hình AI của họ sẽ vi phạm điều khoản dịch vụ của nền tảng này.

Mới đây, Apple đã phải nộp phạt 210 triệu won (hơn 4 tỷ đồng) sau khi bị Ủy ban Truyền thông Hàn Quốc KCC cáo buộc thu thập dữ liệu vị trí mà không có sự đồng ý của người dùng. Hành vi của Apple vi phạm điều khoản liên quan dữ liệu vị trí và các chính sách khác của Hàn Quốc. Ngoài Apple, KCC cũng phạt Google, nhưng ở mức 3 triệu won (60 triệu đồng).

Thu Trà (t/h)

TAGS:

Tin bài khác
Bí mật sau hợp đồng 9.000 tỷ của Hyundai Rotem và tham vọng đường sắt Việt Nam

Bí mật sau hợp đồng 9.000 tỷ của Hyundai Rotem và tham vọng đường sắt Việt Nam

Từ việc đứng trên vai "khổng lồ" Alstom đến khi tự chủ dòng tàu KTX-Cheongryong, hành trình của Hyundai Rotem là bài học đắt giá cho Việt Nam. Cú bắt tay với THACO không chỉ dừng lại ở Metro số 2 mà là "bàn đạp" để nội địa hóa toàn diện ngành công nghiệp đường sắt tốc độ cao.
Doanh nghiệp Việt Nam đối mặt làn sóng tấn công mạng ngày càng tinh vi

Doanh nghiệp Việt Nam đối mặt làn sóng tấn công mạng ngày càng tinh vi

Không chỉ gia tăng về số lượng, các cuộc tấn công mạng còn liên tục biến đổi, nhắm trực tiếp vào điểm yếu của doanh nghiệp. Nhận diện đúng rủi ro và cách phòng tránh đang trở thành yêu cầu cấp thiết.
Hai doanh nghiệp A.I. đạt thoả thuận sáp nhập

Hai doanh nghiệp A.I. đạt thoả thuận sáp nhập

Hai doanh nghiệp hoạt động trong ngành trí tuệ nhân tạo (A.I.) đã đạt thoả thuận sáp nhập, và dự kiến được xem như sự lựa chọn thay thế cho các công ty A.I. của Mỹ tại thị trường châu Âu.
Doanh nghiệp vận tải giải bài toán chi phí khi Hà Nội siết xe vào vùng phát thải thấp

Doanh nghiệp vận tải giải bài toán chi phí khi Hà Nội siết xe vào vùng phát thải thấp

Việc Hà Nội bắt đầu triển khai hệ thống camera tự động nhận diện phương tiện để kiểm soát vùng phát thải thấp đang thu hút sự chú ý lớn. Không chỉ là câu chuyện môi trường, chính sách này còn tác động trực tiếp đến hoạt động của doanh nghiệp vận tải, logistics và nhiều ngành kinh doanh phụ thuộc vào phương tiện cơ giới.
Zalo chặn chụp màn hình ảnh đại diện, tăng lớp bảo vệ quyền riêng tư người dùng

Zalo chặn chụp màn hình ảnh đại diện, tăng lớp bảo vệ quyền riêng tư người dùng

Zalo vừa bổ sung tính năng ngăn chụp hoặc quay màn hình ảnh đại diện của người dùng trên ứng dụng di động, tiếp tục đẩy mạnh định vị “riêng tư là cốt lõi” trong bối cảnh bảo mật dữ liệu cá nhân ngày càng được quan tâm. Tuy vậy, khả năng bảo vệ hiện vẫn chưa đồng bộ trên mọi nền tảng, đặt ra yêu cầu tiếp tục hoàn thiện trải nghiệm và độ an toàn cho người dùng.
TMT-EGreen lên kế hoạch 30.000 trụ sạc CCS2 toàn quốc đến năm 2030

TMT-EGreen lên kế hoạch 30.000 trụ sạc CCS2 toàn quốc đến năm 2030

Trong bối cảnh xe điện tăng trưởng nhanh tại Việt Nam, hạ tầng sạc đang trở thành yếu tố then chốt. TMT-EGreen – đơn vị thuộc TMT Group – đã công bố kế hoạch đầu tư quy mô lớn với mục tiêu xây dựng 30.000 trụ sạc tiêu chuẩn châu Âu CCS2 trên toàn quốc đến năm 2030, đồng thời bắt đầu triển khai giai đoạn đầu từ năm 2026.
Những điểm yếu khiến doanh nghiệp Việt Nam hứng chịu 46% vụ tấn công mạng

Những điểm yếu khiến doanh nghiệp Việt Nam hứng chịu 46% vụ tấn công mạng

Không chỉ dẫn đầu khu vực về số vụ tấn công mạng, doanh nghiệp Việt Nam còn đối mặt những lỗ hổng kéo dài từ con người đến hệ thống, khiến rủi ro tài chính và dữ liệu ngày càng lớn.
VNeID thêm chức năng tố giác tội phạm: Người dân cần biết gì để dùng đúng?

VNeID thêm chức năng tố giác tội phạm: Người dân cần biết gì để dùng đúng?

VNeID đang trở thành một kênh tiếp nhận tố giác, tin báo về tội phạm ngay trên điện thoại, giúp người dân phản ánh vụ việc nhanh hơn, kín hơn và theo dõi tiến độ xử lý. Nhưng cũng chính lúc ứng dụng này ngày càng phổ biến, các chiêu lừa đảo mạo danh cơ quan chức năng, yêu cầu “cập nhật VNeID”, “đồng bộ thông tin”, “xác thực lại dữ liệu” lại xuất hiện dày hơn, nhắm thẳng vào tiền trong tài khoản và dữ liệu cá nhân của người dùng.
Không xác thực SIM ngay, thuê bao có thể bị khóa từ hôm nay

Không xác thực SIM ngay, thuê bao có thể bị khóa từ hôm nay

Từ ngày 15/4/2026, quy định mới về xác thực thông tin thuê bao di động bằng dữ liệu định danh và ảnh khuôn mặt chính thức có hiệu lực. Với những thuê bao chưa chuẩn hóa, nhất là số đăng ký bằng CMND 9 số, nguy cơ bị tạm dừng một chiều, khóa hai chiều rồi chấm dứt hợp đồng là hoàn toàn có thể xảy ra nếu không sớm thực hiện.
Australia muốn hợp tác phát triển Fintech tại Việt Nam

Australia muốn hợp tác phát triển Fintech tại Việt Nam

Việt Nam đang tăng trưởng mạnh mẽ về thanh toán số, tài chính di động và xu hướng ứng dụng trí tuệ nhân tạo (AI) trong lĩnh vực ngân hàng. Điều này tạo ra nhu cầu lớn về các giải pháp công nghệ nhằm nâng cao quản trị rủi ro, bảo mật dữ liệu và tuân thủ pháp lý.
Siết nhiều lớp bảo vệ để giữ an toàn tài khoản khách hàng

Siết nhiều lớp bảo vệ để giữ an toàn tài khoản khách hàng

Trước diễn biến phức tạp của tội phạm sử dụng công nghệ cao để lừa đảo, chiếm đoạt tiền trong tài khoản ngân hàng, ông Lê Văn Tuyên, Phó Vụ trưởng Vụ Thanh toán (Ngân hàng Nhà nước) đã chia sẻ với phóng viên về các chính sách và giải pháp mà ngành ngân hàng đã, đang và sẽ triển khai nhằm tăng cường bảo vệ khách hàng trong các giao dịch thanh toán.
Hàn Quốc biến đô thị thông minh thành ngành xuất khẩu tỷ USD ra sao?

Hàn Quốc biến đô thị thông minh thành ngành xuất khẩu tỷ USD ra sao?

Điều đáng chú ý không nằm ở 6 dự án mới tại Đông Nam Á, mà ở cách Hàn Quốc biến đô thị thông minh thành một ngành xuất khẩu có lộ trình rõ ràng: dùng dự án thí điểm để chứng minh hiệu quả, dùng hợp tác chính phủ để mở cửa thị trường, dùng doanh nghiệp công nghệ để chốt đơn giải pháp, rồi nâng lên thành xuất khẩu “gói đô thị” thay vì bán lẻ từng thiết bị. Trong bối cảnh thị trường IoT cho smart city toàn cầu được OECD dẫn dự báo vượt 650 tỷ USD vào năm 2026, Hàn Quốc đang tìm cách chen chân vào một cuộc đua rất lớn.
Thuê bao có thể bị khóa hai chiều nếu đổi điện thoại không xác thực khuôn mặt

Thuê bao có thể bị khóa hai chiều nếu đổi điện thoại không xác thực khuôn mặt

Điểm dễ gây nhầm lẫn nhất trong Thông tư 08/2026/TT-BKHCN là mốc thời gian. Văn bản có hiệu lực từ ngày 15/4/2026, nhưng riêng quy định với thuê bao đổi thiết bị đầu cuối chỉ bắt đầu thực thi từ 15/6/2026. Từ thời điểm đó, nếu đổi điện thoại mà không xác thực lại khuôn mặt, thuê bao có thể bị tạm dừng chiều đi, sau đó bị khóa hai chiều và chấm dứt dịch vụ nếu tiếp tục không thực hiện.
iPhone màn hình gập đối mặt nguy cơ trễ hẹn vì rào cản kỹ thuật

iPhone màn hình gập đối mặt nguy cơ trễ hẹn vì rào cản kỹ thuật

Dự án iPhone màn hình gập của Apple đang bước vào giai đoạn quan trọng nhưng liên tiếp xuất hiện tín hiệu không thuận lợi. Những thách thức về công nghệ, đặc biệt liên quan đến bản lề và màn hình, có thể khiến thời điểm ra mắt sản phẩm bị lùi lại so với kỳ vọng ban đầu.
Tại sao Việt Nam là điểm đến mới của trung tâm dữ liệu châu Á - Thái Bình Dương?

Tại sao Việt Nam là điểm đến mới của trung tâm dữ liệu châu Á - Thái Bình Dương?

Việt Nam nổi lên như điểm đến mới của trung tâm dữ liệu châu Á - Thái Bình Dương, nhờ chi phí cạnh tranh và nhu cầu AI tăng mạnh, dù vẫn đối mặt thách thức lớn về nguồn điện và hạ tầng.