Reddit đạt thỏa thuận với Google về việc cung cấp nội dung để huấn luyện AI

22:01 23/02/2024

Thỏa thuận giữa Google và Reddit thể hiện giá trị của dữ liệu cũng như sự tôn trọng bản quyền mà các công ty công nghệ dành cho những người sáng tạo nội dung.

Ảnh minh họa
Ảnh minh họa.

Mới đây, Google cho biết, đã ký thỏa thuận về quyền sử dụng dữ liệu với mạng xã hội Reddit. Theo đó, gã khổng lồ tìm kiếm này sẽ trả cho Reddit mỗi năm 60 triệu USD để có quyền truy cập vào nội dung của Reddit. Những nội dung này sẽ được dùng để huấn luyện cho Trí tuệ nhân tạo (AI) của Google.

Thỏa thuận này nhấn mạnh việc Reddit đang tìm cách tạo ra doanh thu mới trong bối cảnh cạnh tranh gay gắt về tiền quảng cáo từ những nền tảng khác như TikTok và Facebook (thuộc Meta).

Tờ Bloomberg nhận định thỏa thuận này có thể coi là một cột mốc, một hình mẫu cho các hợp đồng tương tự trong tương lai. Thỏa thuận giữa Google và Reddit thể hiện giá trị của dữ liệu cũng như sự tôn trọng bản quyền mà các công ty công nghệ dành cho những người sáng tạo nội dung.

Được thành lập vào năm 2005 bởi nhà phát triển web Steve Huffman và doanh nhân Alexis Ohanian, Reddit được biết đến với các nhóm thảo luận chuyên sâu đa dạng, một số nhóm có hàng chục triệu thành viên. Vì vậy, những dữ liệu của họ rất quý và hiệu quả trong việc huấn luyện AI.

Với việc trả phí cho Reddit, Google có được một nguồn dữ liệu tốt, hợp pháp để đào tạo AI trong bối cảnh họ đang bị tụt lại so với đối thủ như OpenAI hay Microsoft.

Đây cũng đặc biệt là chiến thắng của đội lãnh đạo Reddit. Mới nửa năm trước, Reddit còn bị lên án và tẩy chay vì kế hoạch thu phí AI này.

Năm ngoái, Reddit cho biết, mạng xã hội này sẽ tính phí các công ty truy cập vào giao diện lập trình ứng dụng (API) - phương tiện để phân phối nội dung của mình. Ban lãnh đạo Reddit bị hàng loạt người dùng chỉ trích và đe dọa rời bỏ nền tảng vì chính sách thu phí nhắm vào các công ty làm AI như kiểu ChatGPT hay Google.

Hơn 6.000 người dùng đã chuyển tài khoản của họ về chế độ “riêng tư” như một cách bày tỏ sự phẫn nộ trước quyết định thu phí API của Reddit.

Từ trước đến nay, Reddit vẫn miễn phí truy cập dữ liệu của mình thông qua API. Một cách nôm na, API là 1 cổng để các phần mềm bên ngoài truy cập, lấy và sử dụng dữ liệu của Reddit. Tận dụng điều đó, rất nhiều công ty phần mềm trí tuệ nhân tạo (AI), tiêu biểu như OpenAI (chủ quản ChatGPT), đã lấy dữ liệu của Reddit để đào tạo cho AI của mình.

Giám đốc Reddit, ông Steve Huffman khẳng định, kho dữ liệu của Reddit rất có giá trị trong việc đào tạo trí tuệ nhân tạo và không thể “biếu không” cho Google, OpenAI, Microsoft để những công ty này làm phần mềm của riêng mình được.

Thỏa thuận với Google lần này là thỏa thuận đầu tiên được báo cáo với một công ty AI lớn và ban lãnh đạo Reddit đã chứng minh được tầm nhìn xa trông rộng của mình khi đã bắt được các hãng AI phải tôn trọng bản quyền nội dung của Reddit. 

Reddit, dự kiến sẽ được IPO (phát hành cổ phiếu lần đầu ra công chúng) trong thời gian tới, có giá trị ước tính khoảng 10 tỷ USD. Công ty có thể bán tới 10% cổ phiếu và các chuyên gia trong ngành suy đoán đợt IPO này có thể xảy ra sớm nhất ngay trong tháng tới.

Về phía Google, công ty đã xác nhận sẽ có thể sử dụng API của Reddit để khai thác nội dung "thời gian thực" từ nền tảng này. Họ cũng nói rõ rằng, thông qua quan hệ đối tác trên với Reddit, Google sẽ có thể nâng cao sức mạnh của Vertex AI. Google coi Vertex AI là công cụ được thiết kế để giúp các nhà phát triển đào tạo và triển khai các mô hình máy học cũng như các ứng dụng AI khác. 

Phương Tú (t/h)