Reddit sẽ thu phí các công ty sử dụng dữ liệu của họ để đào tạo AI

23:16 19/04/2023

Trong những năm gần đây, dữ liệu của Reddit còn trở thành công cụ hỗ trợ đào tạo trí tuệ nhân tạo (AI) miễn phí cho Google, OpenAI, Microsoft.

Ảnh minh họa
Ảnh minh họa.

Reddit từ lâu đã là một điểm đến cho cuộc trò chuyện trên internet. Khoảng 57 triệu người truy cập trang web mỗi ngày để trò chuyện về các chủ đề đa dạng như trang điểm, trò chơi điện tử, các vấn đề của xã hội,..

Trong những năm gần đây, mảng trò chuyện của Reddit cũng là công cụ hỗ trợ giảng dạy miễn phí cho các công ty như Google, OpenAI và Microsoft. Những công ty đó đang sử dụng các cuộc trò chuyện của Reddit để phát triển các hệ thống trí tuệ nhân tạo khổng lồ mà nhiều người ở Thung lũng Silicon nghĩ rằng, điều này đang giúp xây dựng nên những điều lớn lao của ngành công nghệ trong tương lai. 

Giờ đây Reddit muốn được trả tiền cho dịch vụ mà hãng cung cấp. Công ty cho biết mới đây rằng, họ đã lên kế hoạch bắt đầu tính phí các công ty truy cập API (giao diện lập trình ứng dụng) của mình.

Steve Huffman, người sáng lập và Giám đốc điều hành của Reddit, cho biết trong một cuộc phỏng vấn: “Khối dữ liệu Reddit thực sự có giá trị. Nhưng chúng tôi không có nhiệm vụ cung cấp miễn phí tất cả giá trị đó cho một số công ty lớn nhất trên thế giới".

Động thái này là một trong những động thái quan trọng đầu tiên về việc tính phí truy cập vào các cuộc hội thoại mà mạng xã hội tổ chức nhằm mục đích phát triển các hệ thống AI như ChatGPT, công cụ phổ biến của OpenAI. Những hệ thống AI như ChatGPT có thể mang đến nhiều lợi ích cho các công ty đứng sau nhưng không có ích lợi gì với Reddit. Thực tế, nó còn có thể bị lợi dụng để tạo ra các đối thủ của Reddit.

Reddit cũng cho biết, đang chuẩn bị cho đợt phát hành cổ phiếu lần đầu ra công chúng (IPO) ở Mỹ trong năm nay. Công ty được thành lập năm 2005 này kiếm phần lớn tiền nhờ quảng cáo và giao dịch thương mại điện tử trên nền tảng của mình. Reddit cho biết, họ vẫn đang thảo luận chi tiết về việc tính phí và sẽ công bố giá trong vài tuần tới.

Những cuộc hội thoại trên Reddit hay tương tự trở thành món hàng giá trị khi mô hình ngôn ngữ lớn (LLM) đóng vai trò thiết yếu trong tạo ra công nghệ AI mới. LLM là những thuật toán tinh vi mà trong đó, dữ liệu từ Reddit được nạp vào để phát triển. Dịch vụ Google Bard hay ChatGPT đều sử dụng dữ liệu Reddit.

Tuần trước, Elon Musk nói sẽ kiểm soát việc sử dụng API của Twitter khi hàng nghìn công ty và nhà phát triển độc lập sử dụng nó để theo dõi hàng triệu cuộc hội thoại trên nền tảng. Mức phí có thể dao động từ vài nghìn đến vài trăm nghìn USD.

Huffman cho biết, API của Reddit vẫn miễn phí với các nhà phát triển muốn viết ứng dụng phục vụ cộng đồng Reddit hay các học giả muốn nghiên cứu dữ liệu cho mục đích học thuật hoặc phi thương mại.

Theo ông, việc các công ty thu thập dữ liệu, tạo ra giá trị nhưng không trả lại gì cho người dùng Reddit là một vấn đề. Vì thế, đây là thời điểm tốt để siết chặt mọi thứ.

Mai Hoa (t/h)