Công ty mẹ Tiktok bác bỏ cáo buộc dùng công nghệ OpenAI để phát triển sản phẩm

15:06 18/12/2023

Jodi Seth (đại diện ByteDance) xác nhận tập đoàn có dùng API của OpenAI trong giai đoạn khởi động Project Seed, nhưng đã ngừng hoàn toàn và xóa mọi dữ liệu đào tạo có liên quan từ giữa năm 2023.

Ảnh minh họa
Ảnh minh họa.

Ngày 17/12, ByteDance - chủ sở hữu của nền tảng Tiktok đã làm rõ bài báo của The Verge cáo buộc công ty bí mật sử dụng công nghệ của OpenAI để phát triển mô hình ngôn ngữ lớn (LLM) riêng, trong khi che giấu hành vi bằng kỹ thuật “khử nhạy dữ liệu”.

The Verge trước đó đưa tin, việc ByteDance sử dụng công nghệ của OpenAI để phát triển sản phẩm cạnh tranh là hành vi bị phản đối trong ngành công nghiệp trí tuệ nhân tạo (AI). Không chỉ có vậy, nó cũng vi phạm điều khoản dịch vụ của công ty đứng sau ChatGPT.

Theo điều khoản, khách hàng của OpenAI bị cấm “phát triển bất kỳ mô hình AI nào cạnh tranh với các sản phẩm và dịch vụ của chúng tôi”. Họ cũng không được dùng “bất kỳ biện pháp nào để trích xuất dữ liệu từ dịch vụ ngoài sự cho phép thông qua API”. API là giao diện lập trình ứng dụng, giúp các nhà phát triển dùng GPT để tạo ra ứng dụng riêng của mình.

ByteDance biết rõ điều này nhưng tiếp tục sử dụng API để đào tạo. The Verge cho biết đã được xem tài liệu truyền thông nội bộ ByteDance, hướng dẫn nhân viên che giấu bằng chứng bằng kỹ thuật “khử nhạy dữ liệu” (data desensitization). Đây là quy trình chỉnh sửa hoặc loại bỏ thông tin nhạy cảm khỏi dữ liệu để bảo vệ nó trước nguy cơ bị truy cập trái phép hoặc bị phát hiện.

Trong tuyên bố gửi SCMP, ByteDance thừa nhận khi bắt đầu khám phá các mô hình LLM hồi đầu năm, một nhóm nhỏ kỹ sư của hãng đã sử dụng dịch vụ API của OpenAI trong mô hình thử nghiệm nhưng không đồng nghĩa với việc phát hành ra công chúng.

Ngoài ra, công trình bị dừng vào tháng 4 sau khi OpenAI cấm dùng đầu ra từ các sản phẩm GPT để “phát triển mô hình cạnh tranh với OpenAI”.

Theo ByteDance – tập đoàn có trụ sở tại Bắc Kinh (thủ đô Trung Quốc), nhóm kỹ thuật của họ vẫn sử dụng API từ OpenAI cùng với một số mô hình bên thứ ba khác “ở một mức độ rất hạn chế trong quá trình đánh giá/thử nghiệm, chẳng hạn như đo điểm chuẩn”.

“ByteDance được cấp phép sử dụng API OpenAI và rất chú trọng đến việc tuân thủ các điều khoản sử dụng của OpenAI”, tập đoàn Trung Quốc cho biết.

Trước đó, Jodi Seth (đại diện ByteDance) xác nhận tập đoàn có dùng API của OpenAI trong giai đoạn khởi động Project Seed, nhưng đã ngừng hoàn toàn và xóa mọi dữ liệu đào tạo có liên quan từ giữa năm 2023.

"Công ty được Microsoft cấp phép truy cập API OpenAI. Ngoài ra, ByteDance chỉ sử dụng công cụ này để hỗ trợ sản phẩm AI ở thị trường quốc tế. Với chatbot Doubao tại Trung Quốc, chúng tôi có các mô hình tự phát triển", Jodi Seth nói.

Tuy nhiên, OpenAI thông báo đã đình chỉ ByteDance truy cập vào dịch vụ của mình.

“Dù việc sử dụng API của chúng tôi ở mức tối thiểu nhưng ByteDance đã bị đình chỉ tài khoản của họ trong khi điều tra thêm. Nếu phát hiện ra rằng việc sử dụng của ByteDance không tuân theo các chính sách này, chúng tôi sẽ yêu cầu thực hiện những thay đổi cần thiết hoặc chấm dứt tài khoản của họ”, OpenAI, công ty được Microsoft hậu thuẫn, cho biết trong một tuyên bố gửi tới The Verge.

Từ khi OpenAI giới thiệu ChatGPT dựa trên mô hình GPT 3.5 vào tháng 11/2022, các hãng công nghệ Trung Quốc cũng chạy đua để bắt kịp làn sóng AI tạo sinh, ra mắt các sản phẩm cạnh tranh.

Tuy nhiên, sự ra đời của GPT-4 Turbo hồi đầu tháng 11 được dự đoán sẽ nới rộng khoảng cách giữa OpenAI với các đối thủ Trung Quốc.

Thu Trà (T/h)

Tags: