OpenAI cáo buộc đối thủ DeepSeek sử dụng dữ liệu trái phép để phát triển AI |
Mới đây, OpenAI đã cáo buộc DeepSeek, một đối thủ bất ngờ đến từ Trung Quốc, đã "lấy dữ liệu không phù hợp" từ mô hình của mình để phát triển chatbot trí tuệ nhân tạo (AI) của riêng công ty này. Thông tin này được đưa ra sau khi DeepSeek công bố một Mô hình Ngôn ngữ Lớn (LLM) có hiệu quả vượt trội với mức giá thấp hơn nhiều so với các mô hình hiện có, gây bất ngờ lớn cho thị trường Mỹ. Thậm chí, sự kiện này đã khiến cổ phiếu của Nvidia, nhà sản xuất chip hàng đầu của Mỹ, sụt giảm mạnh mẽ.
OpenAI, công ty đứng sau chatbot nổi tiếng ChatGPT, đã cho rằng các công ty Trung Quốc đang tìm cách bắt kịp các đối thủ Mỹ thông qua một chiến thuật được gọi là "chưng cất" (distillation). Đây là quá trình huấn luyện một mô hình ngôn ngữ lớn bằng dữ liệu được tạo ra từ một mô hình khác. Theo OpenAI, họ đang điều tra và nhận thấy rằng DeepSeek có thể đã sử dụng phương pháp này để tinh chế và sao chép mô hình của họ.
Mặc dù chưa công khai cáo buộc DeepSeek vi phạm bảo mật, OpenAI đã thông báo rằng họ đang tiến hành các biện pháp kiểm tra và sẽ chia sẻ thông tin khi có thêm phát hiện. Việc "chưng cất" này thường bị hạn chế trong các điều khoản dịch vụ của nhiều công ty phát triển AI, nhưng lại khá phổ biến trong ngành công nghiệp này.
Trước đó, OpenAI cũng đã đối mặt với các cáo buộc tương tự khi bị cho là đã xây dựng ChatGPT bằng cách sử dụng trái phép nội dung mà không có quyền truy cập. Một trong những vụ kiện nổi bật là từ The New York Times, khi tờ báo này cáo buộc OpenAI đã sử dụng hàng triệu bài viết của họ mà không xin phép để huấn luyện mô hình.
Mặc dù vậy, Giám đốc điều hành của OpenAI, Sam Altman, đã gửi lời chúc mừng đến DeepSeek về thành tựu của họ trong việc phát triển mô hình AI, đồng thời nhận xét rằng đây là một mô hình ấn tượng, đặc biệt khi xét đến mức giá mà họ cung cấp. Tuy nhiên, không lâu sau đó, phát ngôn viên của OpenAI đã đưa ra tuyên bố cho rằng có thể chính phủ Mỹ sẽ tham gia vào vụ tranh chấp này, nhấn mạnh rằng họ sẽ hợp tác chặt chẽ với chính quyền để bảo vệ công nghệ AI tiên tiến nhất.
Bên cạnh đó, Cố vấn AI của Tổng thống Donald Trump, ông David Sacks, trong một cuộc phỏng vấn với Fox News, cho biết ông tin rằng DeepSeek đã sử dụng dữ liệu từ OpenAI thông qua phương pháp "chưng cất". Mặc dù vậy, ông cũng khẳng định chưa có hành động cụ thể nào từ Nhà Trắng trong vấn đề này. Ông cho rằng trong tương lai, các công ty AI hàng đầu của Mỹ sẽ thực hiện các biện pháp mạnh mẽ để ngừng tình trạng sao chép này, điều này sẽ làm chậm lại sự phát triển của các mô hình "copycat".
"Copycat" là một thuật ngữ thường được sử dụng để chỉ những sản phẩm, ý tưởng, hoặc hành động sao chép hoặc bắt chước một cách gần như nguyên vẹn từ một sản phẩm, ý tưởng hoặc hành động đã có sẵn từ trước.
Trong bối cảnh AI đang phát triển mạnh mẽ, câu chuyện giữa OpenAI và DeepSeek không chỉ phản ánh sự cạnh tranh gay gắt giữa các công ty công nghệ lớn mà còn mở ra một cuộc thảo luận rộng rãi về quyền sở hữu trí tuệ và các biện pháp bảo vệ công nghệ trong ngành công nghiệp trí tuệ nhân tạo.