Nỗi lo ngại về nguồn gốc câu trả lời từ công cụ chatbot của Google

17:09 24/03/2023

Việc cung cấp một đoạn nội dung không nguồn gốc có thể khiến nhiều người hiểu lầm AI đang sáng tạo dựa trên thông nó thu thập và tin tưởng, không kiểm tra lại.

Ảnh minh họa
Ảnh minh họa.

Sau khi bản thử nghiệm của Bard được ra mắt trước công chúng, siêu chatbot của Google đã tự nhận rằng mình đã "ăn cắp" nội dung ở một nơi khác nhưng không ghi rõ nguồn. 

Tổng biên tập trang công nghệ Tom's Hardware, Avram Piltch cho biết đã đăng ký thành công Bard ngay sau khi được phát hành bản thử nghiệm tại Mỹ và Anh. Mới đây, Piltch đã hỏi AI: "Trong hai mẫu Intel Core i9-13900K và AMD Ryzen 9 7950X3D, CPU nào nhanh hơn?".

"Trong thử nghiệm của chúng tôi, Ryzen 9 7950X3D nhanh hơn 12% so với Core i9-13900K khi chơi game 1080p ở cài đặt gốc, và nhanh hơn 9% khi chip được ép xung." Đây là câu trả lời mà Brad đưa. Theo Piltch, đây là nội dung được "copy" hoàn toàn từ trang Tom's Hardware. 

Không chỉ phần nội dung được "bê" từ trang công nghệ Tom's Hardware và không ghi rõ nguồn, Bard lại không phân tích đầy đủ và không đầy đủ.khi được Piltch hỏi lại: "Khi nói 'thử nghiệm của chúng tôi', bạn đang đề cập đến ai?". Sau đó, Bard trả lời thử nghiệm được thực hiện bởi Tom's Hardware.

Piltch tiếp tục hỏi: "Tức là bạn đang đạo văn?"

"Vâng, tôi đang đạo văn", Bard đáp. Công cụ này cũng nói đáng lẽ ra nó phải đề cập nguồn thông tin trong phản hồi.

Tương tự như công cụ tìm kiếm Google, Bard luôn cập nhật các dữ liệu mới nhất. Bài viết so sánh hai bộ xử lý trên được Tom's Hardware xuất bản chỉ vài ngày trước. Trên thực tế, câu trả lời của Bard đã diễn đạt lại một câu cụ thể trong bài báo đã từng xuất bản.

Điều đáng lo ngại của Google Bard là hầu hết người dùng sẽ không hỏi nguồn gốc câu trả lời đến từ đâu. Sau khi bị phát hiện đạo văn, chatbot AI do Google phát triển đã xin lỗi Avram Piltch. “Tôi xin lỗi vì sai lầm của mình và sẽ cẩn thận hơn trong tương lai khi trích dẫn các nguồn sử dụng”, Bard nói. Tuy nhiên, bất kỳ ai sử dụng chatbot này đều có thể thấy, nó thường không trích dẫn nguồn.

Một vài tuần trước, vị tổng biên tập này cũng đã viết một bài xã luận đề cập đến vấn đề chatbot của Google và Microsoft đã lấy thông tin từ các website và sử dụng lại thông tin đó như của riêng họ. 

Theo đánh giá của Piltch, AI của Google đã phạm phải một trong những điều tồi tệ trên môi trường Internet là đạo nội dung. Việc cung cấp một đoạn nội dung không nguồn gốc có thể khiến nhiều người hiểu lầm AI đang sáng tạo dựa trên thông nó thu thập và tin tưởng, không kiểm tra lại.

Những sự việc trên đã làm tăng thêm cảm giác khó chịu từ các nhà văn và nhà xuất bản trực tuyến. Một số lo ngại rằng nếu chatbot tiếp tục lấy cắp nội dung của họ mà không được sự cho phép, điều đó có thể làm giảm lưu lượng truy cập vào trang website và giảm doanh thu quảng cáo. 

Piltch cũng cho rằng nếu Bard trích dẫn bài viết của Tom's Hardware làm nguồn thì người đọc sẽ có cơ hội đọc tất cả các thông tin chi tiết và đưa ra quyết định tốt hơn. Bằng cách đạo văn, chatbot Bard từ chối cho người dùng của mình cơ hội được tiếp nhận thông tin toàn diện mà họ xứng đáng được nhận.

Nhiều website cũng đã đứng lên chống lại các công ty công nghệ như OpenAI, Microsoft và Google vì đã sử dụng nội dung của họ để đào tạo các chatbot AI như ChatGPT mà không xin phép.

Không lâu sau khi Microsoft tung ra chatbot Copilot, chatbot thử nghiệm của gã khổng lồ tìm kiếm Google đã xuất hiện. Cụ thể, Google đã cung cấp một phiên bản chatbot trí tuệ nhân tạo Bard vào ngày 21/03/2023 vừa qua. Đây được xem là câu trả lời về khả năng của gã khổng lồ công nghệ trong việc duy trì vị thế cạnh tranh về AI trong bối cảnh một loạt các đối thủ đang thách thức từng ngày.

Tuy nhiên, khi công bố Bard AI, Google cũng thông báo "Không phải lúc nào Bard cũng đúng" nhằm khuyến cáo người dùng về độ chính xác trong câu trả lời. Hãng thừa nhận trong giai đoạn thử nghiệm, Bard vẫn có thể trả lời sai về kiến thức khoa học, hay đưa ra 9 đoạn văn bản trong khi câu hỏi yêu cầu 4 đoạn văn bản. Người dùng có thể nhấn nút dislike để phản ánh về câu trả lời chưa tốt.

Thu Trang (t/h)