Thứ năm 31/07/2025 06:17
Hotline: 024.355.63.010
Kinh tế số

OpenAI triển khai GPTbot để thu thập dữ liệu từ các trang web

10/08/2023 16:13
Theo OpenAI, việc cho phép GPTBot truy cập website giúp các mô hình AI trở nên chính xác hơn, đồng thời cải thiện khả năng và độ an toàn của chúng.
Ảnh minh họa
Ảnh minh họa.

OpenAI, nhà phát triển ChatGPT mới đây đã xác nhận sự tồn tại của GPTbot - trình thu thập dữ liệu web để huấn luyện AI. Mô hình GPT-5 dự kiến được đào tạo bằng nguồn dữ liệu này.

"Việc cho phép GPTBot truy cập website của bạn giúp các mô hình AI trở nên chính xác hơn, đồng thời cải thiện khả năng và độ an toàn của chúng", OpenAI cho biết.

Được biết, GPTBot sẽ tuân thủ nghiêm ngặt các quy tắc, không thu thập thông tin trả phí và sẽ không thu thập dữ liệu có thể theo dõi danh tính cá nhân.

Trước đó, người dùng đã quen với Googlebot, có nhiệm vụ lọc thông tin, ưu tiên hiển thị và xếp hạng trang web trong các kết quả tìm kiếm. Dù cũng thu thập dữ liệu, Business Insider đánh giá Goolgebot hữu ích vì website có thêm lưu lượng truy cập nếu được đề xuất. Tuy nhiên, sự trỗi dậy của AI tạo sinh và mô hình ngôn ngữ lớn đang phá vỡ sự cộng tác này.

Các công cụ như GPTbot sẽ giúp ChatGPT và GPT-4 có thể tổng hợp và trả lời câu hỏi, người dùng không cần truy cập các đường link. Điều này khiến nhiều trang web mất lượng truy cập lớn. Có nghĩa, các nhà sáng tạo nội dung cung cấp dữ liệu để GPTbot thu thập và phát triển lớn mạnh, sau đó quay lại cạnh tranh với chính họ. Stack Overflow, web cộng đồng của những lập trình viên chuyên nghiệp, ghi nhận sụt giảm người tham gia khi ChatGPT đủ khả năng giải quyết các lỗi lập trình khó.

Nỗi lo về GPTbot đang lan truyền mạnh. “Để GPTbot của OpenAI thu thập dữ liệu trang web của bạn là hành động tự hủy”. Nhận thức này đang lan truyền khá nhanh trong các cộng đồng trực tuyến. The Verge, ấn phẩm tin tức kỹ thuật số cạnh tranh với trang Insider, có vẻ đã thực hiện các bước để chặn GPTbot.

Không rõ GPTbot của OpenAI đã ẩn nấp trên mạng trong bao lâu. OpenAI gần đây đã công bố một cách để chặn GPTbot, sử dụng giao thức phổ biến có tên là robots.txt. Hoặc người dùng có thể ngăn GPTBot thu thập dữ liệu từ trang web của mình bằng cách chặn địa chỉ IP của nó. Một số người sáng tạo đã triển khai điều này, song có người thắc mắc GPTbot đã bí mật thu thập dữ liệu trực tuyến của mọi người trong bao nhiêu lâu.

Trước đây, việc OpenAI thu thập dữ liệu công khai để đào tạo các mô hình AI được cấp bằng sáng chế đã gây tranh cãi. Các trang web như Reddit và Twitter đã thực hiện các bước để chống lại việc các công ty AI sử dụng miễn phí bài viết của người dùng của họ, trong khi một số tác giả và những người sáng tạo khác đã bị truy tố vì nghi ngờ sử dụng trái phép tác phẩm của họ.

Minh Tú (T/h)

Tin bài khác
AI Trung Quốc thương mại hóa: Từ nhà máy đến thị trường quốc tế

AI Trung Quốc thương mại hóa: Từ nhà máy đến thị trường quốc tế

Từ các startup cho đến “ông lớn” công nghệ, doanh nghiệp AI Trung Quốc đang bắt đầu hái quả ngọt nhờ nhu cầu thực tế từ các ngành sản xuất, dịch vụ, giáo dục và y tế.
Bitmain sẽ mở nhà máy đầu tiên tại Mỹ, tận dụng làn sóng “Made in America”

Bitmain sẽ mở nhà máy đầu tiên tại Mỹ, tận dụng làn sóng “Made in America”

Bitmain, gã khổng lồ phần cứng khai thác tiền điện tử của Trung Quốc, chọn Mỹ làm điểm đến chiến lược, giữa bối cảnh chính sách công nghiệp Hoa Kỳ đang định hình lại chuỗi cung ứng toàn cầu.
Đà Nẵng đặt mục tiêu thành trung tâm tài chính, đổi mới và chuyển đổi số khu vực

Đà Nẵng đặt mục tiêu thành trung tâm tài chính, đổi mới và chuyển đổi số khu vực

Đà Nẵng sẽ tiếp tục kiên định con đường lấy khoa học - công nghệ, đổi mới sáng tạo và chuyển đổi số làm nền tảng. Tư duy đã được thành phố cụ thể hóa từ trước khi có Nghị quyết 57, thông qua các chính sách như Nghị quyết 43, Nghị quyết 136 của Quốc hội và Nghị định 154 của Chính phủ.
Doanh nghiệp AI Trung Quốc bắt tay xây dựng hệ sinh thái nội địa

Doanh nghiệp AI Trung Quốc bắt tay xây dựng hệ sinh thái nội địa

Trước các lệnh hạn chế xuất khẩu từ Mỹ, nhiều công ty AI hàng đầu Trung Quốc đã thành lập liên minh, nhằm thúc đẩy hệ sinh thái công nghệ nội địa, giảm phụ thuộc vào chip Nvidia và công nghệ nước ngoài.
Samsung điều chỉnh chiến lược One UI, ưu tiên dòng Z trước Galaxy S

Samsung điều chỉnh chiến lược One UI, ưu tiên dòng Z trước Galaxy S

Việc Android 16 ra mắt sớm đã khiến Samsung thay đổi lịch phát hành One UI, đưa dòng Galaxy Z trở thành nhóm thiết bị đầu tiên trải nghiệm phiên bản giao diện mới.
Smartphone giá rẻ, cấu hình cao: Lợi thế hay bẫy thị phần?

Smartphone giá rẻ, cấu hình cao: Lợi thế hay bẫy thị phần?

Nhiều hãng điện thoại mới đổ bộ vào Việt Nam với chiến lược tung giá rẻ bất ngờ nhưng gặp khó vì thiếu đầu tư vào thương hiệu, phân phối và niềm tin người tiêu dùng.
Đà Nẵng khởi động Dự án Fab-Lab – nền tảng cho công nghệ đóng gói vi mạch tiên tiến

Đà Nẵng khởi động Dự án Fab-Lab – nền tảng cho công nghệ đóng gói vi mạch tiên tiến

Đà Nẵng khởi động dự án Fab-Lab – mô hình lab-fab tiên phong phục vụ công nghệ đóng gói vi mạch, thúc đẩy phát triển ngành bán dẫn và thu hút đầu tư chiến lược.
Samsung mở rộng hợp tác AI, Galaxy S26 sẽ đa dạng tác vụ?

Samsung mở rộng hợp tác AI, Galaxy S26 sẽ đa dạng tác vụ?

Samsung đang đàm phán với nhiều công ty AI như OpenAI và Perplexity để tích hợp thêm dịch vụ trí tuệ nhân tạo vào dòng máy Galaxy S26, mở rộng lựa chọn bên cạnh Google Gemini.
Robot AutoGuide lần đầu xuất hiện tại Việt Nam: Bước ngoặt công nghệ trong điều trị động kinh

Robot AutoGuide lần đầu xuất hiện tại Việt Nam: Bước ngoặt công nghệ trong điều trị động kinh

Lần đầu tại Việt Nam, một ca động kinh kháng trị ở trẻ em được điều trị thành công bằng công nghệ robot định vị AutoGuide. Ca phẫu thuật do Bệnh viện Đa khoa Quốc tế Vinmec Central Park (TP.HCM) thực hiện đánh dấu bước đột phá trong điều trị bệnh lý thần kinh phức tạp, mở ra hy vọng cho hàng ngàn bệnh nhân động kinh tại Việt Nam.
Diễn đàn sản xuất thông minh Việt Nam 2025: Phát triển hệ sinh thái bán dẫn

Diễn đàn sản xuất thông minh Việt Nam 2025: Phát triển hệ sinh thái bán dẫn

Diễn đàn sản xuất thông minh Việt Nam 2025 với chủ đề chuyên sâu về nâng cấp sản xuất thông minh, phát triển hệ sinh thái bán dẫn và tăng trưởng bền vững. Đây là sự kiện nhằm cụ thể hóa các định hướng của Nghị quyết 57-NQ/TW, tạo cầu nối giữa chính sách của Chính phủ và thực tiễn triển khai tại doanh nghiệp.
Xuất khẩu công nghệ tăng tốc vượt trội tại châu Á

Xuất khẩu công nghệ tăng tốc vượt trội tại châu Á

Xuất khẩu công nghệ tại châu Á đã tăng vượt trội so với nhóm phi công nghệ, với khoảng cách lớn nhất ghi nhận ở Thái Lan, theo báo cáo mới nhất của Nomura.
Kinh tế số và công nghệ chiến lược: Lối đi tất yếu cho mô hình tăng trưởng mới của Việt Nam

Kinh tế số và công nghệ chiến lược: Lối đi tất yếu cho mô hình tăng trưởng mới của Việt Nam

Kinh tế số và công nghệ chiến lược đang trở thành hai trụ cột then chốt trong mô hình tăng trưởng mới, dẫn dắt nền kinh tế Việt Nam vươn lên mạnh mẽ trong giai đoạn 2026–2030.
Huawei trở lại ngôi vương thị trường smartphone Trung Quốc

Huawei trở lại ngôi vương thị trường smartphone Trung Quốc

Lần đầu tiên sau hơn bốn năm, Huawei đã vượt qua các đối thủ nội địa để dẫn đầu thị trường smartphone Trung Quốc, bất chấp sức mua yếu và tổng lượng tiêu thụ toàn ngành giảm sút.
Giao hàng hỏa tốc: Cuộc đua của những “ông lớn” thương mại điện tử Trung Quốc

Giao hàng hỏa tốc: Cuộc đua của những “ông lớn” thương mại điện tử Trung Quốc

Alibaba và JD.com đang đổ hàng tỷ USD vào cuộc chiến giành ngôi vương thị trường bán lẻ tức thời tại Trung Quốc, trong bối cảnh người tiêu dùng thắt chặt chi tiêu và cạnh tranh khốc liệt với Meituan.
AI đang làm sụt giảm nhu cầu tuyển dụng tại Anh

AI đang làm sụt giảm nhu cầu tuyển dụng tại Anh

Nhiều doanh nghiệp tại Anh đang giảm tuyển dụng ở các vị trí dễ dàng bị thay thế bởi AI, cho thấy công nghệ này đang tác động rõ nét đến thị trường lao động và chiến lược nhân sự.