Cloudflare – tập đoàn công nghệ hàng đầu thế giới trong lĩnh vực bảo mật và tối ưu hóa kết nối Internet – chính thức áp dụng chính sách chặn mặc định các trình thu thập dữ liệu trí tuệ nhân tạo (AI crawler) nếu không có sự cho phép rõ ràng từ chủ sở hữu website.
![]() |
Cloudflare ra mắt chính sách chặn AI crawler mặc định để bảo vệ quyền sáng tạo trong thời đại số |
Trong bối cảnh các mô hình AI ngày càng phát triển mạnh mẽ, hàng loạt công ty công nghệ lớn đã bị chỉ trích vì âm thầm “hút” dữ liệu từ website – bao gồm văn bản, hình ảnh và video – để huấn luyện mô hình mà không xin phép hay đền bù cho chủ sở hữu. Hệ quả là nhiều nhà sáng tạo mất đi nguồn thu từ quảng cáo, lượt truy cập, và quan trọng hơn cả – là quyền kiểm soát nội dung của chính họ.
Cloudflare đã nhận ra điều đó và đi tiên phong trong việc khôi phục sự cân bằng. “Nếu Internet muốn tồn tại trong thời đại AI, cần phải trả lại quyền kiểm soát cho những người sáng tạo nội dung,” ông Matthew Prince – đồng sáng lập kiêm CEO Cloudflare – phát biểu.
Từ tháng 7/2025, mọi tên miền mới sử dụng dịch vụ Cloudflare sẽ được cấu hình mặc định từ chối truy cập từ các AI crawler trừ khi có sự cho phép rõ ràng từ chủ trang. Điều này có nghĩa là thay vì chủ động ngăn chặn, người dùng sẽ mặc định được bảo vệ – một bước tiến lớn về phía quyền riêng tư dữ liệu.
Cloudflare cho biết chính sách này không chỉ giúp bảo vệ nội dung gốc khỏi việc bị sao chép và sử dụng trái phép, mà còn thúc đẩy tính minh bạch trong ngành AI. Các công ty phát triển AI muốn thu thập dữ liệu giờ đây phải công khai mục đích sử dụng, bao gồm việc huấn luyện mô hình, tìm kiếm hay phân tích.
Kể từ tháng 9/2024, Cloudflare đã cung cấp tùy chọn chặn AI crawler cho hơn 1 triệu người dùng. Tuy nhiên, bước đi mới trong tháng 7/2025 đánh dấu việc đưa chính sách này trở thành mặc định – giúp hàng triệu tên miền mới được bảo vệ ngay từ đầu, thay vì phải tự mình cấu hình.
Chủ sở hữu trang web cũng có thể linh hoạt điều chỉnh tùy chọn nếu muốn chia sẻ nội dung với các hệ thống AI, tuy nhiên quyền quyết định luôn thuộc về họ – điều trước đây chưa từng có.
Hướng tới một cộng đồng sử dụng Internet có trách nhiệm
Động thái này nhanh chóng nhận được sự ủng hộ từ nhiều tên tuổi lớn trong ngành truyền thông và công nghệ. Ông Roger Lynch, CEO Tập đoàn Condé Nast, khẳng định: “Đây là bước tiến quan trọng để tạo ra một môi trường Internet công bằng, nơi giá trị nội dung được tôn trọng và nhà sáng tạo được bảo vệ.”
Steve Huffman – đồng sáng lập kiêm CEO Reddit – cũng đánh giá cao sự minh bạch mà Cloudflare mang lại: “Khi việc thu thập dữ liệu trở nên minh bạch và có kiểm soát, toàn bộ hệ sinh thái – từ nhà sáng tạo, nền tảng đến người dùng – sẽ hoạt động tốt hơn.”
Không dừng lại ở việc chặn AI crawler, Cloudflare cũng đang hợp tác phát triển một giao thức chuẩn mới giúp các bot AI có thể xác thực danh tính khi truy cập trang web. Mục tiêu là xây dựng một hạ tầng minh bạch, nơi cả người sáng tạo và nhà phát triển AI đều có thể cùng tồn tại và phát triển trong khuôn khổ công bằng, có trách nhiệm.
Sở hữu mạng lưới bảo mật phủ sóng 20% lượng truy cập web toàn cầu, Cloudflare đang đóng vai trò như một “người gác cổng” đáng tin cậy trong công cuộc bảo vệ dữ liệu số. Với chính sách chặn AI crawler mặc định, công ty đã mở ra một tiền lệ mới – nơi nhà sáng tạo không còn là “nạn nhân thụ động” của công nghệ, mà là người kiểm soát tương lai nội dung của chính mình.
Trong thời đại AI phát triển như vũ bão, sự can thiệp của những tên tuổi như Cloudflare là vô cùng cần thiết. Việc đưa ra các biện pháp kiểm soát dữ liệu không chỉ bảo vệ quyền lợi cho nhà sáng tạo, mà còn giúp định hình lại cách chúng ta vận hành và chia sẻ thông tin trên Internet.