Thứ bảy 29/11/2025 15:03
Hotline: 024.355.63.010
Email: banbientap.dnhn@gmail.com
Kinh tế số

ByteDance tăng tốc trong cuộc đua AI với công cụ thu thập dữ liệu mới

Nghiên cứu cho thấy, tốc độ thu thập của Bytespider - công cụ thu thập dữ liệu web mà ByteDance mới ra mắt nhanh gấp 25 lần so với GPTbot của OpenAI.
Công cụ thu thập dữ liệu web mới của ByteDance vượt qua các đối thủ lớn
Công cụ thu thập dữ liệu web mới của ByteDance vượt qua các đối thủ lớn như Google, Meta, Amazon và OpenAI.

Công ty mẹ của TikTok là ByteDance, đã ra mắt công cụ thu thập dữ liệu web mang tên Bytespider vào tháng 4 năm nay. Theo Kasada, một công ty chuyên về quản lý bot (phần mềm tự động), Bytespider nhanh chóng nổi lên như một trong những công cụ thu thập dữ liệu mạnh nhất trên internet, vượt qua các đối thủ lớn như Google, Meta, Amazon và OpenAI. Nghiên cứu cho thấy, tốc độ thu thập dữ liệu của Bytespider nhanh gấp 25 lần so với GPTbot của OpenAI, công cụ thu thập dữ liệu phục vụ cho nền tảng ChatGPT.

Việc thu thập dữ liệu với tốc độ cao giúp ByteDance có thêm nhiều dữ liệu để đào tạo các mô hình ngôn ngữ lớn (LLM) và mô hình đa phương tiện (LMM), những thành phần cốt lõi trong việc phát triển các công cụ AI thế hệ mới. Trong bối cảnh các công ty công nghệ lớn đang chạy đua trong lĩnh vực AI, ByteDance cố gắng rút ngắn khoảng cách bằng cách thu thập một lượng dữ liệu khổng lồ từ các trang web toàn cầu.

Sam Crowther, CEO của Kasada, cho biết, kể từ khi Bytespider xuất hiện, nó đã thu thập dữ liệu với tốc độ nhanh hơn khoảng 25 lần so với GPTbot - công cụ thu thập dữ liệu cho nền tảng ChatGPT của OpenAI và các mô hình cơ bản. Bytespider cũng đã thu thập dữ liệu với tốc độ nhanh hơn 3.000 lần so với ClaudeBot của startup AI Anthropic.

Theo Kasada, khi những tháng trôi qua, Bytespider thậm chí còn gấp rút hơn trong việc thu thập dữ liệu. Hoạt động thu thập dữ liệu từ Bytespider tăng đột biến trong 6 tuần qua.

Việc ByteDance thu thập dữ liệu một cách thần tốc diễn ra bất chấp khả năng TikTok bị cấm tại Mỹ trong những tháng tới. Trước đó, Tổng thống Joe Biden đã ký một đạo luật yêu cầu công ty Trung Quốc này phải bán hoặc đóng cửa TikTok do lo ngại về an ninh quốc gia.

Một nguồn tin nội bộ cho biết, ByteDance đang phát triển một mô hình ngôn ngữ lớn mới nhằm cải thiện khả năng tìm kiếm trên TikTok.

Ngoài ra, Bytespider được cho là không tuân thủ tập tin quy định về robots.txt, một tập tin mà các nhà xuất bản web sử dụng để ngăn các công cụ thu thập dữ liệu. Mặc dù điều này không vi phạm pháp luật, nhưng nó có thể dẫn đến các tranh chấp về quyền sở hữu trí tuệ. Nhiều tổ chức cho rằng, việc thu thập dữ liệu mà không được phép là hành vi vi phạm bản quyền, gây ra nhiều tranh cãi trong lĩnh vực này.

"Giống như họ đang cố gắng hết sức để bắt kịp", Crowther nói về hoạt động thu thập dữ liệu tích cực do Bytespider thực hiện. Chỉ riêng năm ngoái, ByteDance được cho là đã tụt hậu rất xa trong cuộc đua AI tạo sinh đến mức họ đã sử dụng OpenAI để giúp xây dựng LLM của riêng ByteDance, điều này trái với các điều khoản dịch vụ của OpenAI.

Gần đây nhất, ByteDance chính thức bước vào cuộc đua video AI với hai mô hình trí tuệ nhân tạo là PixelDance và Seaweed được ra mắt dưới tên thương hiệu Doubao trong Volcano Engine AI Innovation Tour tại Thâm Quyến ngày 24/9. Cả hai mô hình đều nhắm vào thị trường doanh nghiệp và hiện tại vẫn đang trong giai đoạn thử nghiệm với số lượng người được mời tham gia hạn chế.

Việc ra mắt diễn ra mà không có bất kỳ thông báo trước nào. Mặc dù triển khai lặng lẽ, nhưng sự mong đợi trong ngành vẫn tăng nhờ vào những tiến bộ trước đó từ các đối thủ cạnh tranh như Open AI và Kuaishou.

Việc ByteDance ra mắt hai mô hình trên cũng cho thấy tham vọng lớn của công ty trong việc phát triển các công nghệ AI tiên tiến, bất chấp những thách thức pháp lý và sự cạnh tranh khốc liệt trong ngành.

Tin bài khác
Ngân hàng siết an ninh giao dịch số: 1,7 triệu lượt cảnh báo rủi ro, ngăn chặn hơn 2.200 tỷ đồng

Ngân hàng siết an ninh giao dịch số: 1,7 triệu lượt cảnh báo rủi ro, ngăn chặn hơn 2.200 tỷ đồng

Tính đến ngày 14/11/2025, toàn ngành đã có hơn 136,1 triệu hồ sơ khách hàng cá nhân và hơn 1,4 triệu hồ sơ tổ chức được đối chiếu sinh trắc học qua CCCD gắn chip hoặc VNeID.
Hà Nội: Xóa bỏ hành chính công cấp phường, xã, kiện toàn Trung tâm Phục vụ hành chính công một cấp

Hà Nội: Xóa bỏ hành chính công cấp phường, xã, kiện toàn Trung tâm Phục vụ hành chính công một cấp

Hà Nội đang kiện toàn Trung tâm Phục vụ hành chính công một cấp theo Nghị định 118/2025 nhằm xây dựng mô hình chính quyền đô thị tinh gọn, hiện đại, minh bạch, nâng cao chất lượng phục vụ người dân và doanh nghiệp.
Doanh nghiệp Việt có đang phòng thủ chậm?

Doanh nghiệp Việt có đang phòng thủ chậm?

Khi công nghệ đang được sử dụng không chỉ cho mục đích “tốt”, hoạt động an ninh mạng bước vào giai đoạn mà ranh giới giữa “an toàn” và “bị xâm nhập” trở nên mờ nhạt hơn bao giờ hết. Các kỹ thuật tấn công hiện đại dựa trên AI và phi kỹ thuật đang khiến phần lớn tổ chức không thể phát hiện sớm rủi ro, tạo ra khoảng trống nguy hiểm giữa thực tế và những gì hệ thống bảo mật báo cáo.
Kinh tế số: Hướng tới mục tiêu 30% GDP vào năm 2030

Kinh tế số: Hướng tới mục tiêu 30% GDP vào năm 2030

Kinh tế số Việt Nam đã đạt được những bước tiến trong thời gian gần đây với mục tiêu nâng giá trị gia tăng so với GDP đạt 30% vào 2030.
Người dùng Việt tự kiểm chứng chất lượng Internet

Người dùng Việt tự kiểm chứng chất lượng Internet

Nếu trước đây, việc lựa chọn nhà mạng phần lớn dựa trên quảng cáo hoặc cảm nhận chủ quan, thì hiện nay, người dùng đã bắt đầu đặt dữ liệu thực tế làm trung tâm.
Quảng Ninh tăng tốc thu hút đầu tư trong lĩnh vực khoa học công nghệ và chuyển đổi số

Quảng Ninh tăng tốc thu hút đầu tư trong lĩnh vực khoa học công nghệ và chuyển đổi số

Ngày 24/11/2025, tại Trung tâm Hội nghị Quốc tế FLC Hạ Long, tỉnh Quảng Ninh tổ chức Hội nghị Xúc tiến đầu tư phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số năm 2025. Sự kiện được triển khai thực hiện các mục tiêu, định hướng lớn trong Nghị quyết số 57-NQ/TW của Bộ Chính trị, Nghị quyết số 71/NQ-CP của Chính phủ và các chương trình hành động của Tỉnh ủy, Ban Chỉ đạo tỉnh về phát triển khoa học công nghệ và chuyển đổi số.
Đồng Tháp quyết liệt chuyển đổi số, hiện đại hóa nền hành chính sau sáp nhập

Đồng Tháp quyết liệt chuyển đổi số, hiện đại hóa nền hành chính sau sáp nhập

Sau khi thực hiện sắp xếp, sáp nhập các đơn vị hành chính và triển khai mô hình chính quyền địa phương hai cấp, Đồng Tháp đang đặt trọng tâm mạnh mẽ vào việc ứng dụng khoa học – công nghệ, đẩy mạnh chuyển đổi số trong vận hành chính quyền, hướng tới một nền hành chính hiện đại, thân thiện, phục vụ người dân hiệu quả.
AI mở ra “làn sóng mới” cho chuyển đổi kép của doanh nghiệp nhỏ và vừa

AI mở ra “làn sóng mới” cho chuyển đổi kép của doanh nghiệp nhỏ và vừa

Báo cáo Thường niên Chuyển đổi kép 2025 cho thấy áp lực từ các tiêu chuẩn môi trường và dữ liệu quốc tế đang buộc doanh nghiệp nhỏ và vừa phải thay đổi nhanh hơn, nhưng đồng thời mở ra cơ hội ứng dụng AI, điện toán đám mây và blockchain để giảm chi phí, đáp ứng chuẩn xanh – số và nâng cao năng lực cạnh tranh trên thị trường toàn cầu.
TS. Chử Đức Hoàng: Chính sách đột phá mở đường để DNNN làm chủ công nghệ lõi

TS. Chử Đức Hoàng: Chính sách đột phá mở đường để DNNN làm chủ công nghệ lõi

TS. Chử Đức Hoàng cho rằng Việt Nam đang sở hữu đòn bẩy chính sách trị giá 25.000 tỷ mỗi năm cùng cơ chế sandbox mới, tạo cơ hội để DNNN tiên phong làm chủ AI, bán dẫn và chuyển đổi số.
Thanh toán QR Code bùng nổ nhưng nhiều hộ kinh doanh vẫn dùng mã cá nhân?

Thanh toán QR Code bùng nổ nhưng nhiều hộ kinh doanh vẫn dùng mã cá nhân?

Thanh toán QR Code ngày càng phổ biến tại Việt Nam, song nhiều hộ kinh doanh vẫn sử dụng mã QR cá nhân để nhận tiền, dẫn đến khó khăn trong quản lý, thiếu minh bạch và tiềm ẩn rủi ro về sổ sách, thuế.
Phát triển nguồn lực và công dân số khởi nghiệp: Việt Nam cần thêm 700.000 nhân sự an ninh mạng

Phát triển nguồn lực và công dân số khởi nghiệp: Việt Nam cần thêm 700.000 nhân sự an ninh mạng

Sự kiện “Ngày hội Sinh viên & Chung khảo Cuộc thi Sinh viên An ninh mạng 2025” (CSCV 2025) đã trở thành tâm điểm chú ý của cộng đồng công nghệ, quy tụ hơn 3.000 sinh viên, hơn 50 doanh nghiệp công nghệ và hàng trăm chuyên gia an toàn thông tin đã diễn ra ngày 15/11, tại Hà Nội.
Tự động hóa trong ngành may mặc đang trở thành xu hướng tất yếu

Tự động hóa trong ngành may mặc đang trở thành xu hướng tất yếu

Tự động hóa trong ngành may mặc đang trở thành xu hướng tất yếu trong công nghiệp may toàn cầu. Các công nghệ thông minh có thể giúp doanh nghiệp Việt Nam nâng cao năng suất, giảm phù thuộc lao động, tăng chất lượng và tính ổn định.
Khai giảng chương trình Train-the-Trainers đầu tiên trên toàn quốc

Khai giảng chương trình Train-the-Trainers đầu tiên trên toàn quốc

Ngày 18/11, Hội truyền thông số Việt Nam (VDCA), Trung tâm Đổi mới sáng tạo Quốc gia, Bộ Tài chính phối hợp với Hiệp hội bán dẫn toàn cầu – Khu vực Đông Nam Á (SEMI SEA) khai giảng Chương trình đào tạo, bồi dưỡng giảng viên, chuyên gia phục vụ ngành công nghiệp bán dẫn (train-the- trainers) cho giảng viên các trường đại học, cao đẳng trên toàn quốc.
Open API – mảnh ghép chiến lược hiện đại hóa thị trường tài chính

Open API – mảnh ghép chiến lược hiện đại hóa thị trường tài chính

Trong khuôn khổ Dự án hỗ trợ kỹ thuật “Thúc đẩy tài chính toàn diện và tài trợ khí hậu” do Ngân hàng Phát triển Châu Á (ADB) tài trợ, với sự đồng hành của Cục Kinh tế Liên bang Thụy Sỹ (SECO), Ngân hàng Nhà nước (NHNN) ngày 14/11 tổ chức Sự kiện Kết nối Fintech năm 2025 với chủ đề: “Chia sẻ dữ liệu hướng tới tài chính toàn diện và đổi mới”.
Thuế TP. Hồ Chí Minh thúc đẩy chuyển đổi số cho hộ kinh doanh, ký kết hợp tác triển khai hóa đơn điện tử

Thuế TP. Hồ Chí Minh thúc đẩy chuyển đổi số cho hộ kinh doanh, ký kết hợp tác triển khai hóa đơn điện tử

Ngày 14/11, Thuế TP. Hồ Chí Minh ký thỏa thuận hợp tác với Hội Tư vấn thuế Việt Nam và các doanh nghiệp công nghệ nhằm đẩy nhanh chuyển đổi số trong khu vực hộ kinh doanh, tập trung vào triển khai hóa đơn điện tử và mở rộng các hình thức thanh toán số.