Thứ tư 13/05/2026 03:30
Hotline: 024.355.63.010
Kinh tế số

ByteDance tăng tốc trong cuộc đua AI với công cụ thu thập dữ liệu mới

Nghiên cứu cho thấy, tốc độ thu thập của Bytespider - công cụ thu thập dữ liệu web mà ByteDance mới ra mắt nhanh gấp 25 lần so với GPTbot của OpenAI.
Công cụ thu thập dữ liệu web mới của ByteDance vượt qua các đối thủ lớn
Công cụ thu thập dữ liệu web mới của ByteDance vượt qua các đối thủ lớn như Google, Meta, Amazon và OpenAI.

Công ty mẹ của TikTok là ByteDance, đã ra mắt công cụ thu thập dữ liệu web mang tên Bytespider vào tháng 4 năm nay. Theo Kasada, một công ty chuyên về quản lý bot (phần mềm tự động), Bytespider nhanh chóng nổi lên như một trong những công cụ thu thập dữ liệu mạnh nhất trên internet, vượt qua các đối thủ lớn như Google, Meta, Amazon và OpenAI. Nghiên cứu cho thấy, tốc độ thu thập dữ liệu của Bytespider nhanh gấp 25 lần so với GPTbot của OpenAI, công cụ thu thập dữ liệu phục vụ cho nền tảng ChatGPT.

Việc thu thập dữ liệu với tốc độ cao giúp ByteDance có thêm nhiều dữ liệu để đào tạo các mô hình ngôn ngữ lớn (LLM) và mô hình đa phương tiện (LMM), những thành phần cốt lõi trong việc phát triển các công cụ AI thế hệ mới. Trong bối cảnh các công ty công nghệ lớn đang chạy đua trong lĩnh vực AI, ByteDance cố gắng rút ngắn khoảng cách bằng cách thu thập một lượng dữ liệu khổng lồ từ các trang web toàn cầu.

Sam Crowther, CEO của Kasada, cho biết, kể từ khi Bytespider xuất hiện, nó đã thu thập dữ liệu với tốc độ nhanh hơn khoảng 25 lần so với GPTbot - công cụ thu thập dữ liệu cho nền tảng ChatGPT của OpenAI và các mô hình cơ bản. Bytespider cũng đã thu thập dữ liệu với tốc độ nhanh hơn 3.000 lần so với ClaudeBot của startup AI Anthropic.

Theo Kasada, khi những tháng trôi qua, Bytespider thậm chí còn gấp rút hơn trong việc thu thập dữ liệu. Hoạt động thu thập dữ liệu từ Bytespider tăng đột biến trong 6 tuần qua.

Việc ByteDance thu thập dữ liệu một cách thần tốc diễn ra bất chấp khả năng TikTok bị cấm tại Mỹ trong những tháng tới. Trước đó, Tổng thống Joe Biden đã ký một đạo luật yêu cầu công ty Trung Quốc này phải bán hoặc đóng cửa TikTok do lo ngại về an ninh quốc gia.

Một nguồn tin nội bộ cho biết, ByteDance đang phát triển một mô hình ngôn ngữ lớn mới nhằm cải thiện khả năng tìm kiếm trên TikTok.

Ngoài ra, Bytespider được cho là không tuân thủ tập tin quy định về robots.txt, một tập tin mà các nhà xuất bản web sử dụng để ngăn các công cụ thu thập dữ liệu. Mặc dù điều này không vi phạm pháp luật, nhưng nó có thể dẫn đến các tranh chấp về quyền sở hữu trí tuệ. Nhiều tổ chức cho rằng, việc thu thập dữ liệu mà không được phép là hành vi vi phạm bản quyền, gây ra nhiều tranh cãi trong lĩnh vực này.

"Giống như họ đang cố gắng hết sức để bắt kịp", Crowther nói về hoạt động thu thập dữ liệu tích cực do Bytespider thực hiện. Chỉ riêng năm ngoái, ByteDance được cho là đã tụt hậu rất xa trong cuộc đua AI tạo sinh đến mức họ đã sử dụng OpenAI để giúp xây dựng LLM của riêng ByteDance, điều này trái với các điều khoản dịch vụ của OpenAI.

Gần đây nhất, ByteDance chính thức bước vào cuộc đua video AI với hai mô hình trí tuệ nhân tạo là PixelDance và Seaweed được ra mắt dưới tên thương hiệu Doubao trong Volcano Engine AI Innovation Tour tại Thâm Quyến ngày 24/9. Cả hai mô hình đều nhắm vào thị trường doanh nghiệp và hiện tại vẫn đang trong giai đoạn thử nghiệm với số lượng người được mời tham gia hạn chế.

Việc ra mắt diễn ra mà không có bất kỳ thông báo trước nào. Mặc dù triển khai lặng lẽ, nhưng sự mong đợi trong ngành vẫn tăng nhờ vào những tiến bộ trước đó từ các đối thủ cạnh tranh như Open AI và Kuaishou.

Việc ByteDance ra mắt hai mô hình trên cũng cho thấy tham vọng lớn của công ty trong việc phát triển các công nghệ AI tiên tiến, bất chấp những thách thức pháp lý và sự cạnh tranh khốc liệt trong ngành.

Tin bài khác
Nghệ An phát triển, ứng dụng trí tuệ nhân tạo

Nghệ An phát triển, ứng dụng trí tuệ nhân tạo

UBND tỉnh Nghệ An vừa chỉ đạo triển khai xây dựng và thực hiện chương trình, kế hoạch phát triển, ứng dụng trí tuệ nhân tạo
Hà Tĩnh tìm lời giải cho bài toán đô thị thông minh từ mô hình Tokyo

Hà Tĩnh tìm lời giải cho bài toán đô thị thông minh từ mô hình Tokyo

Trong quá trình thúc đẩy chuyển đổi số và xây dựng chính quyền số, Hà Tĩnh đang đẩy mạnh học hỏi kinh nghiệm quốc tế nhằm hoàn thiện mô hình điều hành đô thị thông minh theo hướng đồng bộ, hiện đại và dựa trên dữ liệu thời gian thực.
Chuẩn hóa dữ liệu IoT giao thông, tăng tốc cho hạ tầng giao thông thông minh thông minh

Chuẩn hóa dữ liệu IoT giao thông, tăng tốc cho hạ tầng giao thông thông minh thông minh

Bộ Xây dựng vừa ban hành Kế hoạch triển khai Đề án “Ứng dụng Internet vạn vật (IoT) trong lĩnh vực giao thông thông minh”, đặt mục tiêu chuẩn hóa và liên thông toàn bộ dữ liệu IoT giao thông giữa Bộ Xây dựng, Bộ Công an và các địa phương vào giai đoạn 2029-2035.
Doanh nghiệp tại Quảng Trị chủ động số hóa hoạt động sản xuất và quản trị

Doanh nghiệp tại Quảng Trị chủ động số hóa hoạt động sản xuất và quản trị

Theo ông Võ Thái Hiệp (Chủ tịch Hội Doanh nghiệp tỉnh Quảng Trị), thời gian qua, Hội Doanh nghiệp tỉnh Quảng Trị đã triển khai nhiều hoạt động hỗ trợ doanh nghiệp “số hóa” hoạt động quản trị và sản xuất. Sau sáp nhập, hội tập trung mở rộng các chương trình đào tạo, tập huấn kỹ năng số cho đội ngũ lãnh đạo, quản lý và người lao động.
Hải Phòng dẫn đầu toàn quốc về cải cách hành chính năm 2025

Hải Phòng dẫn đầu toàn quốc về cải cách hành chính năm 2025

Không chỉ bứt phá trong phát triển kinh tế - xã hội, Hải Phòng tiếp tục ghi dấu ấn mạnh mẽ trên hành trình xây dựng nền hành chính hiện đại, minh bạch và phục vụ Nhân dân bằng kết quả đầy tự hào: dẫn đầu toàn quốc đồng thời ở cả Chỉ số cải cách hành chính (PAR INDEX) và Chỉ số hài lòng của người dân, doanh nghiệp (SIPAS) năm 2025.
Ninh Bình đẩy mạnh triển khai ứng dụng Bản đồ số hành chính

Ninh Bình đẩy mạnh triển khai ứng dụng Bản đồ số hành chính

UBND tỉnh Ninh Bình vừa có văn bản số 2430/VPUBND-VP11 chỉ đạo các sở, ban, ngành, địa phương tiếp tục đẩy mạnh triển khai, khai thác hiệu quả Ứng dụng Bản đồ số hành chính tỉnh Ninh Bình nhằm phục vụ tốt công tác quản lý, điều hành và nhu cầu tra cứu thông tin của người dân, tổ chức.
Lào Cai ứng dụng AI và chuyển đổi số, đổi mới công tác tuyên truyền cơ sở

Lào Cai ứng dụng AI và chuyển đổi số, đổi mới công tác tuyên truyền cơ sở

Hội nghị tại xã Cốc San tập trung phát động Cuộc thi Chính luận năm 2026 và tập huấn ứng dụng AI, góp phần nâng cao hiệu quả tuyên truyền, bảo vệ nền tảng tư tưởng của Đảng.
Lào Cai đưa chuyển đổi số vào nông nghiệp, mở rộng cơ hội cho nông dân vùng cao

Lào Cai đưa chuyển đổi số vào nông nghiệp, mở rộng cơ hội cho nông dân vùng cao

Từ mã QR, livestream bán hàng đến ứng dụng AI nhận diện sâu bệnh, mô hình khuyến nông số đang giúp nông dân vùng cao Lào Cai từng bước làm chủ chuyển đổi số nông nghiệp.
Chỉ với một “chạm”, người dân TP.HCM có thể gửi phản ánh khẩn cấp đến Công an

Chỉ với một “chạm”, người dân TP.HCM có thể gửi phản ánh khẩn cấp đến Công an

Trong bối cảnh tình hình an ninh trật tự, tai nạn giao thông, cháy nổ và các sự cố khẩn cấp ngày càng diễn biến phức tạp, việc tiếp nhận thông tin nhanh chóng từ người dân đóng vai trò đặc biệt quan trọng trong công tác xử lý, cứu nạn và đảm bảo an toàn xã hội.
Hà Nội tăng tốc ứng dụng công nghệ để “đánh thức” kinh tế đêm

Hà Nội tăng tốc ứng dụng công nghệ để “đánh thức” kinh tế đêm

Từ camera AI, bản đồ số đến thanh toán không tiền mặt, Hà Nội đang tăng tốc ứng dụng công nghệ và chuyển đổi số nhằm xây dựng hệ sinh thái kinh tế đêm hiện đại, an toàn, hướng tới trở thành động lực tăng trưởng mới của ngành dịch vụ và du lịch Thủ đô.
Từ cửa khẩu số đến kinh tế số, Lào Cai mở rộng không gian tăng trưởng bằng công nghệ

Từ cửa khẩu số đến kinh tế số, Lào Cai mở rộng không gian tăng trưởng bằng công nghệ

Không chỉ đầu tư hạ tầng viễn thông, Lào Cai đang lấy công nghệ số và dữ liệu số làm động lực tăng trưởng mới, mở rộng dư địa phát triển kinh tế địa phương.
Làn sóng sa thải do AI bước vào giai đoạn mới: Doanh nghiệp cắt giảm con người để nuôi cỗ máy

Làn sóng sa thải do AI bước vào giai đoạn mới: Doanh nghiệp cắt giảm con người để nuôi cỗ máy

Nếu giai đoạn 2023–2025 mới chỉ là thời kỳ doanh nghiệp dùng AI như một công cụ tối ưu chi phí và hợp thức hóa các đợt cắt giảm hậu tăng trưởng nóng, thì năm 2026 đánh dấu bước chuyển sang một cấp độ quyết liệt hơn: AI bắt đầu trở thành trung tâm tái phân bổ vốn, cạnh tranh trực tiếp với ngân sách dành cho con người.
Công nghệ bản sao số trong phát triển đô thị thông minh

Công nghệ bản sao số trong phát triển đô thị thông minh

Hội thảo chuyên đề “Công nghệ bản sao số trong phát triển đô thị thông minh” được tổ chức trong khuôn khổ sự kiện Diễn đàn và Triển lãm Quốc tế Đô thị Thông minh Châu Á tại Việt Nam - Smart City Asia 2026. Sự kiện quy tụ các nhà quản lý, chuyên gia công nghệ, đại diện doanh nghiệp trong và ngoài nước nhằm thảo luận về vai trò của công nghệ bản sao số trong xây dựng chính quyền số và phát triển đô thị bền vững.
Sau gần 1 năm cải cách số, TP. Hồ Chí Minh ghi nhận hơn 4 triệu hồ sơ giải quyết trước hạn

Sau gần 1 năm cải cách số, TP. Hồ Chí Minh ghi nhận hơn 4 triệu hồ sơ giải quyết trước hạn

TP. Hồ Chí Minh ghi nhận hơn 4,04 triệu hồ sơ thủ tục hành chính được giải quyết trước hạn. Tỷ lệ hồ sơ trực tuyến đạt gần 76%, mức độ hài lòng của người dân và doanh nghiệp duy trì ở mức gần tuyệt đối, cho thấy hiệu quả rõ nét của quá trình chuyển đổi số trong phục vụ hành chính công.
Việt Nam mở rộng áp dụng e-visa tại 83 cửa khẩu quốc tế

Việt Nam mở rộng áp dụng e-visa tại 83 cửa khẩu quốc tế

Chính phủ vừa bổ sung thêm 41 cửa khẩu quốc tế được phép nhập cảnh, xuất cảnh bằng thị thực điện tử (e-visa), nâng tổng số cửa khẩu áp dụng loại hình này trên cả nước lên 83. Động thái được kỳ vọng tạo thuận lợi cho du khách, nhà đầu tư và thúc đẩy giao thương quốc tế.