Thứ bảy 09/05/2026 12:34
Hotline: 024.355.63.010
Kinh tế số

ByteDance tăng tốc trong cuộc đua AI với công cụ thu thập dữ liệu mới

Nghiên cứu cho thấy, tốc độ thu thập của Bytespider - công cụ thu thập dữ liệu web mà ByteDance mới ra mắt nhanh gấp 25 lần so với GPTbot của OpenAI.
Công cụ thu thập dữ liệu web mới của ByteDance vượt qua các đối thủ lớn
Công cụ thu thập dữ liệu web mới của ByteDance vượt qua các đối thủ lớn như Google, Meta, Amazon và OpenAI.

Công ty mẹ của TikTok là ByteDance, đã ra mắt công cụ thu thập dữ liệu web mang tên Bytespider vào tháng 4 năm nay. Theo Kasada, một công ty chuyên về quản lý bot (phần mềm tự động), Bytespider nhanh chóng nổi lên như một trong những công cụ thu thập dữ liệu mạnh nhất trên internet, vượt qua các đối thủ lớn như Google, Meta, Amazon và OpenAI. Nghiên cứu cho thấy, tốc độ thu thập dữ liệu của Bytespider nhanh gấp 25 lần so với GPTbot của OpenAI, công cụ thu thập dữ liệu phục vụ cho nền tảng ChatGPT.

Việc thu thập dữ liệu với tốc độ cao giúp ByteDance có thêm nhiều dữ liệu để đào tạo các mô hình ngôn ngữ lớn (LLM) và mô hình đa phương tiện (LMM), những thành phần cốt lõi trong việc phát triển các công cụ AI thế hệ mới. Trong bối cảnh các công ty công nghệ lớn đang chạy đua trong lĩnh vực AI, ByteDance cố gắng rút ngắn khoảng cách bằng cách thu thập một lượng dữ liệu khổng lồ từ các trang web toàn cầu.

Sam Crowther, CEO của Kasada, cho biết, kể từ khi Bytespider xuất hiện, nó đã thu thập dữ liệu với tốc độ nhanh hơn khoảng 25 lần so với GPTbot - công cụ thu thập dữ liệu cho nền tảng ChatGPT của OpenAI và các mô hình cơ bản. Bytespider cũng đã thu thập dữ liệu với tốc độ nhanh hơn 3.000 lần so với ClaudeBot của startup AI Anthropic.

Theo Kasada, khi những tháng trôi qua, Bytespider thậm chí còn gấp rút hơn trong việc thu thập dữ liệu. Hoạt động thu thập dữ liệu từ Bytespider tăng đột biến trong 6 tuần qua.

Việc ByteDance thu thập dữ liệu một cách thần tốc diễn ra bất chấp khả năng TikTok bị cấm tại Mỹ trong những tháng tới. Trước đó, Tổng thống Joe Biden đã ký một đạo luật yêu cầu công ty Trung Quốc này phải bán hoặc đóng cửa TikTok do lo ngại về an ninh quốc gia.

Một nguồn tin nội bộ cho biết, ByteDance đang phát triển một mô hình ngôn ngữ lớn mới nhằm cải thiện khả năng tìm kiếm trên TikTok.

Ngoài ra, Bytespider được cho là không tuân thủ tập tin quy định về robots.txt, một tập tin mà các nhà xuất bản web sử dụng để ngăn các công cụ thu thập dữ liệu. Mặc dù điều này không vi phạm pháp luật, nhưng nó có thể dẫn đến các tranh chấp về quyền sở hữu trí tuệ. Nhiều tổ chức cho rằng, việc thu thập dữ liệu mà không được phép là hành vi vi phạm bản quyền, gây ra nhiều tranh cãi trong lĩnh vực này.

"Giống như họ đang cố gắng hết sức để bắt kịp", Crowther nói về hoạt động thu thập dữ liệu tích cực do Bytespider thực hiện. Chỉ riêng năm ngoái, ByteDance được cho là đã tụt hậu rất xa trong cuộc đua AI tạo sinh đến mức họ đã sử dụng OpenAI để giúp xây dựng LLM của riêng ByteDance, điều này trái với các điều khoản dịch vụ của OpenAI.

Gần đây nhất, ByteDance chính thức bước vào cuộc đua video AI với hai mô hình trí tuệ nhân tạo là PixelDance và Seaweed được ra mắt dưới tên thương hiệu Doubao trong Volcano Engine AI Innovation Tour tại Thâm Quyến ngày 24/9. Cả hai mô hình đều nhắm vào thị trường doanh nghiệp và hiện tại vẫn đang trong giai đoạn thử nghiệm với số lượng người được mời tham gia hạn chế.

Việc ra mắt diễn ra mà không có bất kỳ thông báo trước nào. Mặc dù triển khai lặng lẽ, nhưng sự mong đợi trong ngành vẫn tăng nhờ vào những tiến bộ trước đó từ các đối thủ cạnh tranh như Open AI và Kuaishou.

Việc ByteDance ra mắt hai mô hình trên cũng cho thấy tham vọng lớn của công ty trong việc phát triển các công nghệ AI tiên tiến, bất chấp những thách thức pháp lý và sự cạnh tranh khốc liệt trong ngành.

Tin bài khác
Công nghệ bản sao số trong phát triển đô thị thông minh

Công nghệ bản sao số trong phát triển đô thị thông minh

Hội thảo chuyên đề “Công nghệ bản sao số trong phát triển đô thị thông minh” được tổ chức trong khuôn khổ sự kiện Diễn đàn và Triển lãm Quốc tế Đô thị Thông minh Châu Á tại Việt Nam - Smart City Asia 2026. Sự kiện quy tụ các nhà quản lý, chuyên gia công nghệ, đại diện doanh nghiệp trong và ngoài nước nhằm thảo luận về vai trò của công nghệ bản sao số trong xây dựng chính quyền số và phát triển đô thị bền vững.
Sau gần 1 năm cải cách số, TP. Hồ Chí Minh ghi nhận hơn 4 triệu hồ sơ giải quyết trước hạn

Sau gần 1 năm cải cách số, TP. Hồ Chí Minh ghi nhận hơn 4 triệu hồ sơ giải quyết trước hạn

TP. Hồ Chí Minh ghi nhận hơn 4,04 triệu hồ sơ thủ tục hành chính được giải quyết trước hạn. Tỷ lệ hồ sơ trực tuyến đạt gần 76%, mức độ hài lòng của người dân và doanh nghiệp duy trì ở mức gần tuyệt đối, cho thấy hiệu quả rõ nét của quá trình chuyển đổi số trong phục vụ hành chính công.
Việt Nam mở rộng áp dụng e-visa tại 83 cửa khẩu quốc tế

Việt Nam mở rộng áp dụng e-visa tại 83 cửa khẩu quốc tế

Chính phủ vừa bổ sung thêm 41 cửa khẩu quốc tế được phép nhập cảnh, xuất cảnh bằng thị thực điện tử (e-visa), nâng tổng số cửa khẩu áp dụng loại hình này trên cả nước lên 83. Động thái được kỳ vọng tạo thuận lợi cho du khách, nhà đầu tư và thúc đẩy giao thương quốc tế.
10 nhóm công nghệ chiến lược định hình trụ cột tăng trưởng mới từ 1/7/2026

10 nhóm công nghệ chiến lược định hình trụ cột tăng trưởng mới từ 1/7/2026

Quyết định số 21/2026/QĐ-TTg do Hồ Quốc Dũng ký ban hành đã xác lập 10 nhóm công nghệ chiến lược cùng 30 sản phẩm trọng điểm, tạo nền tảng thúc đẩy đổi mới sáng tạo, nâng cao năng lực cạnh tranh quốc gia và mở ra không gian phát triển mới cho doanh nghiệp.
Sơn La thúc đẩy chuyển đổi số, tạo lực đẩy mới cho doanh nghiệp

Sơn La thúc đẩy chuyển đổi số, tạo lực đẩy mới cho doanh nghiệp

Sau 4 tháng đầu năm 2026, Sơn La đạt nhiều kết quả tích cực trong khoa học công nghệ, chuyển đổi số và cải cách hành chính, song vẫn đối mặt không ít “điểm nghẽn” cần sớm tháo gỡ.
Chuyển đổi số thủ tục hành chính: Khi ứng dụng đi trước, trải nghiệm còn ở phía sau

Chuyển đổi số thủ tục hành chính: Khi ứng dụng đi trước, trải nghiệm còn ở phía sau

Một ngày đi xin xác nhận sơ yếu lý lịch của một người dân Hà Nội cho thấy rằng cải cách hành chính đã tiến rất xa về công nghệ, nhưng khoảng cách giữa "hệ thống số" và "trải nghiệm thực" vẫn còn là bài toán cần lời giải.
Ngành Thuế dùng AI truy quét livestream: "Mắt thần" sờ gáy doanh thu ảo trên sàn số

Ngành Thuế dùng AI truy quét livestream: "Mắt thần" sờ gáy doanh thu ảo trên sàn số

Việc ngành Thuế áp dụng trí tuệ nhân tạo (AI) để rà soát doanh thu thương mại điện tử (TMĐT) đang tạo ra áp lực cộng hưởng cùng Luật TMĐT 2025. Từ ngày 1/7/2026, khi 5 quy định mới về livestream bán hàng chính thức có hiệu lực, người bán không chỉ phải đối mặt với việc định danh điện tử bắt buộc mà còn bị giám sát bởi "mắt thần" AI, chấm dứt hoàn toàn kỷ nguyên kinh doanh ẩn danh và lách luật trên không gian mạng.
Apple trao đổi sản xuất vi xử lý với Intel và Samsung

Apple trao đổi sản xuất vi xử lý với Intel và Samsung

Tập đoàn Apple ngày 4/5 vừa qua đã có cuộc trao đổi sơ bộ và khảo sát cơ sở vật chất ở các ông lớn Samsung và Intel nhằm hợp tác sản xuất bộ vi xử lý cho các sản phẩm của hãng.
Thanh toán không tiền mặt bùng nổ, dữ liệu trở thành “tài sản lõi”

Thanh toán không tiền mặt bùng nổ, dữ liệu trở thành “tài sản lõi”

Chuyển đổi số trong ngành ngân hàng đang bước vào giai đoạn tăng tốc với hàng loạt kết quả nổi bật: thanh toán không tiền mặt bùng nổ, dữ liệu được làm sạch quy mô lớn và dịch vụ công trực tuyến được số hóa toàn trình. Những chuyển động này không chỉ thay đổi hành vi người dùng mà còn mở ra không gian tăng trưởng mới cho doanh nghiệp trong nền kinh tế số.
Hà Tĩnh “khởi động” phong trào thi đua “Đổi mới sáng tạo, phát triển khoa học, công nghệ, chuyển đổi số, chuyển đổi xanh”

Hà Tĩnh “khởi động” phong trào thi đua “Đổi mới sáng tạo, phát triển khoa học, công nghệ, chuyển đổi số, chuyển đổi xanh”

UBND tỉnh Hà Tĩnh vừa ban hành Kế hoạch triển khai phong trào thi đua “Đổi mới sáng tạo, phát triển khoa học, công nghệ, chuyển đổi số, chuyển đổi xanh”
Doanh nghiệp Lào Cai được hỗ trợ mạnh về công nghệ, đổi mới sáng tạo chuyển đổi số 2026

Doanh nghiệp Lào Cai được hỗ trợ mạnh về công nghệ, đổi mới sáng tạo chuyển đổi số 2026

Lào Cai triển khai hỗ trợ 3 doanh nghiệp trọng điểm ứng dụng khoa học công nghệ, đổi mới sáng tạo, chuyển đổi số năm 2026, nhằm nâng cao năng lực cạnh tranh và giá trị sản phẩm.
Thành phố Hồ Chí Minh tăng tốc chuẩn bị vận hành Cổng Dịch vụ công quốc gia phiên bản mới

Thành phố Hồ Chí Minh tăng tốc chuẩn bị vận hành Cổng Dịch vụ công quốc gia phiên bản mới

Chính quyền Thành phố Hồ Chí Minh yêu cầu các sở, ngành và địa phương hoàn tất điều kiện kỹ thuật, rà soát thủ tục và đẩy mạnh truyền thông nhằm sẵn sàng kết nối, vận hành đồng bộ Cổng Dịch vụ công quốc gia mới.
Kết nối chính quyền, người dân, doanh nghiệp trong số hóa di sản tại xã Đông Anh, Hà Nội

Kết nối chính quyền, người dân, doanh nghiệp trong số hóa di sản tại xã Đông Anh, Hà Nội

Tại Xuân Trạch (xã Đông Anh, Hà Nội), mô hình số hóa di sản kết nối chính quyền, người dân, hợp tác xã, doanh nghiệp, mở hướng phát triển kinh tế số cộng đồng từ nền tảng văn hóa.
Lâm Đồng phê duyệt Chiến lược Dữ liệu 2026-2030: Chuyển đổi toàn diện làm đòn bẩy phát triển kinh tế số

Lâm Đồng phê duyệt Chiến lược Dữ liệu 2026-2030: Chuyển đổi toàn diện làm đòn bẩy phát triển kinh tế số

Ủy ban Nhân dân tỉnh Lâm Đồng vừa chính thức phê duyệt Chiến lược Dữ liệu giai đoạn 2026-2030 thông qua quyết định do Phó Chủ tịch Nguyễn Ngọc Phúc ký ban hành. Đây là văn bản định hướng mang tính bước ngoặt nhằm xây dựng nền tảng dữ liệu thống nhất, phục vụ ba trụ cột cốt lõi gồm chính quyền số, kinh tế số và xã hội số.
Phó Chủ tịch UBND tỉnh Lâm Đồng chỉ đạo triển khai phần mềm quản lý đầu tư công

Phó Chủ tịch UBND tỉnh Lâm Đồng chỉ đạo triển khai phần mềm quản lý đầu tư công

Vừa qua, ông Nguyễn Ngọc Phúc – Tỉnh ủy viên, Phó Chủ tịch UBND tỉnh Lâm Đồng đã chủ trì buổi làm việc để nghe báo cáo tình hình xây dựng, triển khai phần mềm quản lý dự án đầu tư công và nhập liệu của Sở Tài chính. Tham dự buổi làm việc có lãnh đạo các sở, ngành, đơn vị liên quan.