Thứ năm 12/03/2026 17:50
Hotline: 024.355.63.010
Kinh tế số

ByteDance tăng tốc trong cuộc đua AI với công cụ thu thập dữ liệu mới

Nghiên cứu cho thấy, tốc độ thu thập của Bytespider - công cụ thu thập dữ liệu web mà ByteDance mới ra mắt nhanh gấp 25 lần so với GPTbot của OpenAI.
Công cụ thu thập dữ liệu web mới của ByteDance vượt qua các đối thủ lớn
Công cụ thu thập dữ liệu web mới của ByteDance vượt qua các đối thủ lớn như Google, Meta, Amazon và OpenAI.

Công ty mẹ của TikTok là ByteDance, đã ra mắt công cụ thu thập dữ liệu web mang tên Bytespider vào tháng 4 năm nay. Theo Kasada, một công ty chuyên về quản lý bot (phần mềm tự động), Bytespider nhanh chóng nổi lên như một trong những công cụ thu thập dữ liệu mạnh nhất trên internet, vượt qua các đối thủ lớn như Google, Meta, Amazon và OpenAI. Nghiên cứu cho thấy, tốc độ thu thập dữ liệu của Bytespider nhanh gấp 25 lần so với GPTbot của OpenAI, công cụ thu thập dữ liệu phục vụ cho nền tảng ChatGPT.

Việc thu thập dữ liệu với tốc độ cao giúp ByteDance có thêm nhiều dữ liệu để đào tạo các mô hình ngôn ngữ lớn (LLM) và mô hình đa phương tiện (LMM), những thành phần cốt lõi trong việc phát triển các công cụ AI thế hệ mới. Trong bối cảnh các công ty công nghệ lớn đang chạy đua trong lĩnh vực AI, ByteDance cố gắng rút ngắn khoảng cách bằng cách thu thập một lượng dữ liệu khổng lồ từ các trang web toàn cầu.

Sam Crowther, CEO của Kasada, cho biết, kể từ khi Bytespider xuất hiện, nó đã thu thập dữ liệu với tốc độ nhanh hơn khoảng 25 lần so với GPTbot - công cụ thu thập dữ liệu cho nền tảng ChatGPT của OpenAI và các mô hình cơ bản. Bytespider cũng đã thu thập dữ liệu với tốc độ nhanh hơn 3.000 lần so với ClaudeBot của startup AI Anthropic.

Theo Kasada, khi những tháng trôi qua, Bytespider thậm chí còn gấp rút hơn trong việc thu thập dữ liệu. Hoạt động thu thập dữ liệu từ Bytespider tăng đột biến trong 6 tuần qua.

Việc ByteDance thu thập dữ liệu một cách thần tốc diễn ra bất chấp khả năng TikTok bị cấm tại Mỹ trong những tháng tới. Trước đó, Tổng thống Joe Biden đã ký một đạo luật yêu cầu công ty Trung Quốc này phải bán hoặc đóng cửa TikTok do lo ngại về an ninh quốc gia.

Một nguồn tin nội bộ cho biết, ByteDance đang phát triển một mô hình ngôn ngữ lớn mới nhằm cải thiện khả năng tìm kiếm trên TikTok.

Ngoài ra, Bytespider được cho là không tuân thủ tập tin quy định về robots.txt, một tập tin mà các nhà xuất bản web sử dụng để ngăn các công cụ thu thập dữ liệu. Mặc dù điều này không vi phạm pháp luật, nhưng nó có thể dẫn đến các tranh chấp về quyền sở hữu trí tuệ. Nhiều tổ chức cho rằng, việc thu thập dữ liệu mà không được phép là hành vi vi phạm bản quyền, gây ra nhiều tranh cãi trong lĩnh vực này.

"Giống như họ đang cố gắng hết sức để bắt kịp", Crowther nói về hoạt động thu thập dữ liệu tích cực do Bytespider thực hiện. Chỉ riêng năm ngoái, ByteDance được cho là đã tụt hậu rất xa trong cuộc đua AI tạo sinh đến mức họ đã sử dụng OpenAI để giúp xây dựng LLM của riêng ByteDance, điều này trái với các điều khoản dịch vụ của OpenAI.

Gần đây nhất, ByteDance chính thức bước vào cuộc đua video AI với hai mô hình trí tuệ nhân tạo là PixelDance và Seaweed được ra mắt dưới tên thương hiệu Doubao trong Volcano Engine AI Innovation Tour tại Thâm Quyến ngày 24/9. Cả hai mô hình đều nhắm vào thị trường doanh nghiệp và hiện tại vẫn đang trong giai đoạn thử nghiệm với số lượng người được mời tham gia hạn chế.

Việc ra mắt diễn ra mà không có bất kỳ thông báo trước nào. Mặc dù triển khai lặng lẽ, nhưng sự mong đợi trong ngành vẫn tăng nhờ vào những tiến bộ trước đó từ các đối thủ cạnh tranh như Open AI và Kuaishou.

Việc ByteDance ra mắt hai mô hình trên cũng cho thấy tham vọng lớn của công ty trong việc phát triển các công nghệ AI tiên tiến, bất chấp những thách thức pháp lý và sự cạnh tranh khốc liệt trong ngành.

Tin bài khác
Khai trương nền tảng số phát triển thị trường nước ngoài, tăng tốc hỗ trợ doanh nghiệp xuất khẩu

Khai trương nền tảng số phát triển thị trường nước ngoài, tăng tốc hỗ trợ doanh nghiệp xuất khẩu

Sáng 12/3, Bộ Công Thương chính thức khai trương Nền tảng số về phát triển thị trường nước ngoài nhằm cung cấp dữ liệu thị trường, kết nối hệ thống thương vụ với doanh nghiệp và địa phương.
Xiaomi 17 Ultra có gì mới khi sở hữu camera 200MP và pin 6000mAh?

Xiaomi 17 Ultra có gì mới khi sở hữu camera 200MP và pin 6000mAh?

Xiaomi 17 Ultra là mẫu smartphone flagship mới được giới thiệu trong năm 2026, tiếp tục kế thừa định hướng công nghệ cao cấp của dòng Xiaomi Ultra.
Hà Nội mở “không gian sandbox” để thu hút và phát huy nhân tài

Hà Nội mở “không gian sandbox” để thu hút và phát huy nhân tài

Việc triển khai Nghị quyết số 92/2026/NQ-HĐND được kỳ vọng tạo bước đột phá trong chiến lược thu hút và trọng dụng nguồn nhân lực chất lượng cao của Hà Nội, hướng tới xây dựng mô hình “Thủ đô kiến tạo phát triển” với động lực mới từ tri thức và đổi mới sáng tạo.
Hà Nội đẩy nhanh triển khai Nghị quyết 57, đặt mục tiêu kinh tế số chiếm 22% GRDP năm 2026

Hà Nội đẩy nhanh triển khai Nghị quyết 57, đặt mục tiêu kinh tế số chiếm 22% GRDP năm 2026

Trong hơn hai tháng đầu năm 2026, Hà Nội đã triển khai hàng loạt nhiệm vụ trọng tâm nhằm hiện thực hóa Nghị quyết 57-NQ/TW của Bộ Chính trị về phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số.
Sách điện tử tăng gần 50% trong năm 2025

Sách điện tử tăng gần 50% trong năm 2025

Thị trường xuất bản số tại Việt Nam tăng trưởng mạnh khi số sách điện tử năm 2025 tăng gần 50%, phản ánh xu hướng chuyển dịch sang mô hình số hóa và mở ra dư địa phát triển lớn cho ngành xuất bản.
iMac 2026 có thể xuất hiện với loạt màu mới sau nhiều năm giữ nguyên

iMac 2026 có thể xuất hiện với loạt màu mới sau nhiều năm giữ nguyên

Apple được cho là sẽ làm mới bảng màu cho iMac 2026 sau nhiều năm giữ nguyên thiết kế, hứa hẹn mang đến diện mạo mới cho dòng máy tính all-in-one.
Internet Việt Nam sẵn sàng cho “kinh tế tầm thấp”

Internet Việt Nam sẵn sàng cho “kinh tế tầm thấp”

Sự phát triển nhanh của hạ tầng viễn thông đang đưa Internet Việt Nam trở thành một trong những nền tảng quan trọng thúc đẩy kinh tế số, đặc biệt là các mô hình kinh tế mới như kinh tế tầm thấp (Low Altitude Economy – LAE).
Đà Nẵng ứng dụng chuyển đổi số trong tuyên truyền bầu cử

Đà Nẵng ứng dụng chuyển đổi số trong tuyên truyền bầu cử

Không khí chuẩn bị cho cuộc bầu cử đại biểu Quốc hội khóa XVI và đại biểu HĐND các cấp nhiệm kỳ 2026–2031 tại Đà Nẵng đang diễn ra sôi nổi. Bên cạnh các hình thức tuyên truyền truyền thống, nhiều địa phương trên địa bàn thành phố đã chủ động ứng dụng chuyển đổi số nhằm đưa thông tin bầu cử đến cử tri nhanh chóng và thuận tiện hơn.
Livestream “Sức sống hàng Việt”: Cục trưởng Trần Hữu Linh cùng Hoa hậu Ngọc Hân quảng bá sản phẩm Việt

Livestream “Sức sống hàng Việt”: Cục trưởng Trần Hữu Linh cùng Hoa hậu Ngọc Hân quảng bá sản phẩm Việt

Sáng 8/3 tại Hà Nội, Cục trưởng Trần Hữu Linh cùng Hoa hậu Ngọc Hân và tiktoker Quỳnh Trang livestream bán hàng trong chương trình “Sức sống hàng Việt”, quảng bá sản phẩm Việt tới người tiêu dùng.
Hà Nội đặt mục tiêu 80% dân số mua sắm trực tuyến vào năm 2030

Hà Nội đặt mục tiêu 80% dân số mua sắm trực tuyến vào năm 2030

UBND thành phố Hà Nội vừa ban hành Kế hoạch số 84/KH-UBND về phát triển thương mại điện tử giai đoạn 2026–2030, với nhiều mục tiêu cụ thể nhằm thúc đẩy chuyển đổi số trong lĩnh vực thương mại, mở rộng thanh toán không dùng tiền mặt và nâng cao năng lực kinh doanh trên nền tảng số của doanh nghiệp, hộ kinh doanh.
Apple Music bắt đầu gắn nhãn nội dung AI trong âm nhạc

Apple Music bắt đầu gắn nhãn nội dung AI trong âm nhạc

Nền tảng nghe nhạc trực tuyến Apple Music vừa triển khai hệ thống “thẻ minh bạch” (transparency tags) nhằm giúp người dùng nhận biết liệu nội dung âm nhạc họ đang nghe có được tạo ra bằng trí tuệ nhân tạo (AI) hay không.
Làn sóng rời ChatGPT gây chú ý

Làn sóng rời ChatGPT gây chú ý

Một làn sóng người dùng tuyên bố ngừng sử dụng ChatGPT đang lan truyền trên mạng xã hội, làm dấy lên những cuộc tranh luận về niềm tin, minh bạch và sự cạnh tranh trong thị trường trí tuệ nhân tạo (AI) tạo sinh. Diễn biến này được cho là có thể tạo áp lực mới lên OpenAI – đơn vị phát triển nền tảng ChatGPT – trong bối cảnh nhiều dịch vụ AI khác đang nổi lên mạnh mẽ.
MacBook Neo ra mắt với giá từ hơn 16 triệu đồng, Apple lần đầu nhắm mạnh vào phân khúc laptop phổ thông

MacBook Neo ra mắt với giá từ hơn 16 triệu đồng, Apple lần đầu nhắm mạnh vào phân khúc laptop phổ thông

Apple vừa giới thiệu MacBook Neo – mẫu laptop mới có giá khởi điểm chỉ hơn 16 triệu đồng. Đây được xem là chiếc MacBook rẻ nhất từng được hãng tung ra, hướng đến sinh viên và người dùng phổ thông, đồng thời mở rộng cạnh tranh với Chromebook và laptop Windows giá thấp.
Samsung Galaxy S27: Cảm biến 200MP có thể sẽ được nâng cấp vào năm tới?

Samsung Galaxy S27: Cảm biến 200MP có thể sẽ được nâng cấp vào năm tới?

Khi Galaxy S26 còn chưa kịp “hạ nhiệt”, các tin rò rỉ đầu tiên về Galaxy S27 đã xuất hiện, tập trung vào một điểm quen mà vẫn gây tò mò: camera chính 200MP. Theo các nguồn rò rỉ trên Weibo được các trang công nghệ quốc tế tổng hợp, Samsung có thể giữ nguyên độ phân giải 200MP nhưng đổi cách “làm HDR” bằng công nghệ LOFIC để cải thiện ảnh trong môi trường tương phản mạnh.
Elon Musk quảng bá Grok là AI “không thức tỉnh”

Elon Musk quảng bá Grok là AI “không thức tỉnh”

Tỷ phú công nghệ Elon Musk gần đây tiếp tục quảng bá phiên bản mới nhất của chatbot trí tuệ nhân tạo Grok 4.20, đồng thời chỉ trích nhiều nền tảng AI lớn hiện nay là “yếu kém” và quá thận trọng trong cách trả lời.