Thứ bảy 08/11/2025 12:54
Hotline: 024.355.63.010
Kinh tế số

ByteDance tăng tốc trong cuộc đua AI với công cụ thu thập dữ liệu mới

Nghiên cứu cho thấy, tốc độ thu thập của Bytespider - công cụ thu thập dữ liệu web mà ByteDance mới ra mắt nhanh gấp 25 lần so với GPTbot của OpenAI.
Công cụ thu thập dữ liệu web mới của ByteDance vượt qua các đối thủ lớn
Công cụ thu thập dữ liệu web mới của ByteDance vượt qua các đối thủ lớn như Google, Meta, Amazon và OpenAI.

Công ty mẹ của TikTok là ByteDance, đã ra mắt công cụ thu thập dữ liệu web mang tên Bytespider vào tháng 4 năm nay. Theo Kasada, một công ty chuyên về quản lý bot (phần mềm tự động), Bytespider nhanh chóng nổi lên như một trong những công cụ thu thập dữ liệu mạnh nhất trên internet, vượt qua các đối thủ lớn như Google, Meta, Amazon và OpenAI. Nghiên cứu cho thấy, tốc độ thu thập dữ liệu của Bytespider nhanh gấp 25 lần so với GPTbot của OpenAI, công cụ thu thập dữ liệu phục vụ cho nền tảng ChatGPT.

Việc thu thập dữ liệu với tốc độ cao giúp ByteDance có thêm nhiều dữ liệu để đào tạo các mô hình ngôn ngữ lớn (LLM) và mô hình đa phương tiện (LMM), những thành phần cốt lõi trong việc phát triển các công cụ AI thế hệ mới. Trong bối cảnh các công ty công nghệ lớn đang chạy đua trong lĩnh vực AI, ByteDance cố gắng rút ngắn khoảng cách bằng cách thu thập một lượng dữ liệu khổng lồ từ các trang web toàn cầu.

Sam Crowther, CEO của Kasada, cho biết, kể từ khi Bytespider xuất hiện, nó đã thu thập dữ liệu với tốc độ nhanh hơn khoảng 25 lần so với GPTbot - công cụ thu thập dữ liệu cho nền tảng ChatGPT của OpenAI và các mô hình cơ bản. Bytespider cũng đã thu thập dữ liệu với tốc độ nhanh hơn 3.000 lần so với ClaudeBot của startup AI Anthropic.

Theo Kasada, khi những tháng trôi qua, Bytespider thậm chí còn gấp rút hơn trong việc thu thập dữ liệu. Hoạt động thu thập dữ liệu từ Bytespider tăng đột biến trong 6 tuần qua.

Việc ByteDance thu thập dữ liệu một cách thần tốc diễn ra bất chấp khả năng TikTok bị cấm tại Mỹ trong những tháng tới. Trước đó, Tổng thống Joe Biden đã ký một đạo luật yêu cầu công ty Trung Quốc này phải bán hoặc đóng cửa TikTok do lo ngại về an ninh quốc gia.

Một nguồn tin nội bộ cho biết, ByteDance đang phát triển một mô hình ngôn ngữ lớn mới nhằm cải thiện khả năng tìm kiếm trên TikTok.

Ngoài ra, Bytespider được cho là không tuân thủ tập tin quy định về robots.txt, một tập tin mà các nhà xuất bản web sử dụng để ngăn các công cụ thu thập dữ liệu. Mặc dù điều này không vi phạm pháp luật, nhưng nó có thể dẫn đến các tranh chấp về quyền sở hữu trí tuệ. Nhiều tổ chức cho rằng, việc thu thập dữ liệu mà không được phép là hành vi vi phạm bản quyền, gây ra nhiều tranh cãi trong lĩnh vực này.

"Giống như họ đang cố gắng hết sức để bắt kịp", Crowther nói về hoạt động thu thập dữ liệu tích cực do Bytespider thực hiện. Chỉ riêng năm ngoái, ByteDance được cho là đã tụt hậu rất xa trong cuộc đua AI tạo sinh đến mức họ đã sử dụng OpenAI để giúp xây dựng LLM của riêng ByteDance, điều này trái với các điều khoản dịch vụ của OpenAI.

Gần đây nhất, ByteDance chính thức bước vào cuộc đua video AI với hai mô hình trí tuệ nhân tạo là PixelDance và Seaweed được ra mắt dưới tên thương hiệu Doubao trong Volcano Engine AI Innovation Tour tại Thâm Quyến ngày 24/9. Cả hai mô hình đều nhắm vào thị trường doanh nghiệp và hiện tại vẫn đang trong giai đoạn thử nghiệm với số lượng người được mời tham gia hạn chế.

Việc ra mắt diễn ra mà không có bất kỳ thông báo trước nào. Mặc dù triển khai lặng lẽ, nhưng sự mong đợi trong ngành vẫn tăng nhờ vào những tiến bộ trước đó từ các đối thủ cạnh tranh như Open AI và Kuaishou.

Việc ByteDance ra mắt hai mô hình trên cũng cho thấy tham vọng lớn của công ty trong việc phát triển các công nghệ AI tiên tiến, bất chấp những thách thức pháp lý và sự cạnh tranh khốc liệt trong ngành.

Tin bài khác
Vì sao tỷ lệ tiếp cận chuyển đổi số tại hợp tác xã nông nghiệp còn thấp?

Vì sao tỷ lệ tiếp cận chuyển đổi số tại hợp tác xã nông nghiệp còn thấp?

Chuyển đổi số đã và đang trở thành yêu cầu bắt buộc với mọi thành phần kinh tế bao gồm cả khu vực hợp tác xã (HTX). Tuy nhiên, thực tế cho thấy: phần lớn HTX nông nghiệp hiện nay vẫn đang gặp nhiều trở ngại trong việc tiếp cận và triển khai chuyển đổi số một cách hiệu quả.
Thành phố Hồ Chí Minh tăng tốc chuyển đổi số trong giao thông công cộng

Thành phố Hồ Chí Minh tăng tốc chuyển đổi số trong giao thông công cộng

Thành phố Hồ Chí Minh đang từng bước hiện đại hóa hệ thống giao thông công cộng bằng cách thúc đẩy thanh toán không tiền mặt – một chuyển biến nhỏ trong thói quen, nhưng mang lại thay đổi lớn trong trải nghiệm di chuyển của người dân đô thị.
ThS. Lê Việt Cường: AI giúp trường nghề chuyển mình trong kỷ nguyên số

ThS. Lê Việt Cường: AI giúp trường nghề chuyển mình trong kỷ nguyên số

ThS. Lê Việt Cường chia sẻ, AI là “chìa khóa vàng” giúp nâng cao năng lực số và kết nối hợp tác ba bên chiến lược cho giáo dục nghề nghiệp tại Việt Nam.
Tài sản mã hóa: Cơ hội mới cho kinh tế số Việt Nam bứt phá

Tài sản mã hóa: Cơ hội mới cho kinh tế số Việt Nam bứt phá

Thị trường tài sản mã hóa đang mở ra cơ hội mới cho Việt Nam trong hành trình chuyển đổi sang nền kinh tế số. Với sự đồng hành của các cơ quan quản lý và cộng đồng công nghệ, Việt Nam hướng tới xây dựng một thị trường minh bạch, an toàn và hiệu quả, thúc đẩy đổi mới sáng tạo và huy động nguồn lực xã hội.
Hé lộ iPad Pro 2027: Chip M6, làm mát buồng hơi và hiệu năng tiệm cận MacBook

Hé lộ iPad Pro 2027: Chip M6, làm mát buồng hơi và hiệu năng tiệm cận MacBook

iPad Pro 2027 của Apple sẽ được trang bị chip M6 và hệ thống làm mát bằng hơi nước tiên tiến.
Samsung xây dựng cơ sở sản xuất với 50.000 GPU Nvidia để tự động hóa quy trình làm chip

Samsung xây dựng cơ sở sản xuất với 50.000 GPU Nvidia để tự động hóa quy trình làm chip

Samsung, tập đoàn công nghệ hàng đầu Hàn Quốc, cho biết họ sẽ mua và triển khai 50.000 bộ xử lý đồ họa Nvidia. Số GPU này sẽ phục vụ việc tự động hóa sản xuất chip dành cho thiết bị di động và robot.
Tỉnh Hưng Yên tổ chức Diễn đàn về kinh tế dữ liệu, tạo sân chơi công nghệ

Tỉnh Hưng Yên tổ chức Diễn đàn về kinh tế dữ liệu, tạo sân chơi công nghệ

Ngày 29/10, UBND tỉnh Hưng Yên phối hợp với Hiệp hội Dữ liệu Quốc gia tổ chức Diễn đàn Khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số tỉnh Hưng Yên với chủ đề “Kinh tế dữ liệu, thúc đẩy đổi mới sáng tạo và phát triển bền vững”.
Chuyển đổi xanh trong sản xuất công nghiệp: Lan tỏa tinh thần đổi mới

Chuyển đổi xanh trong sản xuất công nghiệp: Lan tỏa tinh thần đổi mới

Trong khuôn khổ Hội chợ Mùa Thu 2025, sáng ngày 28/10, tại Trung tâm Triển lãm Việt Nam (VEC), Cục Đổi mới sáng tạo, Chuyển đổi xanh và Khuyến công (Bộ Công Thương) đã tổ chức Hội thảo chuyên đề “Phát triển bền vững và Chuyển đổi xanh trong sản xuất công nghiệp”.
TP. Hồ Chí Minh xây dựng mô hình “bán lẻ thông minh”, “chuỗi cung ứng số” thúc đẩy kinh tế số

TP. Hồ Chí Minh xây dựng mô hình “bán lẻ thông minh”, “chuỗi cung ứng số” thúc đẩy kinh tế số

TP. Hồ Chí Minh đang đẩy mạnh triển khai các mô hình “bán lẻ thông minh”, “chuỗi cung ứng số” và “kết nối dữ liệu ngành”, hướng tới mục tiêu đưa kinh tế số chiếm 40% GRDP vào năm 2030.
Ứng dụng công nghệ số: Chìa khóa giúp doanh nghiệp Việt mở rộng thị trường quốc tế

Ứng dụng công nghệ số: Chìa khóa giúp doanh nghiệp Việt mở rộng thị trường quốc tế

Trước làn sóng toàn cầu hóa, chuyển đổi số đang trở thành chìa khóa giúp doanh nghiệp Việt nâng cao năng lực cạnh tranh, mở rộng thị trường và khẳng định vị thế quốc tế.
Tuần lễ Số quốc tế Việt Nam 2025: Quản trị trí tuệ nhân tạo, thúc đẩy hợp tác toàn cầu

Tuần lễ Số quốc tế Việt Nam 2025: Quản trị trí tuệ nhân tạo, thúc đẩy hợp tác toàn cầu

Tuần lễ Số quốc tế Việt Nam 2025 có chủ đề "Quản trị trí tuệ nhân tạo - AI Governance" nhằm thúc đẩy hợp tác, kết nối toàn cầu về công nghệ số và trí tuệ nhân tạo.
Vĩnh Long: Tiên phong thúc đẩy khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số

Vĩnh Long: Tiên phong thúc đẩy khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số

Chiều ngày 24/10/2025, tại Trường đại học Cửu Long, Sở Khoa học và Công nghệ tỉnh Vĩnh Long phối hợp Tỉnh đoàn Vĩnh Long tổ chức Lễ ký kết Kế hoạch tuyên truyền thúc đẩy phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số năm 2025, đồng thời Hội nghị sơ kết chương trình thúc đẩy, hỗ trợ người dân, doanh nghiệp, hộ kinh doanh hiện diện trực tuyến tin cậy, an toàn với các dịch vụ số sử dụng tên miền quốc gia “.vn”.
EVNSPC hoàn thành nhiều chỉ tiêu quan trọng, khẳng định vai trò trụ cột năng lượng phía Nam

EVNSPC hoàn thành nhiều chỉ tiêu quan trọng, khẳng định vai trò trụ cột năng lượng phía Nam

Trong 9 tháng của năm 2025, EVNSPC đạt kết quả tích cực trên cả ba lĩnh vực sản xuất, kinh doanh và tài chính, hoàn thành vượt nhiều chỉ tiêu EVN giao. Tổng công ty đồng thời đẩy mạnh tinh gọn bộ máy, đầu tư xây dựng và chuyển đổi số, góp phần đảm bảo cung ứng điện ổn định, thúc đẩy tăng trưởng xanh và phát triển bền vững khu vực phía Nam.
Luật Thương mại điện tử sẽ tái định hình trật tự của “sân chơi số”

Luật Thương mại điện tử sẽ tái định hình trật tự của “sân chơi số”

Dự thảo Luật Thương mại điện tử (TMĐT) được xem là một bước ngoặt thể chế quan trọng không chỉ để quản lý, mà để tái định hình trật tự của không gian kinh doanh số. Một khung pháp lý đủ linh hoạt, đủ mạnh và đủ công bằng sẽ quyết định liệu Việt Nam có thể xây dựng một thị trường TMĐT minh bạch, hàng thật, giá trị thật, hay tiếp tục phụ thuộc vào nền tảng ngoại chi phối.
Hội nghị Thúc đẩy chuyển đổi số - xanh doanh nghiệp Việt Nam 2025

Hội nghị Thúc đẩy chuyển đổi số - xanh doanh nghiệp Việt Nam 2025

Sáng ngày 20/10, Cục Phát triển Doanh nghiệp tư nhân và Kinh tế tập thể (APED), Bộ Tài chính phối hợp với Tổ chức Hợp tác Quốc tế Đức (GIZ) tổ chức “Hội nghị đối tác Thúc đẩy chuyển đổi số - xanh doanh nghiệp Việt Nam 2025” (VETTP 2025).