Thứ ba 01/07/2025 03:54
Hotline: 024.355.63.010
Kinh tế số

ByteDance tăng tốc trong cuộc đua AI với công cụ thu thập dữ liệu mới

Nghiên cứu cho thấy, tốc độ thu thập của Bytespider - công cụ thu thập dữ liệu web mà ByteDance mới ra mắt nhanh gấp 25 lần so với GPTbot của OpenAI.
Công cụ thu thập dữ liệu web mới của ByteDance vượt qua các đối thủ lớn
Công cụ thu thập dữ liệu web mới của ByteDance vượt qua các đối thủ lớn như Google, Meta, Amazon và OpenAI.

Công ty mẹ của TikTok là ByteDance, đã ra mắt công cụ thu thập dữ liệu web mang tên Bytespider vào tháng 4 năm nay. Theo Kasada, một công ty chuyên về quản lý bot (phần mềm tự động), Bytespider nhanh chóng nổi lên như một trong những công cụ thu thập dữ liệu mạnh nhất trên internet, vượt qua các đối thủ lớn như Google, Meta, Amazon và OpenAI. Nghiên cứu cho thấy, tốc độ thu thập dữ liệu của Bytespider nhanh gấp 25 lần so với GPTbot của OpenAI, công cụ thu thập dữ liệu phục vụ cho nền tảng ChatGPT.

Việc thu thập dữ liệu với tốc độ cao giúp ByteDance có thêm nhiều dữ liệu để đào tạo các mô hình ngôn ngữ lớn (LLM) và mô hình đa phương tiện (LMM), những thành phần cốt lõi trong việc phát triển các công cụ AI thế hệ mới. Trong bối cảnh các công ty công nghệ lớn đang chạy đua trong lĩnh vực AI, ByteDance cố gắng rút ngắn khoảng cách bằng cách thu thập một lượng dữ liệu khổng lồ từ các trang web toàn cầu.

Sam Crowther, CEO của Kasada, cho biết, kể từ khi Bytespider xuất hiện, nó đã thu thập dữ liệu với tốc độ nhanh hơn khoảng 25 lần so với GPTbot - công cụ thu thập dữ liệu cho nền tảng ChatGPT của OpenAI và các mô hình cơ bản. Bytespider cũng đã thu thập dữ liệu với tốc độ nhanh hơn 3.000 lần so với ClaudeBot của startup AI Anthropic.

Theo Kasada, khi những tháng trôi qua, Bytespider thậm chí còn gấp rút hơn trong việc thu thập dữ liệu. Hoạt động thu thập dữ liệu từ Bytespider tăng đột biến trong 6 tuần qua.

Việc ByteDance thu thập dữ liệu một cách thần tốc diễn ra bất chấp khả năng TikTok bị cấm tại Mỹ trong những tháng tới. Trước đó, Tổng thống Joe Biden đã ký một đạo luật yêu cầu công ty Trung Quốc này phải bán hoặc đóng cửa TikTok do lo ngại về an ninh quốc gia.

Một nguồn tin nội bộ cho biết, ByteDance đang phát triển một mô hình ngôn ngữ lớn mới nhằm cải thiện khả năng tìm kiếm trên TikTok.

Ngoài ra, Bytespider được cho là không tuân thủ tập tin quy định về robots.txt, một tập tin mà các nhà xuất bản web sử dụng để ngăn các công cụ thu thập dữ liệu. Mặc dù điều này không vi phạm pháp luật, nhưng nó có thể dẫn đến các tranh chấp về quyền sở hữu trí tuệ. Nhiều tổ chức cho rằng, việc thu thập dữ liệu mà không được phép là hành vi vi phạm bản quyền, gây ra nhiều tranh cãi trong lĩnh vực này.

"Giống như họ đang cố gắng hết sức để bắt kịp", Crowther nói về hoạt động thu thập dữ liệu tích cực do Bytespider thực hiện. Chỉ riêng năm ngoái, ByteDance được cho là đã tụt hậu rất xa trong cuộc đua AI tạo sinh đến mức họ đã sử dụng OpenAI để giúp xây dựng LLM của riêng ByteDance, điều này trái với các điều khoản dịch vụ của OpenAI.

Gần đây nhất, ByteDance chính thức bước vào cuộc đua video AI với hai mô hình trí tuệ nhân tạo là PixelDance và Seaweed được ra mắt dưới tên thương hiệu Doubao trong Volcano Engine AI Innovation Tour tại Thâm Quyến ngày 24/9. Cả hai mô hình đều nhắm vào thị trường doanh nghiệp và hiện tại vẫn đang trong giai đoạn thử nghiệm với số lượng người được mời tham gia hạn chế.

Việc ra mắt diễn ra mà không có bất kỳ thông báo trước nào. Mặc dù triển khai lặng lẽ, nhưng sự mong đợi trong ngành vẫn tăng nhờ vào những tiến bộ trước đó từ các đối thủ cạnh tranh như Open AI và Kuaishou.

Việc ByteDance ra mắt hai mô hình trên cũng cho thấy tham vọng lớn của công ty trong việc phát triển các công nghệ AI tiên tiến, bất chấp những thách thức pháp lý và sự cạnh tranh khốc liệt trong ngành.

Tin bài khác
Giải pháp phát triển bền vững toàn diện cho doanh nghiệp trong kỷ nguyên mới

Giải pháp phát triển bền vững toàn diện cho doanh nghiệp trong kỷ nguyên mới

Nhằm trang bị cho doanh nghiệp những công cụ thực tiễn, chiến lược chuyển đổi hiệu quả, ngày 28-29/6, Viện Công nghệ châu Á tại Việt Nam (AIT Việt Nam) phối hợp với VietinBank tổ chức chuỗi Hội thảo chuyên đề “ESG - Chuyển đổi số - Đổi mới sáng tạo - Tài chính xanh”.
Chính phủ cấp 1.000 tỷ cho Quỹ phát triển dữ liệu quốc gia

Chính phủ cấp 1.000 tỷ cho Quỹ phát triển dữ liệu quốc gia

Nghị định 160/2025/NĐ‑CP (29/6/2025) thành lập Quỹ Phát triển Dữ liệu Quốc gia, quỹ tài chính ngoài ngân sách, do Bộ Công an quản lý, với vốn khởi điểm 1.000 tỷ đồng. Quỹ hỗ trợ ứng dụng AI, Big Data, IoT… bảo đảm an toàn dữ liệu và thúc đẩy chuyển đổi số cả nước.
Chính phủ thành lập Quỹ Phát triển Dữ liệu Quốc gia: Động lực mới cho chuyển đổi số

Chính phủ thành lập Quỹ Phát triển Dữ liệu Quốc gia: Động lực mới cho chuyển đổi số

Chính phủ vừa ban hành Nghị định số 160/2025/NĐ-CP về việc thành lập Quỹ Phát triển Dữ liệu Quốc gia – bước đi chiến lược nhằm thúc đẩy phát triển, khai thác và ứng dụng dữ liệu trong quản lý nhà nước, phát triển kinh tế - xã hội và bảo đảm quốc phòng, an ninh quốc gia.
AI đang đảm nhận thay con người đến 50% công việc

AI đang đảm nhận thay con người đến 50% công việc

Ông Marc Benioff - CEO Salesforce gọi đây là "cuộc cách mạng lao động kỹ thuật số", nơi AI không còn là công cụ, mà trở thành một phần chính thức trong lực lượng lao động.
Những điểm đột phá mới trong Luật Khoa học, Công nghệ và Đổi mới sáng tạo

Những điểm đột phá mới trong Luật Khoa học, Công nghệ và Đổi mới sáng tạo

Luật Khoa học và Đổi mới sáng tạo 2025 chính thức được thông qua, trong đó tập trung vào phát triển hạ tầng, khuyến khích mạo hiểm, khoán chi linh hoạt và miễn trừ trách nhiệm khi chấp nhận rủi ro.
Galaxy S25 Edge giảm giá lên đến 5 triệu đồng chỉ sau 1 tháng

Galaxy S25 Edge giảm giá lên đến 5 triệu đồng chỉ sau 1 tháng

Galaxy S25 Edge gây chú ý với thiết kế siêu mỏng 5,8 mm nhưng giảm giá mạnh sau 1 tháng, làm dấy lên nhiều lo ngại về chiến lược của Samsung.
Thách thức lớn nhất của AI không phải công nghệ, mà là con người

Thách thức lớn nhất của AI không phải công nghệ, mà là con người

CEO Microsoft nhận định, việc triển khai AI không khó bằng thay đổi cách con người làm việc, yếu tố then chốt quyết định hiệu quả ứng dụng công nghệ mới.
Zhipu AI: “Kỳ lân AI” Trung Quốc khiến OpenAI phải chú ý

Zhipu AI: “Kỳ lân AI” Trung Quốc khiến OpenAI phải chú ý

OpenAI cảnh báo về sự trỗi dậy của Zhipu AI, “kỳ lân trí tuệ nhân tạo” Trung Quốc đang mở rộng ra Đông Nam Á và có quan hệ chặt chẽ với chính phủ Bắc Kinh.
Niềm tin đổ vỡ, truyền thông bế tắc: Start-up Việt phải tự mình bán sản phẩm

Niềm tin đổ vỡ, truyền thông bế tắc: Start-up Việt phải tự mình bán sản phẩm

Startup Việt đang “gãy” vì không kịp thích nghi thì việc tối ưu chi phí, củng cố nhân hiệu trở thành chiến lược sinh tồn bắt buộc
TikTok, Shopee, Lazada sẽ phải lưu dữ liệu livestream tối thiểu 3 năm

TikTok, Shopee, Lazada sẽ phải lưu dữ liệu livestream tối thiểu 3 năm

Luật Thương mại điện tử sửa đổi siết chặt hoạt động bán hàng online, yêu cầu minh bạch thông tin, kiểm soát livestream và xử lý vi phạm của KOL, nền tảng.
Động lực gì thúc đẩy mua sắm trực tuyến ở Trung Quốc tăng vọt ?

Động lực gì thúc đẩy mua sắm trực tuyến ở Trung Quốc tăng vọt ?

Lễ hội mua sắm 618 đã giúp Trung Quốc thúc đẩy tiêu dùng nhờ AI và trợ cấp, song vẫn đối mặt thách thức giảm phát, bất động sản trì trệ và việc làm bấp bênh.
Kinh doanh thương mại điện tử: Phải hiểu luật và tuân thủ pháp luật

Kinh doanh thương mại điện tử: Phải hiểu luật và tuân thủ pháp luật

Thương mại điện tử bùng nổ mở ra cơ hội kinh doanh chưa từng có, nhưng cũng kéo theo nhiều hệ lụy nếu người bán không nắm rõ quy định pháp luật. Câu chuyện không chỉ là đăng bán hàng online, mà là hiểu luật, tuân thủ luật – yếu tố sống còn để phát triển bền vững trong môi trường số.
Tiktok vẫn duy trì sức hút với người dùng Mỹ bắt chấp lệnh cấm

Tiktok vẫn duy trì sức hút với người dùng Mỹ bắt chấp lệnh cấm

TikTok vượt qua nguy cơ bị cấm tại Mỹ, mở rộng thương mại điện tử, định hình hệ sinh thái tiêu dùng, hướng đến trở thành siêu ứng dụng toàn cầu.
Samsung đổi chiến lược: Galaxy AI có thể trở thành dịch vụ trả phí

Samsung đổi chiến lược: Galaxy AI có thể trở thành dịch vụ trả phí

Samsung có thể công bố mô hình tính phí Galaxy AI tại sự kiện Unpacked tháng 7, khi thời hạn miễn phí dịch vụ này sắp kết thúc vào cuối năm 2025.
Galaxy Z Fold7, Flip7 và G Fold sẽ lộ diện tại Unpacked 2025 vào ngày 9/7

Galaxy Z Fold7, Flip7 và G Fold sẽ lộ diện tại Unpacked 2025 vào ngày 9/7

Samsung sẽ tổ chức Galaxy Unpacked 2025 vào ngày 9/7, ra mắt Z Fold7, Z Flip7, Flip7 FE và Galaxy G Fold cùng hệ sinh thái Galaxy AI thế hệ mới.
Chi tiết giá thiết kế 1 website linh hoạt theo yêu cầu Dịch vụ backlink báo giá rẻ