Thứ bảy 14/06/2025 05:36
Hotline: 024.355.63.010
Kinh tế số

ByteDance tăng tốc trong cuộc đua AI với công cụ thu thập dữ liệu mới

Nghiên cứu cho thấy, tốc độ thu thập của Bytespider - công cụ thu thập dữ liệu web mà ByteDance mới ra mắt nhanh gấp 25 lần so với GPTbot của OpenAI.
Công cụ thu thập dữ liệu web mới của ByteDance vượt qua các đối thủ lớn
Công cụ thu thập dữ liệu web mới của ByteDance vượt qua các đối thủ lớn như Google, Meta, Amazon và OpenAI.

Công ty mẹ của TikTok là ByteDance, đã ra mắt công cụ thu thập dữ liệu web mang tên Bytespider vào tháng 4 năm nay. Theo Kasada, một công ty chuyên về quản lý bot (phần mềm tự động), Bytespider nhanh chóng nổi lên như một trong những công cụ thu thập dữ liệu mạnh nhất trên internet, vượt qua các đối thủ lớn như Google, Meta, Amazon và OpenAI. Nghiên cứu cho thấy, tốc độ thu thập dữ liệu của Bytespider nhanh gấp 25 lần so với GPTbot của OpenAI, công cụ thu thập dữ liệu phục vụ cho nền tảng ChatGPT.

Việc thu thập dữ liệu với tốc độ cao giúp ByteDance có thêm nhiều dữ liệu để đào tạo các mô hình ngôn ngữ lớn (LLM) và mô hình đa phương tiện (LMM), những thành phần cốt lõi trong việc phát triển các công cụ AI thế hệ mới. Trong bối cảnh các công ty công nghệ lớn đang chạy đua trong lĩnh vực AI, ByteDance cố gắng rút ngắn khoảng cách bằng cách thu thập một lượng dữ liệu khổng lồ từ các trang web toàn cầu.

Sam Crowther, CEO của Kasada, cho biết, kể từ khi Bytespider xuất hiện, nó đã thu thập dữ liệu với tốc độ nhanh hơn khoảng 25 lần so với GPTbot - công cụ thu thập dữ liệu cho nền tảng ChatGPT của OpenAI và các mô hình cơ bản. Bytespider cũng đã thu thập dữ liệu với tốc độ nhanh hơn 3.000 lần so với ClaudeBot của startup AI Anthropic.

Theo Kasada, khi những tháng trôi qua, Bytespider thậm chí còn gấp rút hơn trong việc thu thập dữ liệu. Hoạt động thu thập dữ liệu từ Bytespider tăng đột biến trong 6 tuần qua.

Việc ByteDance thu thập dữ liệu một cách thần tốc diễn ra bất chấp khả năng TikTok bị cấm tại Mỹ trong những tháng tới. Trước đó, Tổng thống Joe Biden đã ký một đạo luật yêu cầu công ty Trung Quốc này phải bán hoặc đóng cửa TikTok do lo ngại về an ninh quốc gia.

Một nguồn tin nội bộ cho biết, ByteDance đang phát triển một mô hình ngôn ngữ lớn mới nhằm cải thiện khả năng tìm kiếm trên TikTok.

Ngoài ra, Bytespider được cho là không tuân thủ tập tin quy định về robots.txt, một tập tin mà các nhà xuất bản web sử dụng để ngăn các công cụ thu thập dữ liệu. Mặc dù điều này không vi phạm pháp luật, nhưng nó có thể dẫn đến các tranh chấp về quyền sở hữu trí tuệ. Nhiều tổ chức cho rằng, việc thu thập dữ liệu mà không được phép là hành vi vi phạm bản quyền, gây ra nhiều tranh cãi trong lĩnh vực này.

"Giống như họ đang cố gắng hết sức để bắt kịp", Crowther nói về hoạt động thu thập dữ liệu tích cực do Bytespider thực hiện. Chỉ riêng năm ngoái, ByteDance được cho là đã tụt hậu rất xa trong cuộc đua AI tạo sinh đến mức họ đã sử dụng OpenAI để giúp xây dựng LLM của riêng ByteDance, điều này trái với các điều khoản dịch vụ của OpenAI.

Gần đây nhất, ByteDance chính thức bước vào cuộc đua video AI với hai mô hình trí tuệ nhân tạo là PixelDance và Seaweed được ra mắt dưới tên thương hiệu Doubao trong Volcano Engine AI Innovation Tour tại Thâm Quyến ngày 24/9. Cả hai mô hình đều nhắm vào thị trường doanh nghiệp và hiện tại vẫn đang trong giai đoạn thử nghiệm với số lượng người được mời tham gia hạn chế.

Việc ra mắt diễn ra mà không có bất kỳ thông báo trước nào. Mặc dù triển khai lặng lẽ, nhưng sự mong đợi trong ngành vẫn tăng nhờ vào những tiến bộ trước đó từ các đối thủ cạnh tranh như Open AI và Kuaishou.

Việc ByteDance ra mắt hai mô hình trên cũng cho thấy tham vọng lớn của công ty trong việc phát triển các công nghệ AI tiên tiến, bất chấp những thách thức pháp lý và sự cạnh tranh khốc liệt trong ngành.

Tin bài khác
Công ty Luật Nam Hà và Cộng sự: Gắn kết tri thức, tiên phong ứng dụng A.I trong pháp lý

Công ty Luật Nam Hà và Cộng sự: Gắn kết tri thức, tiên phong ứng dụng A.I trong pháp lý

Với tầm nhìn chiến lược và khát vọng đổi mới, Công ty Luật TNHH Nam Hà và Cộng sự - thành viên Hiệp hội Doanh nghiệp nhỏ và vừa phía Nam đã khẳng định vị thế là một trong những đơn vị hành nghề luật tiên phong tại Việt Nam trong việc kết nối học thuật với thực tiễn, ứng dụng công nghệ hiện đại, đặc biệt là trí tuệ nhân tạo (AI) vào hoạt động tư vấn pháp luật.
iPhone 13 giảm giá mạnh, vẫn là lựa chọn tốt với hiệu năng mượt và thiết kế đẹp

iPhone 13 giảm giá mạnh, vẫn là lựa chọn tốt với hiệu năng mượt và thiết kế đẹp

Dù đã ra mắt từ năm 2021, iPhone 13 vẫn là một trong những lựa chọn được nhiều người dùng quan tâm trong hệ sinh thái Apple nhờ thiết kế hiện đại, hiệu năng ổn định và mức giá đã hợp lý hơn.
WWDC 2025: Apple khiến giới công nghệ thất vọng với loạt tính năng AI

WWDC 2025: Apple khiến giới công nghệ thất vọng với loạt tính năng AI

Trong khi các đối thủ như Google và Samsung liên tục tung ra các sản phẩm AI mang tính đột phá, Apple dường như vẫn đang đi những bước thận trọng.
TP. Hồ Chí Minh triển khai mạnh mẽ Đề án 06: VNeID mở đường cho chính quyền số

TP. Hồ Chí Minh triển khai mạnh mẽ Đề án 06: VNeID mở đường cho chính quyền số

TP. Hồ Chí Minh đang chứng minh năng lực đi đầu trong chuyển đổi số bằng cách áp dụng đồng bộ các giải pháp hiện đại, lấy người dân và doanh nghiệp làm trung tâm phục vụ. Đề án 06 cùng ứng dụng VNeID đã không chỉ thúc đẩy hiện đại hóa quản lý hành chính công, mà còn đặt nền móng vững chắc cho một chính quyền số - kinh tế số - xã hội số trong tương lai gần.
Liệu Apple có đang đi theo vết xe đổ của Nokia?

Liệu Apple có đang đi theo vết xe đổ của Nokia?

Sau kỳ vọng về AI, Apple đang đối mặt với những thách thức lớn về đổi mới công nghệ và tăng trưởng chậm lại. Liệu CEO Tim Cook có thể xoay chuyển tình thế và tránh lặp lại bi kịch từng xảy ra với Nokia?
Nâng cao năng lực ứng dụng công nghệ thông tin và chuyển đổi số cho doanh nghiệp tại Hưng Yên

Nâng cao năng lực ứng dụng công nghệ thông tin và chuyển đổi số cho doanh nghiệp tại Hưng Yên

Ngày 12/6, tại tỉnh Hưng Yên, Hội nghị tập huấn nâng cao năng lực ứng dụng công nghệ thông tin và chuyển đổi số đã được tổ chức với sự phối hợp giữa Trung tâm Phát triển thương mại điện tử và Công nghệ số (eComDX), Cục Thương mại điện tử và Kinh tế số (Bộ Công Thương) và Sở Công Thương tỉnh Hưng Yên.
Những "Ông Lớn" doanh nghiệp Việt “chạy đua” đổ tiền vào AI

Những "Ông Lớn" doanh nghiệp Việt “chạy đua” đổ tiền vào AI

Viettel, FPT, VNG, VinAI đang đẩy mạnh đầu tư vào AI, từ hạ tầng tới ứng dụng thực tiễn, tạo nên một cuộc đua “đổ tiền” nhằm vươn tầm quốc tế trong kỷ nguyên số.
Cục Thương mại điện tử và Kinh tế số và BIDV ký kết hợp tác chiến lược

Cục Thương mại điện tử và Kinh tế số và BIDV ký kết hợp tác chiến lược

Ngày 11/6/2025, tại Hà Nội, Cục Thương mại điện tử và Kinh tế số (Bộ Công Thương) và Ngân hàng TMCP Đầu tư và Phát triển Việt Nam (BIDV) đã ký kết Biên bản ghi nhớ hợp tác, đánh dấu bước tiến quan trọng trong thúc đẩy phát triển thương mại điện tử tại Việt Nam.
Trí tuệ nhân tạo đã thay đổi doanh nghiệp Việt Nam thế nào?

Trí tuệ nhân tạo đã thay đổi doanh nghiệp Việt Nam thế nào?

Trí tuệ nhân tạo (AI) đã thay đổi sâu sắc doanh nghiệp Việt Nam. Cùng kinh tế số, AI tạo nên cuộc cách mạng, giúp doanh nghiệp nắm bắt cơ hội, bứt phá mạnh mẽ.
Sapo 6870 giải pháp biến điện thoại thành máy tính tiền

Sapo 6870 giải pháp biến điện thoại thành máy tính tiền

Sapo 6870 – phần mềm quản lý bán hàng miễn phí trên điện thoại dành riêng cho hộ kinh doanh, cho phép bán hàng và xuất hóa đơn điện tử, ký số ngay trên điện thoại di động.
Android 16 ra mắt: Giao diện mới, bảo mật mạnh và loạt tính năng thông minh

Android 16 ra mắt: Giao diện mới, bảo mật mạnh và loạt tính năng thông minh

Android 16 chính thức phát hành với giao diện Material 3, bảo mật tối ưu, tính năng mới Live Updates, Desktop Mode và AI chỉnh ảnh ấn tượng.
Grab bác bỏ tin đồn sáp nhập GoTo: Thương vụ 7 tỷ USD tạm “đóng băng”

Grab bác bỏ tin đồn sáp nhập GoTo: Thương vụ 7 tỷ USD tạm “đóng băng”

Grab chính thức bác bỏ thông tin sáp nhập GoTo, khép lại thương vụ công nghệ 7 tỷ USD giữa lo ngại về độc quyền và chủ quyền công nghệ của Indonesia.
Trung tâm Nghiên cứu và phát triển AI của Qualcomm chính thức hoạt động tại Việt Nam

Trung tâm Nghiên cứu và phát triển AI của Qualcomm chính thức hoạt động tại Việt Nam

Đây là trung tâm AI lớn thứ ba toàn cầu của Qualcomm, được kỳ vọng sẽ biến Việt Nam thành trung tâm nghiên cứu và đổi mới AI hàng đầu khu vực.
WWDC 2025: Vì sao Apple bốc hơi 75 tỷ USD vốn hóa vì "Siri"?

WWDC 2025: Vì sao Apple bốc hơi 75 tỷ USD vốn hóa vì "Siri"?

Chỉ vài phút sau khi sự kiện WWDC 2025 bắt đầu, giá cổ phiếu của Apple đã lao dốc hơn 2,5% khi hãng xác nhận Siri, thành phần cốt lõi của chiến lược AI, vẫn chưa sẵn sàng.
Bảng giá điện thoại Xiaomi tháng 6/2025: Phủ đều mọi phân khúc, giá cạnh tranh rõ rệt

Bảng giá điện thoại Xiaomi tháng 6/2025: Phủ đều mọi phân khúc, giá cạnh tranh rõ rệt

Tạp chí Doanh nghiệp và Hội nhập cập nhập đến độc giả bảng giá Xiaomi tháng 6/2025, từ dòng phổ thông như POCO M6 đến flagship Xiaomi 15 Ultra, phù hợp mọi nhu cầu và ngân sách người dùng.
Chi tiết giá thiết kế 1 website linh hoạt theo yêu cầu