Thứ hai 26/01/2026 00:59
Hotline: 024.355.63.010
Email: banbientap.dnhn@gmail.com
Kinh tế số

ByteDance tăng tốc trong cuộc đua AI với công cụ thu thập dữ liệu mới

Nghiên cứu cho thấy, tốc độ thu thập của Bytespider - công cụ thu thập dữ liệu web mà ByteDance mới ra mắt nhanh gấp 25 lần so với GPTbot của OpenAI.
Công cụ thu thập dữ liệu web mới của ByteDance vượt qua các đối thủ lớn
Công cụ thu thập dữ liệu web mới của ByteDance vượt qua các đối thủ lớn như Google, Meta, Amazon và OpenAI.

Công ty mẹ của TikTok là ByteDance, đã ra mắt công cụ thu thập dữ liệu web mang tên Bytespider vào tháng 4 năm nay. Theo Kasada, một công ty chuyên về quản lý bot (phần mềm tự động), Bytespider nhanh chóng nổi lên như một trong những công cụ thu thập dữ liệu mạnh nhất trên internet, vượt qua các đối thủ lớn như Google, Meta, Amazon và OpenAI. Nghiên cứu cho thấy, tốc độ thu thập dữ liệu của Bytespider nhanh gấp 25 lần so với GPTbot của OpenAI, công cụ thu thập dữ liệu phục vụ cho nền tảng ChatGPT.

Việc thu thập dữ liệu với tốc độ cao giúp ByteDance có thêm nhiều dữ liệu để đào tạo các mô hình ngôn ngữ lớn (LLM) và mô hình đa phương tiện (LMM), những thành phần cốt lõi trong việc phát triển các công cụ AI thế hệ mới. Trong bối cảnh các công ty công nghệ lớn đang chạy đua trong lĩnh vực AI, ByteDance cố gắng rút ngắn khoảng cách bằng cách thu thập một lượng dữ liệu khổng lồ từ các trang web toàn cầu.

Sam Crowther, CEO của Kasada, cho biết, kể từ khi Bytespider xuất hiện, nó đã thu thập dữ liệu với tốc độ nhanh hơn khoảng 25 lần so với GPTbot - công cụ thu thập dữ liệu cho nền tảng ChatGPT của OpenAI và các mô hình cơ bản. Bytespider cũng đã thu thập dữ liệu với tốc độ nhanh hơn 3.000 lần so với ClaudeBot của startup AI Anthropic.

Theo Kasada, khi những tháng trôi qua, Bytespider thậm chí còn gấp rút hơn trong việc thu thập dữ liệu. Hoạt động thu thập dữ liệu từ Bytespider tăng đột biến trong 6 tuần qua.

Việc ByteDance thu thập dữ liệu một cách thần tốc diễn ra bất chấp khả năng TikTok bị cấm tại Mỹ trong những tháng tới. Trước đó, Tổng thống Joe Biden đã ký một đạo luật yêu cầu công ty Trung Quốc này phải bán hoặc đóng cửa TikTok do lo ngại về an ninh quốc gia.

Một nguồn tin nội bộ cho biết, ByteDance đang phát triển một mô hình ngôn ngữ lớn mới nhằm cải thiện khả năng tìm kiếm trên TikTok.

Ngoài ra, Bytespider được cho là không tuân thủ tập tin quy định về robots.txt, một tập tin mà các nhà xuất bản web sử dụng để ngăn các công cụ thu thập dữ liệu. Mặc dù điều này không vi phạm pháp luật, nhưng nó có thể dẫn đến các tranh chấp về quyền sở hữu trí tuệ. Nhiều tổ chức cho rằng, việc thu thập dữ liệu mà không được phép là hành vi vi phạm bản quyền, gây ra nhiều tranh cãi trong lĩnh vực này.

"Giống như họ đang cố gắng hết sức để bắt kịp", Crowther nói về hoạt động thu thập dữ liệu tích cực do Bytespider thực hiện. Chỉ riêng năm ngoái, ByteDance được cho là đã tụt hậu rất xa trong cuộc đua AI tạo sinh đến mức họ đã sử dụng OpenAI để giúp xây dựng LLM của riêng ByteDance, điều này trái với các điều khoản dịch vụ của OpenAI.

Gần đây nhất, ByteDance chính thức bước vào cuộc đua video AI với hai mô hình trí tuệ nhân tạo là PixelDance và Seaweed được ra mắt dưới tên thương hiệu Doubao trong Volcano Engine AI Innovation Tour tại Thâm Quyến ngày 24/9. Cả hai mô hình đều nhắm vào thị trường doanh nghiệp và hiện tại vẫn đang trong giai đoạn thử nghiệm với số lượng người được mời tham gia hạn chế.

Việc ra mắt diễn ra mà không có bất kỳ thông báo trước nào. Mặc dù triển khai lặng lẽ, nhưng sự mong đợi trong ngành vẫn tăng nhờ vào những tiến bộ trước đó từ các đối thủ cạnh tranh như Open AI và Kuaishou.

Việc ByteDance ra mắt hai mô hình trên cũng cho thấy tham vọng lớn của công ty trong việc phát triển các công nghệ AI tiên tiến, bất chấp những thách thức pháp lý và sự cạnh tranh khốc liệt trong ngành.

Tin bài khác
Microsoft khuyến cáo hoàn tác bản vá Windows 11 tháng 1/2026 do lỗi nghiêm trọng

Microsoft khuyến cáo hoàn tác bản vá Windows 11 tháng 1/2026 do lỗi nghiêm trọng

Sau khi ghi nhận hàng loạt phản ánh về sự cố hệ thống và ứng dụng, Microsoft đã phát đi cảnh báo khẩn, đề nghị người dùng Windows 11 cân nhắc gỡ bỏ bản cập nhật bảo mật tháng 1/2026 (KB5074109) để tránh ảnh hưởng đến quá trình sử dụng, đặc biệt với ứng dụng Outlook Classic.
Samsung vô tình hé lộ tính năng đáng giá nhất trên Galaxy S26 Ultra

Samsung vô tình hé lộ tính năng đáng giá nhất trên Galaxy S26 Ultra

Samsung dường như đã vô tình xác nhận tính năng “Privacy Display” trên Galaxy S26 Ultra thông qua One UI 8.5, mở ra hướng tiếp cận mới về bảo mật màn hình trên smartphone cao cấp.
Từ truy xuất nguồn gốc đến mục tiêu 10 tỷ USD của ngành rau quả

Từ truy xuất nguồn gốc đến mục tiêu 10 tỷ USD của ngành rau quả

Kim ngạch xuất khẩu rau quả Việt Nam liên tiếp lập đỉnh, song để chinh phục mốc 10 tỷ USD và giữ vững thị phần, truy xuất nguồn gốc và chuẩn hóa chuỗi sản xuất đang trở thành yêu cầu then chốt.
Nhà nước dành tối thiểu 1% ngân sách cho chuyển đổi số

Nhà nước dành tối thiểu 1% ngân sách cho chuyển đổi số

Luật Chuyển đổi số vừa được Quốc hội thông qua quy định Nhà nước bảo đảm chi tối thiểu 1% tổng chi ngân sách hằng năm cho chuyển đổi số, đồng thời yêu cầu đánh giá hiệu quả sử dụng ngân sách, nhằm tránh đầu tư dàn trải, hình thức.
Trung Quốc dồn lực cho chip, Mỹ đầu tư năng lượng trong cuộc đua AI

Trung Quốc dồn lực cho chip, Mỹ đầu tư năng lượng trong cuộc đua AI

Mỹ và Trung Quốc – hai nền kinh tế lớn nhất thế giới – đang theo đuổi những con đường phát triển trí tuệ nhân tạo (AI) khác biệt. Trong khi Mỹ ưu tiên hạ tầng năng lượng và trung tâm dữ liệu, Trung Quốc tập trung đầu tư vào chip và công nghệ nền tảng, giữa lúc lo ngại về nguy cơ hình thành bong bóng AI ngày càng gia tăng.
Samsung Galaxy S26 Ultra rò rỉ công nghệ màn hình bảo mật mới, hạn chế người lạ nhìn trộm

Samsung Galaxy S26 Ultra rò rỉ công nghệ màn hình bảo mật mới, hạn chế người lạ nhìn trộm

Samsung Galaxy S26 Ultra được đồn đoán sẽ trang bị công nghệ màn hình bảo mật mới, cho phép hạn chế người xung quanh nhìn trộm nội dung, tích hợp AI và nhiều nâng cấp phần cứng đáng chú ý.
Samsung cung cấp màn hình OLED mới cho iPhone 18 Pro, iPhone Fold

Samsung cung cấp màn hình OLED mới cho iPhone 18 Pro, iPhone Fold

Samsung Display được cho là sẽ cung cấp tấm nền OLED LTPO+ – công nghệ màn hình tiên tiến nhất hiện nay – cho các mẫu iPhone cao cấp trong tương lai của Apple, mở đường cho thiết kế Face ID ẩn dưới màn hình và cải thiện đáng kể hiệu quả năng lượng.
Startup Hàn Quốc tích hợp pin mặt trời vào thân xe điện, tăng tầm hoạt động 30%

Startup Hàn Quốc tích hợp pin mặt trời vào thân xe điện, tăng tầm hoạt động 30%

Giải pháp của Solarstic cho phép biến toàn bộ chiếc xe thành “trạm thu năng lượng” di động, giúp xe điện di chuyển thêm hàng chục nghìn km mỗi năm chỉ nhờ ánh nắng mặt trời.
TP.Hồ Chí Minh đạt nhiều kết quả đột phá trong chuyển đổi số gắn với Đề án 06

TP.Hồ Chí Minh đạt nhiều kết quả đột phá trong chuyển đổi số gắn với Đề án 06

Việc triển khai Đề án phát triển ứng dụng dữ liệu về dân cư, định danh và xác thực điện tử tiếp tục được TP.Hồ Chí Minh xác định là nhiệm vụ trọng tâm, đóng vai trò “đầu tàu” trong thúc đẩy chuyển đổi số, cải cách thủ tục hành chính và nâng cao chất lượng phục vụ người dân, doanh nghiệp.
Vĩnh Long triển khai đồng bộ “Hệ thống Họp không giấy”, hiện đại hóa hoạt động tổ chức hội họp của tỉnh

Vĩnh Long triển khai đồng bộ “Hệ thống Họp không giấy”, hiện đại hóa hoạt động tổ chức hội họp của tỉnh

Việc đưa “Hệ thống Họp không giấy” vào vận hành đồng bộ trên toàn tỉnh không chỉ góp phần đổi mới phương thức làm việc của các cơ quan hành chính nhà nước, mà còn là bước đi quan trọng của Vĩnh Long trong lộ trình xây dựng Chính quyền điện tử, hướng tới Chính quyền số hiện đại, minh bạch và hiệu quả.
Ba trụ cột chiến lược về dữ liệu quốc gia năm 2026: Hoàn thiện pháp lý, kiến trúc thống nhất, khai thác giá trị dữ liệu

Ba trụ cột chiến lược về dữ liệu quốc gia năm 2026: Hoàn thiện pháp lý, kiến trúc thống nhất, khai thác giá trị dữ liệu

Ban Chỉ đạo quốc gia về dữ liệu xác định 3 trụ cột chiến lược năm 2026, tập trung hoàn thiện pháp lý, xây dựng kiến trúc dữ liệu thống nhất và khai thác giá trị dữ liệu, hướng tới vận hành Trung tâm Dữ liệu quốc gia từ tháng 6/2026.
Chủ tịch FPT Trương Gia Bình:  Khơi dậy khát vọng đưa Việt Nam làm chủ AI

Chủ tịch FPT Trương Gia Bình: Khơi dậy khát vọng đưa Việt Nam làm chủ AI

Tại lễ công bố Giải thưởng Âu Lạc trị giá 1 triệu USD, Chủ tịch FPT Trương Gia Bình khẳng định niềm tin mạnh mẽ vào thế hệ trẻ, coi trí tuệ nhân tạo là con đường chiến lược giúp Việt Nam làm chủ công nghệ lõi.
Tận dụng cơ hội và giảm thiểu rủi ro của cộng nghệ số đối với các nhóm dân cư

Tận dụng cơ hội và giảm thiểu rủi ro của cộng nghệ số đối với các nhóm dân cư

Hội thảo “Tận dụng cơ hội và giảm thiểu rủi ro của công nghệ số đối với các nhóm dân cư” hướng tới việc đề xuất các giải pháp và khuyến nghị chính sách thiết thực, góp phần thúc đẩy chuyển đổi số theo hướng lấy con người làm trung tâm, bảo đảm tính bao trùm, công bằng và bền vững cho mọi nhóm dân cư trong xã hội.
Chuyển đổi số thi hành án dân sự: Tăng tốc thu hồi tài sản trong các đại án kinh tế

Chuyển đổi số thi hành án dân sự: Tăng tốc thu hồi tài sản trong các đại án kinh tế

Cùng với việc tinh gọn tổ chức bộ máy, ngành Tư pháp đang đẩy mạnh chuyển đổi số trong thi hành án dân sự, coi đây là giải pháp then chốt để nâng cao hiệu quả thu hồi tài sản. Kết quả từ các vụ án lớn, trong đó có Vạn Thịnh Phát với hơn 8.800 tỷ đồng đã được chuyển trả cho trái chủ, cho thấy hướng đi này đang phát huy hiệu quả rõ rệt.
TP. Hồ Chí Minh ra mắt kiosk thông minh, rút ngắn quy trình giải quyết thủ tục hành chính

TP. Hồ Chí Minh ra mắt kiosk thông minh, rút ngắn quy trình giải quyết thủ tục hành chính

Hệ thống kiosk thông minh ứng dụng trí tuệ nhân tạo vừa được triển khai tại nhiều phường, xã ở TP. Hồ Chí Minh, góp phần số hóa quy trình hành chính công, giảm thời gian chờ đợi của người dân và giảm áp lực cho đội ngũ cán bộ cơ sở.