Thứ năm 26/02/2026 15:21
Hotline: 024.355.63.010
Email: banbientap.dnhn@gmail.com
Kinh tế số

ByteDance tăng tốc trong cuộc đua AI với công cụ thu thập dữ liệu mới

Nghiên cứu cho thấy, tốc độ thu thập của Bytespider - công cụ thu thập dữ liệu web mà ByteDance mới ra mắt nhanh gấp 25 lần so với GPTbot của OpenAI.
Công cụ thu thập dữ liệu web mới của ByteDance vượt qua các đối thủ lớn
Công cụ thu thập dữ liệu web mới của ByteDance vượt qua các đối thủ lớn như Google, Meta, Amazon và OpenAI.

Công ty mẹ của TikTok là ByteDance, đã ra mắt công cụ thu thập dữ liệu web mang tên Bytespider vào tháng 4 năm nay. Theo Kasada, một công ty chuyên về quản lý bot (phần mềm tự động), Bytespider nhanh chóng nổi lên như một trong những công cụ thu thập dữ liệu mạnh nhất trên internet, vượt qua các đối thủ lớn như Google, Meta, Amazon và OpenAI. Nghiên cứu cho thấy, tốc độ thu thập dữ liệu của Bytespider nhanh gấp 25 lần so với GPTbot của OpenAI, công cụ thu thập dữ liệu phục vụ cho nền tảng ChatGPT.

Việc thu thập dữ liệu với tốc độ cao giúp ByteDance có thêm nhiều dữ liệu để đào tạo các mô hình ngôn ngữ lớn (LLM) và mô hình đa phương tiện (LMM), những thành phần cốt lõi trong việc phát triển các công cụ AI thế hệ mới. Trong bối cảnh các công ty công nghệ lớn đang chạy đua trong lĩnh vực AI, ByteDance cố gắng rút ngắn khoảng cách bằng cách thu thập một lượng dữ liệu khổng lồ từ các trang web toàn cầu.

Sam Crowther, CEO của Kasada, cho biết, kể từ khi Bytespider xuất hiện, nó đã thu thập dữ liệu với tốc độ nhanh hơn khoảng 25 lần so với GPTbot - công cụ thu thập dữ liệu cho nền tảng ChatGPT của OpenAI và các mô hình cơ bản. Bytespider cũng đã thu thập dữ liệu với tốc độ nhanh hơn 3.000 lần so với ClaudeBot của startup AI Anthropic.

Theo Kasada, khi những tháng trôi qua, Bytespider thậm chí còn gấp rút hơn trong việc thu thập dữ liệu. Hoạt động thu thập dữ liệu từ Bytespider tăng đột biến trong 6 tuần qua.

Việc ByteDance thu thập dữ liệu một cách thần tốc diễn ra bất chấp khả năng TikTok bị cấm tại Mỹ trong những tháng tới. Trước đó, Tổng thống Joe Biden đã ký một đạo luật yêu cầu công ty Trung Quốc này phải bán hoặc đóng cửa TikTok do lo ngại về an ninh quốc gia.

Một nguồn tin nội bộ cho biết, ByteDance đang phát triển một mô hình ngôn ngữ lớn mới nhằm cải thiện khả năng tìm kiếm trên TikTok.

Ngoài ra, Bytespider được cho là không tuân thủ tập tin quy định về robots.txt, một tập tin mà các nhà xuất bản web sử dụng để ngăn các công cụ thu thập dữ liệu. Mặc dù điều này không vi phạm pháp luật, nhưng nó có thể dẫn đến các tranh chấp về quyền sở hữu trí tuệ. Nhiều tổ chức cho rằng, việc thu thập dữ liệu mà không được phép là hành vi vi phạm bản quyền, gây ra nhiều tranh cãi trong lĩnh vực này.

"Giống như họ đang cố gắng hết sức để bắt kịp", Crowther nói về hoạt động thu thập dữ liệu tích cực do Bytespider thực hiện. Chỉ riêng năm ngoái, ByteDance được cho là đã tụt hậu rất xa trong cuộc đua AI tạo sinh đến mức họ đã sử dụng OpenAI để giúp xây dựng LLM của riêng ByteDance, điều này trái với các điều khoản dịch vụ của OpenAI.

Gần đây nhất, ByteDance chính thức bước vào cuộc đua video AI với hai mô hình trí tuệ nhân tạo là PixelDance và Seaweed được ra mắt dưới tên thương hiệu Doubao trong Volcano Engine AI Innovation Tour tại Thâm Quyến ngày 24/9. Cả hai mô hình đều nhắm vào thị trường doanh nghiệp và hiện tại vẫn đang trong giai đoạn thử nghiệm với số lượng người được mời tham gia hạn chế.

Việc ra mắt diễn ra mà không có bất kỳ thông báo trước nào. Mặc dù triển khai lặng lẽ, nhưng sự mong đợi trong ngành vẫn tăng nhờ vào những tiến bộ trước đó từ các đối thủ cạnh tranh như Open AI và Kuaishou.

Việc ByteDance ra mắt hai mô hình trên cũng cho thấy tham vọng lớn của công ty trong việc phát triển các công nghệ AI tiên tiến, bất chấp những thách thức pháp lý và sự cạnh tranh khốc liệt trong ngành.

Tin bài khác
Samsung đặt cược agentic AI với Galaxy S26, hợp tác Google phát triển “hệ điều hành AI”

Samsung đặt cược agentic AI với Galaxy S26, hợp tác Google phát triển “hệ điều hành AI”

Samsung ra mắt Galaxy S26 với trọng tâm agentic AI, tích hợp Perplexity, Gemini và phát triển “hệ điều hành AI” cùng Google, mở ra cuộc đua smartphone cao cấp 2026.
Galaxy S26 Ultra lộ diện trước giờ G

Galaxy S26 Ultra lộ diện trước giờ G

Chỉ vài ngày trước khi Samsung chính thức ra mắt dòng Galaxy S26 vào ngày 25/2, một cửa hàng tại Dubai đã bất ngờ đưa mẫu Galaxy S26 Ultra lên kệ. Sự cố “mở bán sớm” này khiến toàn bộ thiết kế và một số tính năng quan trọng của thiết bị bị lộ, thu hút sự quan tâm của cộng đồng công nghệ và giới kinh doanh thiết bị di động toàn cầu.
Apple thử nghiệm sản xuất iPhone 18 Pro, sẵn sàng cho “mùa thu công nghệ” 2026

Apple thử nghiệm sản xuất iPhone 18 Pro, sẵn sàng cho “mùa thu công nghệ” 2026

Apple Inc. đang đưa bộ đôi iPhone 18 Pro và iPhone 18 Pro Max vào giai đoạn thử nghiệm sản xuất hàng loạt (mass-production testing), bước đi quan trọng trước khi ra mắt chính thức vào tháng 9/2026. Thông tin này xuất phát từ nguồn rò rỉ Fixed Focus Digital trên Weibo, cho thấy “Táo khuyết” đã chuyển từ giai đoạn kiểm định thiết kế sang kiểm định sản xuất – tín hiệu cho thấy tiến độ phát triển đang đi đúng lộ trình.
Trung Quốc tăng tốc đường đua 6G, công nghệ quang – không dây tích hợp lập kỷ lục 512 Gbps

Trung Quốc tăng tốc đường đua 6G, công nghệ quang – không dây tích hợp lập kỷ lục 512 Gbps

Hệ thống truyền thông tích hợp cáp quang – không dây đạt tốc độ kỷ lục 512 Gbps, mở đường cho hạ tầng 6G và trung tâm dữ liệu AI siêu băng thông trong tương lai.
Apple Music trên iOS 26.4: Loạt tính năng AI và trải nghiệm mới cho người dùng iPhone

Apple Music trên iOS 26.4: Loạt tính năng AI và trải nghiệm mới cho người dùng iPhone

Apple Music trên iOS 26.4 bổ sung 5 tính năng mới như playlist bằng AI, widget âm nhạc theo tâm trạng, thông tin concert và giao diện toàn màn hình, nâng trải nghiệm nghe nhạc trên iPhone.
YouTube gián đoạn toàn cầu sáng 18/2, hàng trăm nghìn người dùng báo lỗi

YouTube gián đoạn toàn cầu sáng 18/2, hàng trăm nghìn người dùng báo lỗi

Sáng 18/2, nền tảng video trực tuyến YouTube bất ngờ gặp sự cố diện rộng, khiến hàng triệu người dùng trên toàn cầu không thể truy cập đầy đủ dịch vụ. Lỗi xảy ra đồng thời với một số nền tảng trực tuyến lớn khác, gây xáo trộn đáng kể trong bối cảnh nhu cầu giải trí trực tuyến tăng cao dịp Tết.
Ấn Độ "đặt cược" 200 tỷ USD vào AI

Ấn Độ "đặt cược" 200 tỷ USD vào AI

Ấn Độ đặt mục tiêu thu hút hơn 200 tỷ USD đầu tư vào trí tuệ nhân tạo trong hai năm tới, với các tập đoàn lớn như Adani, Infosys và nhiều “ông lớn” công nghệ toàn cầu tham gia xây dựng hệ sinh thái AI quy mô hàng trăm tỷ USD.
Elon Musk mở công ty Starlink tại Việt Nam, bổ nhiệm CEO 9X

Elon Musk mở công ty Starlink tại Việt Nam, bổ nhiệm CEO 9X

Starlink Services Việt Nam, công ty thuộc SpaceX của Elon Musk, chính thức thành lập với vốn điều lệ 30 tỷ đồng, bổ nhiệm CEO người Hà Nội sinh năm 1990.
iPhone chiếm 25% smartphone toàn cầu

iPhone chiếm 25% smartphone toàn cầu

Báo cáo mới từ Counterpoint Research cho thấy 25% điện thoại thông minh đang hoạt động trên toàn cầu là iPhone. Trong bối cảnh thị trường chỉ tăng trưởng 2% năm 2025, Apple và Samsung tiếp tục thống trị nhờ khả năng giữ chân người dùng và hệ sinh thái bền vững.
Smartphone tầm giá 10 triệu đồng 2026: Loạt máy mới pin “khủng”, camera 200 MP, chống nước IP69

Smartphone tầm giá 10 triệu đồng 2026: Loạt máy mới pin “khủng”, camera 200 MP, chống nước IP69

Phân khúc smartphone khoảng 10 triệu đồng tại Việt Nam đang sôi động với nhiều mẫu máy mới nổi bật về độ bền, pin dung lượng lớn và cấu hình vượt tầm giá.
Smartphone cao cấp đồng loạt giảm giá, thị trường sôi động dịp cuối năm

Smartphone cao cấp đồng loạt giảm giá, thị trường sôi động dịp cuối năm

Bước vào giai đoạn mua sắm cao điểm cuối năm, thị trường smartphone ghi nhận làn sóng điều chỉnh giá mạnh ở phân khúc cao cấp. Nhiều mẫu flagship sau vài tháng mở bán đã được các hệ thống bán lẻ giảm giá đáng kể nhằm kích cầu tiêu dùng, đồng thời chuẩn bị cho chu kỳ sản phẩm mới.
Một chạm mở “vạn tiện ích”: Cách V-App trở thành “trợ lý toàn năng” cho người Việt

Một chạm mở “vạn tiện ích”: Cách V-App trở thành “trợ lý toàn năng” cho người Việt

Ra mắt kỹ thuật phiên bản trải nghiệm sớm ngày 29/1, V-App không đơn thuần là một ứng dụng mới mà là lời giải cho việc quy hoạch hàng loạt ứng dụng. Bằng việc gom trọn hệ sinh thái ứng dụng khổng lồ cùng kho tri thức rộng lớn vào một điểm chạm duy nhất, V-App đang tạo ra cuộc cách mạng về trải nghiệm số cho người Việt.
MacBook Pro thế hệ mới có thể ra mắt đầu tháng 3: Chip M5 Pro, M5 Max tăng tốc cuộc đua hiệu năng

MacBook Pro thế hệ mới có thể ra mắt đầu tháng 3: Chip M5 Pro, M5 Max tăng tốc cuộc đua hiệu năng

Apple được cho là sẽ trình làng MacBook Pro dùng chip M5 Pro và M5 Max ngay trong tuần đầu tháng 3, sớm nhất từ ngày 2/3, đánh dấu bước nâng cấp đáng kể về hiệu năng cho dòng laptop cao cấp.
Lào Cai phấn đấu đến năm 2030 phủ sóng 5G tới 90% thôn, bản

Lào Cai phấn đấu đến năm 2030 phủ sóng 5G tới 90% thôn, bản

UBND tỉnh Lào Cai vừa ban hành Kế hoạch số 44/KH-UBND triển khai Đề án 11 về đẩy mạnh phát triển hạ tầng số, nâng cao tỷ trọng kinh tế số, giai đoạn 2026 – 2030. Đây là một trong 17 đề án trọng tâm nhằm cụ thể hóa Nghị quyết số 35-NQ/TU của Ban Chấp hành Đảng bộ tỉnh, thực hiện mục tiêu phát triển kinh tế – xã hội nhiệm kỳ 2025 – 2030.
Khai mạc Không gian trưng bày, livestream “Sức sống hàng Việt” tại Tràng Tiền

Khai mạc Không gian trưng bày, livestream “Sức sống hàng Việt” tại Tràng Tiền

Sáng 5/2, Không gian trưng bày, livestream “Sức sống hàng Việt” chính thức khai mạc tại số 62 Tràng Tiền (quận Hoàn Kiếm, Hà Nội), mở ra một điểm giới thiệu, quảng bá và tiêu thụ hàng Việt Nam ngay giữa trung tâm Thủ đô, kết hợp trưng bày trực tiếp và bán hàng trên nền tảng số.