Thứ tư 24/12/2025 17:07
Hotline: 024.355.63.010
Email: banbientap.dnhn@gmail.com
Kinh tế số

ByteDance tăng tốc trong cuộc đua AI với công cụ thu thập dữ liệu mới

Nghiên cứu cho thấy, tốc độ thu thập của Bytespider - công cụ thu thập dữ liệu web mà ByteDance mới ra mắt nhanh gấp 25 lần so với GPTbot của OpenAI.
Công cụ thu thập dữ liệu web mới của ByteDance vượt qua các đối thủ lớn
Công cụ thu thập dữ liệu web mới của ByteDance vượt qua các đối thủ lớn như Google, Meta, Amazon và OpenAI.

Công ty mẹ của TikTok là ByteDance, đã ra mắt công cụ thu thập dữ liệu web mang tên Bytespider vào tháng 4 năm nay. Theo Kasada, một công ty chuyên về quản lý bot (phần mềm tự động), Bytespider nhanh chóng nổi lên như một trong những công cụ thu thập dữ liệu mạnh nhất trên internet, vượt qua các đối thủ lớn như Google, Meta, Amazon và OpenAI. Nghiên cứu cho thấy, tốc độ thu thập dữ liệu của Bytespider nhanh gấp 25 lần so với GPTbot của OpenAI, công cụ thu thập dữ liệu phục vụ cho nền tảng ChatGPT.

Việc thu thập dữ liệu với tốc độ cao giúp ByteDance có thêm nhiều dữ liệu để đào tạo các mô hình ngôn ngữ lớn (LLM) và mô hình đa phương tiện (LMM), những thành phần cốt lõi trong việc phát triển các công cụ AI thế hệ mới. Trong bối cảnh các công ty công nghệ lớn đang chạy đua trong lĩnh vực AI, ByteDance cố gắng rút ngắn khoảng cách bằng cách thu thập một lượng dữ liệu khổng lồ từ các trang web toàn cầu.

Sam Crowther, CEO của Kasada, cho biết, kể từ khi Bytespider xuất hiện, nó đã thu thập dữ liệu với tốc độ nhanh hơn khoảng 25 lần so với GPTbot - công cụ thu thập dữ liệu cho nền tảng ChatGPT của OpenAI và các mô hình cơ bản. Bytespider cũng đã thu thập dữ liệu với tốc độ nhanh hơn 3.000 lần so với ClaudeBot của startup AI Anthropic.

Theo Kasada, khi những tháng trôi qua, Bytespider thậm chí còn gấp rút hơn trong việc thu thập dữ liệu. Hoạt động thu thập dữ liệu từ Bytespider tăng đột biến trong 6 tuần qua.

Việc ByteDance thu thập dữ liệu một cách thần tốc diễn ra bất chấp khả năng TikTok bị cấm tại Mỹ trong những tháng tới. Trước đó, Tổng thống Joe Biden đã ký một đạo luật yêu cầu công ty Trung Quốc này phải bán hoặc đóng cửa TikTok do lo ngại về an ninh quốc gia.

Một nguồn tin nội bộ cho biết, ByteDance đang phát triển một mô hình ngôn ngữ lớn mới nhằm cải thiện khả năng tìm kiếm trên TikTok.

Ngoài ra, Bytespider được cho là không tuân thủ tập tin quy định về robots.txt, một tập tin mà các nhà xuất bản web sử dụng để ngăn các công cụ thu thập dữ liệu. Mặc dù điều này không vi phạm pháp luật, nhưng nó có thể dẫn đến các tranh chấp về quyền sở hữu trí tuệ. Nhiều tổ chức cho rằng, việc thu thập dữ liệu mà không được phép là hành vi vi phạm bản quyền, gây ra nhiều tranh cãi trong lĩnh vực này.

"Giống như họ đang cố gắng hết sức để bắt kịp", Crowther nói về hoạt động thu thập dữ liệu tích cực do Bytespider thực hiện. Chỉ riêng năm ngoái, ByteDance được cho là đã tụt hậu rất xa trong cuộc đua AI tạo sinh đến mức họ đã sử dụng OpenAI để giúp xây dựng LLM của riêng ByteDance, điều này trái với các điều khoản dịch vụ của OpenAI.

Gần đây nhất, ByteDance chính thức bước vào cuộc đua video AI với hai mô hình trí tuệ nhân tạo là PixelDance và Seaweed được ra mắt dưới tên thương hiệu Doubao trong Volcano Engine AI Innovation Tour tại Thâm Quyến ngày 24/9. Cả hai mô hình đều nhắm vào thị trường doanh nghiệp và hiện tại vẫn đang trong giai đoạn thử nghiệm với số lượng người được mời tham gia hạn chế.

Việc ra mắt diễn ra mà không có bất kỳ thông báo trước nào. Mặc dù triển khai lặng lẽ, nhưng sự mong đợi trong ngành vẫn tăng nhờ vào những tiến bộ trước đó từ các đối thủ cạnh tranh như Open AI và Kuaishou.

Việc ByteDance ra mắt hai mô hình trên cũng cho thấy tham vọng lớn của công ty trong việc phát triển các công nghệ AI tiên tiến, bất chấp những thách thức pháp lý và sự cạnh tranh khốc liệt trong ngành.

Tin bài khác
Hà Nội ban hành loạt ưu đãi, hỗ trợ doanh nghiệp tham gia Sàn giao dịch công nghệ

Hà Nội ban hành loạt ưu đãi, hỗ trợ doanh nghiệp tham gia Sàn giao dịch công nghệ

Sở Khoa học và Công nghệ Hà Nội cho biết, thành phố sẽ triển khai nhiều chính sách ưu đãi về chi phí, mặt bằng, tư vấn pháp lý và chuyển giao công nghệ nhằm khuyến khích doanh nghiệp, tổ chức tham gia Sàn giao dịch công nghệ Hà Nội, góp phần thúc đẩy thị trường khoa học – công nghệ và đổi mới sáng tạo của Thủ đô.
Hải quan Việt Nam tăng cường hợp tác, học hỏi kinh nghiệm chuyển đổi số từ Hải quan Hàn Quốc

Hải quan Việt Nam tăng cường hợp tác, học hỏi kinh nghiệm chuyển đổi số từ Hải quan Hàn Quốc

Đoàn công tác của Hải quan Việt Nam do ông Nguyễn Văn Thọ – Cục trưởng Cục Hải quan làm Trưởng đoàn đã có buổi thăm và làm việc với Hải quan Hàn Quốc nhằm trao đổi kinh nghiệm trong ứng dụng công nghệ số, trí tuệ nhân tạo và hiện đại hóa quản lý hải quan.
Nâng cấp hệ thống eCoSys, Bộ Công Thương tạo thuận lợi cho doanh nghiệp xuất khẩu

Nâng cấp hệ thống eCoSys, Bộ Công Thương tạo thuận lợi cho doanh nghiệp xuất khẩu

Thực hiện chỉ đạo tháo gỡ khó khăn cho doanh nghiệp, Bộ Công Thương đã hoàn thành sớm việc nâng cấp hệ thống eCoSys, qua đó khắc phục các vướng mắc kỹ thuật, rút ngắn thời gian cấp Giấy chứng nhận xuất xứ hàng hóa cho doanh nghiệp.
Khánh Hòa mở ngày hội công nghệ số 2025: Khi chuyển đổi số trở thành câu chuyện của mọi nhà

Khánh Hòa mở ngày hội công nghệ số 2025: Khi chuyển đổi số trở thành câu chuyện của mọi nhà

Ngày hội Công nghệ số Khánh Hòa 2025 khởi động phong trào Bình dân học vụ số, hướng tới mục tiêu kinh tế số chiếm 35% GRDP năm 2030 và đưa người dân vào trung tâm chuyển đổi số.
Việt Nam dẫn đầu khu vực về chuyển đổi IPv6

Việt Nam dẫn đầu khu vực về chuyển đổi IPv6

Với tỷ lệ chuyển đổi IPv6 gần 68%, Việt Nam đang khẳng định vị thế dẫn đầu khu vực, đồng thời đẩy mạnh kiến tạo không gian số an toàn, tin cậy, phục vụ cho phát triển kinh tế - xã hội.
Công nghệ AI, Deepfake đang bị lợi dụng để thao túng tâm lý và trục lợi tinh vi

Công nghệ AI, Deepfake đang bị lợi dụng để thao túng tâm lý và trục lợi tinh vi

Theo ông Vũ Hoàng Liên - Chủ tịch Hiệp hội Internet Việt Nam, Công nghệ AI, Deepfake đang bị lợi dụng để trở thành công cụ thao túng tâm lý và trục Theo ông Vũ Hoàng Liên - Chủ tịch Hiệp hội Internet Việt Nam, Công nghệ AI, Deepfake đang bị lợi dụng để trở thành công cụ thao túng tâm lý và trục lợi tinh vi.
TP. Hồ Chí Minh đề xuất bỏ hồ sơ giấy với 390 thủ tục hành chính

TP. Hồ Chí Minh đề xuất bỏ hồ sơ giấy với 390 thủ tục hành chính

Trong lộ trình đẩy mạnh cải cách thủ tục hành chính và chuyển đổi số, UBND TP. Hồ Chí Minh đề xuất bỏ hồ sơ giấy đối với 390 thủ tục hành chính, thay thế bằng việc khai thác dữ liệu từ các cơ sở dữ liệu quốc gia và chuyên ngành.
Kinh tế tuần hoàn: Trụ cột chiến lược của mô hình tăng trưởng mới

Kinh tế tuần hoàn: Trụ cột chiến lược của mô hình tăng trưởng mới

Kinh tế tuần hoàn là trụ cột chiến lược của mô hình tăng trưởng mới, là động lực cho chuyển đổi xanh trong kỷ nguyên số.
ICCCI 2025: Công nghiệp sáng tạo từ “ngành mềm” trở thành động lực tăng trưởng kinh tế mới

ICCCI 2025: Công nghiệp sáng tạo từ “ngành mềm” trở thành động lực tăng trưởng kinh tế mới

Các tham luận tại Hội thảo “Truyền thông và Công nghiệp Sáng tạo trong bối cảnh Châu Á đương đại” (ICCCI 2025) đã mang đến cái nhìn toàn diện về sự mở rộng nhanh chóng của công nghiệp sáng tạo và những yêu cầu mới đặt ra cho lực lượng nhân sự trong ngành.
Công nghệ 2025: Khi AI, siêu ứng dụng và thế giới số trở thành “mạch sống” hằng ngày

Công nghệ 2025: Khi AI, siêu ứng dụng và thế giới số trở thành “mạch sống” hằng ngày

Năm 2025 đang chứng kiến một bước chuyển sâu sắc trong đời sống xã hội, khi công nghệ không còn đơn thuần là công cụ hỗ trợ mà dần trở thành “hạ tầng vô hình” chi phối cách con người sống, làm việc, học tập, mua sắm và giải trí.
Xu hướng đăng nhập không cần mật khẩu

Xu hướng đăng nhập không cần mật khẩu

Việc đăng nhập không dùng mật khẩu – từng được xem là một lựa chọn mang tính thử nghiệm – nay đang dần trở thành tiêu chuẩn mới trong ngành công nghệ.
Hà Nội đẩy mạnh đầu tư khoa học công nghệ, sắp xây dựng loạt phòng lab trăm triệu USD

Hà Nội đẩy mạnh đầu tư khoa học công nghệ, sắp xây dựng loạt phòng lab trăm triệu USD

Hà Nội đang bước vào giai đoạn đầu tư mạnh mẽ cho khoa học công nghệ và đổi mới sáng tạo, trong đó nổi bật là kế hoạch xây dựng các phòng thí nghiệm quy mô lớn, giá trị lên tới hàng trăm triệu USD tại các trường đại học trọng điểm.
TECHFEST 2025: Khởi nghiệp sáng tạo toàn dân, động lực tăng trưởng mới

TECHFEST 2025: Khởi nghiệp sáng tạo toàn dân, động lực tăng trưởng mới

TECHFEST Việt Nam 2025 với chủ đề "Khởi nghiệp sáng tạo toàn dân - Động lực tăng trưởng mới” sẽ diễn ra tại Phố đi bộ Hồ Hoàn Kiếm, Hà Nội từ ngày 12 - 14/12.
EVNSPC tạo dấu ấn tại Hội nghị Khoa học – Công nghệ Điện lực toàn quốc 2025

EVNSPC tạo dấu ấn tại Hội nghị Khoa học – Công nghệ Điện lực toàn quốc 2025

Tại Hội nghị Khoa học – Công nghệ Điện lực toàn quốc 2025, Tổng công ty Điện lực Miền Nam (EVNSPC) đã mang đến không gian trưng bày ấn tượng với mô hình các công trình vượt biển, giải pháp BIM – Scan to BIM, AI giám sát và thiết bị vệ sinh cách điện hotline điều khiển từ xa. Những công nghệ và nghiên cứu chuyên sâu được EVNSPC giới thiệu đã khẳng định năng lực đổi mới sáng tạo, nâng cao chất lượng vận hành và dịch vụ khách hàng của ngành Điện miền Nam.
Chiến lược AI phù hợp cho doanh nghiệp: Ứng dụng hơn là mô hình

Chiến lược AI phù hợp cho doanh nghiệp: Ứng dụng hơn là mô hình

Nhiều doanh nghiệp Việt Nam vẫn loay hoay trước câu hỏi chiến lược: nên đầu tư vào đâu, nền tảng hay ứng dụng? Từ góc nhìn nghiên cứu lẫn triển khai thực tế tại Viettel, chuyên gia AI Nguyễn Quang Tuấn đưa ra những phân tích thẳng thắn về quy mô thị trường, chiến lược phù hợp và bức tranh nhân lực AI hiện nay.