Thứ hai 23/03/2026 20:11
Hotline: 024.355.63.010
Kinh tế số

Ai đang dạy cho trí tuệ nhân tạo?

12/10/2020 00:00
Cụm từ AI (trí tuệ thông minh nhân tạo) thường tạo ở người nghe một hình ảnh về một hệ thống phức tạp, tân kỳ, hiện đại và hào nhoáng. Thế nên có ai bảo tù nhân ở Phần Lan hay công nhân giá rẻ ở Trung Quốc đang dạy cho AI học, ắt ta sẽ nghĩ đây chỉ l

Ảnh minh họa. Nguồn: Internet

Vainu, một công ty khởi nghiệp ở Phần Lan, đang xây dựng một cơ sở dữ liệu khổng lồ về tất cả mọi doanh nghiệp trên thế giới với tham vọng cung cấp dịch vụ giúp kết nối doanh nghiệp với đúng đối tác họ cần. Để cơ sở dữ liệu được cập nhật và có các thông tin riêng độc đáo, Vainu tổ chức để thuê người đọc hàng trăm ngàn bài viết về doanh nghiệp thu thập từ Internet và dán nhãn để miêu tả chúng, ví dụ bài này là về hãng Apple sản xuất iPhone, bài kia là về doanh nghiệp xuất khẩu táo.

Với các bài bằng tiếng Anh, Vainu sử dụng chợ nhân công giá rẻ trên mạng gọi là “Amazon Mechanical Turk” - một nơi doanh nghiệp thường dùng để thuê người làm những phần việc mang tính lặp đi lặp lại, loại công việc có thể làm từ xa. Nhưng với tiếng Phần Lan thì các chợ này bó tay, không tìm ra người chịu làm việc giá rẻ. Thế là Vainu bèn hợp tác với cơ quan quản lý tù nhân của Phần Lan, danh nghĩa là giúp tù nhân học nghề nhưng cũng là cách tận dụng lao động rẻ bằng cách trang bị máy tính cho hai nhà tù để tù nhân ngồi dán nhãn các bài báo cho họ. Sau khi có dữ liệu đã dán nhãn, Vainu mới dạy cho máy học các thuật toán phân tích dữ liệu.

Máy tính làm các phép tính rất nhanh, nhưng thiếu khả năng nhận biết nên thua ngay cả một em bé trong khía cạnh này. Các em bé nhìn một con béc-giê và một con chihuahua thì dù chúng khác nhau một trời một vực các em cũng biết chúng đều là chó. Máy tính thì phải dạy và không phải chỉ dạy từng hình, bằng không thì dù đã thấy hình chó mực nhưng sau đó thấy một con chó đốm nó sẽ bảo đó không phải là chó.

Trí tuệ thông minh nhân tạo cần một lượng dữ liệu khổng lồ để máy học, ví dụ đưa các phim chụp cộng hưởng từ (MRI) vào máy kèm theo là chẩn đoán đúng của các bác sĩ. Từ hàng ngàn, hàng chục ngàn phim MRI có chẩn đoán của con người, máy sẽ học để sau đó nhìn vào phim bắt chước đưa ra chẩn đoán. Vì máy không bị môi trường bên ngoài chi phối, lại học từ các bác sĩ giỏi nhất, rút kinh nghiệm từ các chẩn đoán sai, nên dần dần máy sẽ “thông minh” hơn người, tỷ lệ chẩn đoán chính xác ngày càng cao.

Nhưng, như chúng ta đã hình dung phần nào, công đoạn quan trọng đầu tiên là máy phải có hình ảnh từ phim MRI và các nhãn chẩn đoán nó mới học được. Công đoạn đưa phim vào bộ nhớ của máy, gõ các chẩn đoán là công đoạn cần nhiều lao động mà các lao động này không cần trình độ học vấn cao, chỉ cần làm đúng một số thao tác được huấn luyện. Đây là loại công việc nhàm chán, tiền công lại rẻ nên phù hợp cho các thị trường như Trung Quốc.

Ở một địa điểm được mệnh danh là “nông trại dữ liệu”, nhiều công nhân mở các file hình và gõ các nhãn miêu tả chúng; từ các cụm từ định danh như “con chó”, “con mèo” đến các dòng chi tiết hơn như “đây là hình một đứa bé đang tập đi”... Ngành nhập dữ liệu như thế đang là ngành thu hút nhiều lao động ở Trung Quốc một khi các ngành lắp ráp điện tử hay may mặc bị chuyển đi nước khác. Các doanh nghiệp khởi nghiệp tỏa ra lập các “nông trại dữ liệu” ở các vùng giá lao động còn rẻ để dán nhãn cho hàng triệu triệu tấm ảnh và hàng triệu triệu giờ video. Loại công việc cần sự cần cù, nhẫn nại này đang giúp Trung Quốc có một lợi thế trong lĩnh vực AI so với Mỹ và châu Âu.

Chẳng hạn một siêu thị xây dựng được hệ thống tính tiền tự động, nhưng để hệ thống hoạt động cần đính thẻ cho khoảng 20.000 hình ảnh hàng hóa nhìn từ đủ góc cạnh; tức cũng là cái bánh nhưng lấp ló sau hộp kem thì máy cũng phải nhận ra. Thế là siêu thị phải thuê một “nông trại dữ liệu” làm gấp trong ba ngày, tiền công chỉ vài ngàn đô la. Một nơi khác thuê đính thẻ cho ba triệu tấm hình chụp miệng người.

Ở đây, chính phủ và doanh nghiệp Trung Quốc có một lợi thế khác nữa, đó là họ đang tiếp cận kho dữ liệu khổng lồ của một xã hội 1,4 tỉ dân, nơi tính riêng tư của thông tin không được coi trọng cho lắm. Ở châu Âu, muốn thu thập dữ liệu phải xin phép người dùng một cách rõ ràng, ai vi phạm dễ bị kiện cáo và chịu phạt những khoản tiền lớn. Chính vì thế có nhiều dự báo Trung Quốc sẽ dẫn đầu thế giới trong lĩnh vực AI trước năm 2030, một phần nào đó là do mọi AI đều được xây dựng dựa trên lao động mang tính thủ công của con người.

Nguyễn Vũ

Tin bài khác
Bí mật phía sau đơn đến trong 1 giờ, thậm chí 30 phút của Amazon

Bí mật phía sau đơn đến trong 1 giờ, thậm chí 30 phút của Amazon

Amazon đang đẩy cuộc đua giao hàng siêu tốc lên một nấc mới khi triển khai dịch vụ nhận hàng trong 1 giờ tại hàng trăm khu vực ở Mỹ, đồng thời thử nghiệm mô hình giao trong 30 phút. Tốc độ kỷ lục này giúp hãng gia tăng sức ép lên Walmart và toàn ngành bán lẻ, nhưng cũng đặt ra câu hỏi lớn về chi phí vận hành và áp lực lao động trong chuỗi logistics.
Nvidia đặt cược vào “AI vận hành”, dự báo thị trường chip đạt 1.000 tỷ USD

Nvidia đặt cược vào “AI vận hành”, dự báo thị trường chip đạt 1.000 tỷ USD

Tại hội nghị công nghệ GTC 2026 diễn ra ở San Jose (Mỹ), CEO Jensen Huang công bố bước chuyển chiến lược quan trọng của Nvidia: tập trung vào giai đoạn vận hành AI (AI inference), nơi các mô hình trí tuệ nhân tạo được triển khai vào thực tế.
Samsung đối mặt nguy cơ thua lỗ lần đầu ở mảng di động dù Galaxy S26 bán chạy

Samsung đối mặt nguy cơ thua lỗ lần đầu ở mảng di động dù Galaxy S26 bán chạy

Dù Galaxy S26 đạt doanh số khả quan, Samsung vẫn phải đối mặt bài toán lớn hơn: làm sao duy trì lợi nhuận trong một thị trường smartphone ngày càng cạnh tranh và chi phí ngày càng cao.
Oppo Find X9 Ultra rò rỉ camera 10x: Khẩu độ lớn hơn, tham vọng dẫn đầu nhiếp ảnh di động

Oppo Find X9 Ultra rò rỉ camera 10x: Khẩu độ lớn hơn, tham vọng dẫn đầu nhiếp ảnh di động

Oppo Find X9 Ultra lộ thông tin camera 10x periscope khẩu độ f/3.5, cảm biến telephoto 200MP và hệ thống camera nâng cấp mạnh, hứa hẹn cạnh tranh trực tiếp trong phân khúc flagship cao cấp.
Công nghệ UAV bầy đàn hỗ trợ chữa cháy trong đô thị

Công nghệ UAV bầy đàn hỗ trợ chữa cháy trong đô thị

Công ty CT UAV, thành viên của CT Group, đang phát triển hệ thống UAV bầy đàn chữa cháy mang tên Fire Swarm, hướng đến giải quyết bài toán xử lý hỏa hoạn tại các khu vực ngõ nhỏ, hẻm sâu – nơi phương tiện cứu hỏa truyền thống khó tiếp cận.
Xuất hiện khái niệm “drone chúa” mang hàng nghìn UAV

Xuất hiện khái niệm “drone chúa” mang hàng nghìn UAV

Những nền tảng máy bay không người lái siêu tải trọng, có khả năng mang theo hàng trăm đến hàng nghìn UAV cỡ nhỏ, có thể sớm xuất hiện trong tương lai gần.
Xiaomi 17 Ultra có gì mới khi sở hữu camera 200MP và pin 6000mAh?

Xiaomi 17 Ultra có gì mới khi sở hữu camera 200MP và pin 6000mAh?

Xiaomi 17 Ultra là mẫu smartphone flagship mới được giới thiệu trong năm 2026, tiếp tục kế thừa định hướng công nghệ cao cấp của dòng Xiaomi Ultra.
Internet Việt Nam sẵn sàng cho “kinh tế tầm thấp”

Internet Việt Nam sẵn sàng cho “kinh tế tầm thấp”

Sự phát triển nhanh của hạ tầng viễn thông đang đưa Internet Việt Nam trở thành một trong những nền tảng quan trọng thúc đẩy kinh tế số, đặc biệt là các mô hình kinh tế mới như kinh tế tầm thấp (Low Altitude Economy – LAE).
Apple Music bắt đầu gắn nhãn nội dung AI trong âm nhạc

Apple Music bắt đầu gắn nhãn nội dung AI trong âm nhạc

Nền tảng nghe nhạc trực tuyến Apple Music vừa triển khai hệ thống “thẻ minh bạch” (transparency tags) nhằm giúp người dùng nhận biết liệu nội dung âm nhạc họ đang nghe có được tạo ra bằng trí tuệ nhân tạo (AI) hay không.
Làn sóng rời ChatGPT gây chú ý

Làn sóng rời ChatGPT gây chú ý

Một làn sóng người dùng tuyên bố ngừng sử dụng ChatGPT đang lan truyền trên mạng xã hội, làm dấy lên những cuộc tranh luận về niềm tin, minh bạch và sự cạnh tranh trong thị trường trí tuệ nhân tạo (AI) tạo sinh. Diễn biến này được cho là có thể tạo áp lực mới lên OpenAI – đơn vị phát triển nền tảng ChatGPT – trong bối cảnh nhiều dịch vụ AI khác đang nổi lên mạnh mẽ.
Samsung Galaxy S27: Cảm biến 200MP có thể sẽ được nâng cấp vào năm tới?

Samsung Galaxy S27: Cảm biến 200MP có thể sẽ được nâng cấp vào năm tới?

Khi Galaxy S26 còn chưa kịp “hạ nhiệt”, các tin rò rỉ đầu tiên về Galaxy S27 đã xuất hiện, tập trung vào một điểm quen mà vẫn gây tò mò: camera chính 200MP. Theo các nguồn rò rỉ trên Weibo được các trang công nghệ quốc tế tổng hợp, Samsung có thể giữ nguyên độ phân giải 200MP nhưng đổi cách “làm HDR” bằng công nghệ LOFIC để cải thiện ảnh trong môi trường tương phản mạnh.
Apple tung iPhone 17e: Tăng sức mạnh, thêm màu mới, giá từ 15,6 triệu đồng

Apple tung iPhone 17e: Tăng sức mạnh, thêm màu mới, giá từ 15,6 triệu đồng

Apple chính thức giới thiệu iPhone 17e với chip A19 thế hệ mới, camera 48MP, bộ nhớ tiêu chuẩn 256GB và hỗ trợ MagSafe. Dù được nâng cấp mạnh về cấu hình và tính năng, mẫu máy này vẫn giữ mức giá khởi điểm từ 15,6 triệu đồng, hướng đến phân khúc người dùng phổ thông cao cấp.
TP.Hồ Chí Minh: Sẽ tiên phong phát triển mô hình xúc tiến đầu tư số

TP.Hồ Chí Minh: Sẽ tiên phong phát triển mô hình xúc tiến đầu tư số

Công nghệ số sẽ được UBND TP.Hồ Chí Minh đưa vào ứng dụng trong lĩnh vực xúc tiến đầu tư nhằm giảm bớt các thủ tục và tăng cường các tiện ích cho cộng đồng doanh nghiệp.
Samsung đặt cược agentic AI với Galaxy S26, hợp tác Google phát triển “hệ điều hành AI”

Samsung đặt cược agentic AI với Galaxy S26, hợp tác Google phát triển “hệ điều hành AI”

Samsung ra mắt Galaxy S26 với trọng tâm agentic AI, tích hợp Perplexity, Gemini và phát triển “hệ điều hành AI” cùng Google, mở ra cuộc đua smartphone cao cấp 2026.
Galaxy S26 Ultra lộ diện trước giờ G

Galaxy S26 Ultra lộ diện trước giờ G

Chỉ vài ngày trước khi Samsung chính thức ra mắt dòng Galaxy S26 vào ngày 25/2, một cửa hàng tại Dubai đã bất ngờ đưa mẫu Galaxy S26 Ultra lên kệ. Sự cố “mở bán sớm” này khiến toàn bộ thiết kế và một số tính năng quan trọng của thiết bị bị lộ, thu hút sự quan tâm của cộng đồng công nghệ và giới kinh doanh thiết bị di động toàn cầu.