Thứ tư 27/05/2026 21:51
Hotline: 024.355.63.010
Kinh tế số

Ai đang dạy cho trí tuệ nhân tạo?

12/10/2020 00:00
Cụm từ AI (trí tuệ thông minh nhân tạo) thường tạo ở người nghe một hình ảnh về một hệ thống phức tạp, tân kỳ, hiện đại và hào nhoáng. Thế nên có ai bảo tù nhân ở Phần Lan hay công nhân giá rẻ ở Trung Quốc đang dạy cho AI học, ắt ta sẽ nghĩ đây chỉ l

Ảnh minh họa. Nguồn: Internet

Vainu, một công ty khởi nghiệp ở Phần Lan, đang xây dựng một cơ sở dữ liệu khổng lồ về tất cả mọi doanh nghiệp trên thế giới với tham vọng cung cấp dịch vụ giúp kết nối doanh nghiệp với đúng đối tác họ cần. Để cơ sở dữ liệu được cập nhật và có các thông tin riêng độc đáo, Vainu tổ chức để thuê người đọc hàng trăm ngàn bài viết về doanh nghiệp thu thập từ Internet và dán nhãn để miêu tả chúng, ví dụ bài này là về hãng Apple sản xuất iPhone, bài kia là về doanh nghiệp xuất khẩu táo.

Với các bài bằng tiếng Anh, Vainu sử dụng chợ nhân công giá rẻ trên mạng gọi là “Amazon Mechanical Turk” - một nơi doanh nghiệp thường dùng để thuê người làm những phần việc mang tính lặp đi lặp lại, loại công việc có thể làm từ xa. Nhưng với tiếng Phần Lan thì các chợ này bó tay, không tìm ra người chịu làm việc giá rẻ. Thế là Vainu bèn hợp tác với cơ quan quản lý tù nhân của Phần Lan, danh nghĩa là giúp tù nhân học nghề nhưng cũng là cách tận dụng lao động rẻ bằng cách trang bị máy tính cho hai nhà tù để tù nhân ngồi dán nhãn các bài báo cho họ. Sau khi có dữ liệu đã dán nhãn, Vainu mới dạy cho máy học các thuật toán phân tích dữ liệu.

Máy tính làm các phép tính rất nhanh, nhưng thiếu khả năng nhận biết nên thua ngay cả một em bé trong khía cạnh này. Các em bé nhìn một con béc-giê và một con chihuahua thì dù chúng khác nhau một trời một vực các em cũng biết chúng đều là chó. Máy tính thì phải dạy và không phải chỉ dạy từng hình, bằng không thì dù đã thấy hình chó mực nhưng sau đó thấy một con chó đốm nó sẽ bảo đó không phải là chó.

Trí tuệ thông minh nhân tạo cần một lượng dữ liệu khổng lồ để máy học, ví dụ đưa các phim chụp cộng hưởng từ (MRI) vào máy kèm theo là chẩn đoán đúng của các bác sĩ. Từ hàng ngàn, hàng chục ngàn phim MRI có chẩn đoán của con người, máy sẽ học để sau đó nhìn vào phim bắt chước đưa ra chẩn đoán. Vì máy không bị môi trường bên ngoài chi phối, lại học từ các bác sĩ giỏi nhất, rút kinh nghiệm từ các chẩn đoán sai, nên dần dần máy sẽ “thông minh” hơn người, tỷ lệ chẩn đoán chính xác ngày càng cao.

Nhưng, như chúng ta đã hình dung phần nào, công đoạn quan trọng đầu tiên là máy phải có hình ảnh từ phim MRI và các nhãn chẩn đoán nó mới học được. Công đoạn đưa phim vào bộ nhớ của máy, gõ các chẩn đoán là công đoạn cần nhiều lao động mà các lao động này không cần trình độ học vấn cao, chỉ cần làm đúng một số thao tác được huấn luyện. Đây là loại công việc nhàm chán, tiền công lại rẻ nên phù hợp cho các thị trường như Trung Quốc.

Ở một địa điểm được mệnh danh là “nông trại dữ liệu”, nhiều công nhân mở các file hình và gõ các nhãn miêu tả chúng; từ các cụm từ định danh như “con chó”, “con mèo” đến các dòng chi tiết hơn như “đây là hình một đứa bé đang tập đi”... Ngành nhập dữ liệu như thế đang là ngành thu hút nhiều lao động ở Trung Quốc một khi các ngành lắp ráp điện tử hay may mặc bị chuyển đi nước khác. Các doanh nghiệp khởi nghiệp tỏa ra lập các “nông trại dữ liệu” ở các vùng giá lao động còn rẻ để dán nhãn cho hàng triệu triệu tấm ảnh và hàng triệu triệu giờ video. Loại công việc cần sự cần cù, nhẫn nại này đang giúp Trung Quốc có một lợi thế trong lĩnh vực AI so với Mỹ và châu Âu.

Chẳng hạn một siêu thị xây dựng được hệ thống tính tiền tự động, nhưng để hệ thống hoạt động cần đính thẻ cho khoảng 20.000 hình ảnh hàng hóa nhìn từ đủ góc cạnh; tức cũng là cái bánh nhưng lấp ló sau hộp kem thì máy cũng phải nhận ra. Thế là siêu thị phải thuê một “nông trại dữ liệu” làm gấp trong ba ngày, tiền công chỉ vài ngàn đô la. Một nơi khác thuê đính thẻ cho ba triệu tấm hình chụp miệng người.

Ở đây, chính phủ và doanh nghiệp Trung Quốc có một lợi thế khác nữa, đó là họ đang tiếp cận kho dữ liệu khổng lồ của một xã hội 1,4 tỉ dân, nơi tính riêng tư của thông tin không được coi trọng cho lắm. Ở châu Âu, muốn thu thập dữ liệu phải xin phép người dùng một cách rõ ràng, ai vi phạm dễ bị kiện cáo và chịu phạt những khoản tiền lớn. Chính vì thế có nhiều dự báo Trung Quốc sẽ dẫn đầu thế giới trong lĩnh vực AI trước năm 2030, một phần nào đó là do mọi AI đều được xây dựng dựa trên lao động mang tính thủ công của con người.

Nguyễn Vũ

Tin bài khác
Phát hiện gian lận bằng AI bảo vệ dòng tiền cho startup

Phát hiện gian lận bằng AI bảo vệ dòng tiền cho startup

Việc ứng dụng các mô hình học máy để phát hiện gian lận bằng AI giúp các startup giám sát dòng tiền 24/7, nhận diện sớm các giao dịch bất thường và bảo vệ quỹ vốn mạo hiểm trước các chiêu trò lừa đảo tinh vi.
Bước ngoặt trong cuộc chiến chống Deepfake và lừa đảo số

Bước ngoặt trong cuộc chiến chống Deepfake và lừa đảo số

Trước làn sóng lừa đảo định danh tinh vi bằng công nghệ AI tạo sinh, việc các giải pháp nội địa vượt qua các bài kiểm thử khắt khe theo tiêu chuẩn ISO trở thành bệ phóng quan trọng, giúp các doanh nghiệp số thiết lập hàng rào phòng thủ vững chắc.
Huawei hé lộ hướng phát triển chip mới ngoài EUV

Huawei hé lộ hướng phát triển chip mới ngoài EUV

Không chọn cách chờ các lệnh cấm vận được nới lỏng, Huawei đang theo đuổi chiến lược phát triển chip theo hướng riêng với mục tiêu giảm phụ thuộc vào công nghệ quang khắc EUV hiện đại.
Google biến Gmail thành “thư ký AI” với tính năng Gemini mới

Google biến Gmail thành “thư ký AI” với tính năng Gemini mới

Google vừa bổ sung loạt tính năng mới cho Gemini AI trên Gmail, cho phép trợ lý AI học phong cách viết của người dùng để tạo email tự nhiên và cá nhân hóa hơn.
Trở thành AI Engineer thực thụ

Trở thành AI Engineer thực thụ

Road to AI là một hành trình thực chiến, nơi chúng tôi xóa bỏ rào cản lý thuyết để bạn trực tiếp kiến tạo những hệ thống AI tiên tiến nhất bằng RAG, AI Agent và LLM.
Doanh nghiệp Việt trước làn sóng Agentic AI: Ai tiên phong sẽ chiến thắng!

Doanh nghiệp Việt trước làn sóng Agentic AI: Ai tiên phong sẽ chiến thắng!

Doanh nghiệp Việt đã quen với việc dùng AI để viết nhanh hơn, bán hàng tốt hơn hay trả lời khách hàng tự động. Nhưng đó có thể mới chỉ là bước khởi động. Một làn sóng mới mang tên Agentic AI đang xuất hiện với khả năng tự lập kế hoạch, tự xử lý nhiều nhiệm vụ và hành động gần giống một cộng sự thực thụ. Nếu xu hướng này tăng tốc, cuộc cạnh tranh giữa các doanh nghiệp có thể không còn nằm ở số lượng nhân viên, mà ở việc ai xây dựng được lực lượng lao động thành thạo AI trước?
Nghệ An triển khai nghiên cứu ứng dụng AI kết hợp GIS phòng chống buôn lậu, gian lận thương mại, hàng giả

Nghệ An triển khai nghiên cứu ứng dụng AI kết hợp GIS phòng chống buôn lậu, gian lận thương mại, hàng giả

Nghệ An triển khai đề tài khoa học “Nghiên cứu đề xuất giải pháp ứng dụng trí tuệ nhân tạo (AI) kết hợp với hệ thống thông tin địa lý (GIS) trong quản lý, giám sát và phòng chống buôn lậu, gian lận thương mại, hàng giả”
Đà Nẵng định vị thành “điểm đến chiến lược” của cộng đồng web3 toàn cầu

Đà Nẵng định vị thành “điểm đến chiến lược” của cộng đồng web3 toàn cầu

Sáng 25/5, Hội nghị Nhà phát triển Web3 năm 2026 (Web3 Builders’ Summit – W3BS 2026) khai mạc tại Đà Nẵng. Sự kiện Hội nghị Nhà phát triển Web3 năm 2026 (Web3 Builders’ Summit – W3BS 2026) không đơn thuần là một diễn đàn công nghệ.
Tây Ninh xây dựng hệ sinh thái UAV chiến lược phát triển bền vững

Tây Ninh xây dựng hệ sinh thái UAV chiến lược phát triển bền vững

Trong bối cảnh chuyển đổi số và công nghệ chiến lược trở thành động lực tăng trưởng mới, tỉnh Tây Ninh đang xây dựng Chiến lược phát triển hệ sinh thái thiết bị bay không người lái (UAV) giai đoạn 2026-2030, tầm nhìn đến năm 2035. Chiến lược không chỉ hướng tới phát triển công nghệ UAV đồng bộ mà còn mở ra dư địa mới cho kinh tế số, logistics, nông nghiệp thông minh và quản lý đô thị hiện đại.
Đề xuất phạt tới 3 tỷ đồng hành vi mua bán dữ liệu cá nhân

Đề xuất phạt tới 3 tỷ đồng hành vi mua bán dữ liệu cá nhân

Bộ Công an đề xuất siết mạnh chế tài vi phạm an ninh mạng, trong đó hành vi mua bán dữ liệu cá nhân có thể bị phạt tới 3 tỷ đồng hoặc gấp 10 lần khoản thu bất hợp pháp. Nhiều biện pháp kỹ thuật bổ sung cũng được áp dụng.
Nvidia tiếp tục đặt cược vào Trung Quốc trong thị trường CPU AI 200 tỷ USD

Nvidia tiếp tục đặt cược vào Trung Quốc trong thị trường CPU AI 200 tỷ USD

Bất chấp các lệnh siết công nghệ từ Mỹ, Nvidia vẫn xem Trung Quốc là thị trường quan trọng trong chiến lược tăng trưởng dài hạn. Hãng đồng thời tăng tốc mở rộng sang mảng CPU AI với quy mô thị trường được dự báo lên tới 200 tỷ USD.
552.000 cuộc tấn công mạng một năm: Vì sao ôm bản sao lưu doanh nghiệp vẫn trắng tay?

552.000 cuộc tấn công mạng một năm: Vì sao ôm bản sao lưu doanh nghiệp vẫn trắng tay?

Khi bị tấn công mạng, mặc dù dữ liệu vẫn còn nguyên nhưng toàn bộ hệ thống bốc cháy, vận hành đóng băng, khách hàng quay lưng. Tại Vietnam Security Summit 2026, các chuyên gia cảnh báo: Sao lưu dữ liệu (backup) theo kiểu cũ đã không còn là chiếc phao cứu sinh an toàn cho doanh nghiệp trong kỷ nguyên AI tống tiền.
Thị trường công nghệ sinh học Việt Nam 1,5 tỷ USD: Khát vốn và nghẽn cơ chế

Thị trường công nghệ sinh học Việt Nam 1,5 tỷ USD: Khát vốn và nghẽn cơ chế

Sở hữu kho báu đa dạng sinh học và nguồn dược liệu đặc hữu phong phú, nhưng ngành công nghệ sinh học Việt Nam vẫn đang loay hoay ở vùng trũng của chuỗi giá trị toàn cầu. Việc thiếu hụt nghiêm trọng các phòng thí nghiệm đạt chuẩn quốc tế cùng sự chậm trễ trong hành lang pháp lý đối với các công nghệ lõi như chỉnh sửa gien đang biến lĩnh vực này thành một "gã khổng lồ ngủ quên".
Samsung phổ cập TV AI tại Việt Nam: Cuộc đua công nghệ trước thềm World Cup 2026

Samsung phổ cập TV AI tại Việt Nam: Cuộc đua công nghệ trước thềm World Cup 2026

Không còn là đặc quyền của phân khúc xa xỉ, công nghệ trí tuệ nhân tạo (AI) chính thức được Samsung "bình dân hóa" trên toàn bộ các dòng màn hình từ tầm trung đến cao cấp tại thị trường Việt Nam. Tại sự kiện Samsung Vision AI 2026 vừa diễn ra ở Hà Nội, ông lớn công nghệ này đã tung ra thế hệ AI TV mới tích hợp trợ lý đa nhiệm kết hợp giữa ba ông lớn Bixby, Gemini và Copilot. Bước đi chiến lược này được tung ra ngay trước thềm FIFA World Cup 2026, đánh trực tiếp vào nhu cầu nâng cấp thiết bị giải trí tại gia của người hâm mộ bóng đá Việt.
Nhà mạng lớn nhất Đông Nam Á tăng mạnh đầu tư AI và trung tâm dữ liệu

Nhà mạng lớn nhất Đông Nam Á tăng mạnh đầu tư AI và trung tâm dữ liệu

Tập đoàn viễn thông Singtel dự kiến nâng chi vốn lên khoảng 3 tỷ SGD trong năm tài chính mới, trong đó 1,2 tỷ SGD sẽ được dành cho AI và hạ tầng trung tâm dữ liệu, cho thấy cuộc đua xây dựng hạ tầng trí tuệ nhân tạo tại châu Á đang ngày càng nóng lên.