Thứ tư 06/05/2026 20:11
Hotline: 024.355.63.010
Kinh tế số

Ai đang dạy cho trí tuệ nhân tạo?

12/10/2020 00:00
Cụm từ AI (trí tuệ thông minh nhân tạo) thường tạo ở người nghe một hình ảnh về một hệ thống phức tạp, tân kỳ, hiện đại và hào nhoáng. Thế nên có ai bảo tù nhân ở Phần Lan hay công nhân giá rẻ ở Trung Quốc đang dạy cho AI học, ắt ta sẽ nghĩ đây chỉ l

Ảnh minh họa. Nguồn: Internet

Vainu, một công ty khởi nghiệp ở Phần Lan, đang xây dựng một cơ sở dữ liệu khổng lồ về tất cả mọi doanh nghiệp trên thế giới với tham vọng cung cấp dịch vụ giúp kết nối doanh nghiệp với đúng đối tác họ cần. Để cơ sở dữ liệu được cập nhật và có các thông tin riêng độc đáo, Vainu tổ chức để thuê người đọc hàng trăm ngàn bài viết về doanh nghiệp thu thập từ Internet và dán nhãn để miêu tả chúng, ví dụ bài này là về hãng Apple sản xuất iPhone, bài kia là về doanh nghiệp xuất khẩu táo.

Với các bài bằng tiếng Anh, Vainu sử dụng chợ nhân công giá rẻ trên mạng gọi là “Amazon Mechanical Turk” - một nơi doanh nghiệp thường dùng để thuê người làm những phần việc mang tính lặp đi lặp lại, loại công việc có thể làm từ xa. Nhưng với tiếng Phần Lan thì các chợ này bó tay, không tìm ra người chịu làm việc giá rẻ. Thế là Vainu bèn hợp tác với cơ quan quản lý tù nhân của Phần Lan, danh nghĩa là giúp tù nhân học nghề nhưng cũng là cách tận dụng lao động rẻ bằng cách trang bị máy tính cho hai nhà tù để tù nhân ngồi dán nhãn các bài báo cho họ. Sau khi có dữ liệu đã dán nhãn, Vainu mới dạy cho máy học các thuật toán phân tích dữ liệu.

Máy tính làm các phép tính rất nhanh, nhưng thiếu khả năng nhận biết nên thua ngay cả một em bé trong khía cạnh này. Các em bé nhìn một con béc-giê và một con chihuahua thì dù chúng khác nhau một trời một vực các em cũng biết chúng đều là chó. Máy tính thì phải dạy và không phải chỉ dạy từng hình, bằng không thì dù đã thấy hình chó mực nhưng sau đó thấy một con chó đốm nó sẽ bảo đó không phải là chó.

Trí tuệ thông minh nhân tạo cần một lượng dữ liệu khổng lồ để máy học, ví dụ đưa các phim chụp cộng hưởng từ (MRI) vào máy kèm theo là chẩn đoán đúng của các bác sĩ. Từ hàng ngàn, hàng chục ngàn phim MRI có chẩn đoán của con người, máy sẽ học để sau đó nhìn vào phim bắt chước đưa ra chẩn đoán. Vì máy không bị môi trường bên ngoài chi phối, lại học từ các bác sĩ giỏi nhất, rút kinh nghiệm từ các chẩn đoán sai, nên dần dần máy sẽ “thông minh” hơn người, tỷ lệ chẩn đoán chính xác ngày càng cao.

Nhưng, như chúng ta đã hình dung phần nào, công đoạn quan trọng đầu tiên là máy phải có hình ảnh từ phim MRI và các nhãn chẩn đoán nó mới học được. Công đoạn đưa phim vào bộ nhớ của máy, gõ các chẩn đoán là công đoạn cần nhiều lao động mà các lao động này không cần trình độ học vấn cao, chỉ cần làm đúng một số thao tác được huấn luyện. Đây là loại công việc nhàm chán, tiền công lại rẻ nên phù hợp cho các thị trường như Trung Quốc.

Ở một địa điểm được mệnh danh là “nông trại dữ liệu”, nhiều công nhân mở các file hình và gõ các nhãn miêu tả chúng; từ các cụm từ định danh như “con chó”, “con mèo” đến các dòng chi tiết hơn như “đây là hình một đứa bé đang tập đi”... Ngành nhập dữ liệu như thế đang là ngành thu hút nhiều lao động ở Trung Quốc một khi các ngành lắp ráp điện tử hay may mặc bị chuyển đi nước khác. Các doanh nghiệp khởi nghiệp tỏa ra lập các “nông trại dữ liệu” ở các vùng giá lao động còn rẻ để dán nhãn cho hàng triệu triệu tấm ảnh và hàng triệu triệu giờ video. Loại công việc cần sự cần cù, nhẫn nại này đang giúp Trung Quốc có một lợi thế trong lĩnh vực AI so với Mỹ và châu Âu.

Chẳng hạn một siêu thị xây dựng được hệ thống tính tiền tự động, nhưng để hệ thống hoạt động cần đính thẻ cho khoảng 20.000 hình ảnh hàng hóa nhìn từ đủ góc cạnh; tức cũng là cái bánh nhưng lấp ló sau hộp kem thì máy cũng phải nhận ra. Thế là siêu thị phải thuê một “nông trại dữ liệu” làm gấp trong ba ngày, tiền công chỉ vài ngàn đô la. Một nơi khác thuê đính thẻ cho ba triệu tấm hình chụp miệng người.

Ở đây, chính phủ và doanh nghiệp Trung Quốc có một lợi thế khác nữa, đó là họ đang tiếp cận kho dữ liệu khổng lồ của một xã hội 1,4 tỉ dân, nơi tính riêng tư của thông tin không được coi trọng cho lắm. Ở châu Âu, muốn thu thập dữ liệu phải xin phép người dùng một cách rõ ràng, ai vi phạm dễ bị kiện cáo và chịu phạt những khoản tiền lớn. Chính vì thế có nhiều dự báo Trung Quốc sẽ dẫn đầu thế giới trong lĩnh vực AI trước năm 2030, một phần nào đó là do mọi AI đều được xây dựng dựa trên lao động mang tính thủ công của con người.

Nguyễn Vũ

Tin bài khác
10 nhóm công nghệ chiến lược định hình trụ cột tăng trưởng mới từ 1/7/2026

10 nhóm công nghệ chiến lược định hình trụ cột tăng trưởng mới từ 1/7/2026

Quyết định số 21/2026/QĐ-TTg do Hồ Quốc Dũng ký ban hành đã xác lập 10 nhóm công nghệ chiến lược cùng 30 sản phẩm trọng điểm, tạo nền tảng thúc đẩy đổi mới sáng tạo, nâng cao năng lực cạnh tranh quốc gia và mở ra không gian phát triển mới cho doanh nghiệp.
Apple trao đổi sản xuất vi xử lý với Intel và Samsung

Apple trao đổi sản xuất vi xử lý với Intel và Samsung

Tập đoàn Apple ngày 4/5 vừa qua đã có cuộc trao đổi sơ bộ và khảo sát cơ sở vật chất ở các ông lớn Samsung và Intel nhằm hợp tác sản xuất bộ vi xử lý cho các sản phẩm của hãng.
Google Labs chọn Việt Nam đặt Applied AI Lab đầu tiên

Google Labs chọn Việt Nam đặt Applied AI Lab đầu tiên

Lần đầu tiên tại Việt Nam, một phòng thí nghiệm AI ứng dụng (Applied AI Lab) tiêu chuẩn toàn cầu được thiết lập nhờ sự bắt tay giữa Google Labs, VNG Group và Đại học Quốc gia TP. HCM. Sự kiện này không chỉ xóa bỏ rào cản về nguồn lực công nghệ mà còn đặt nền móng để Việt Nam hiện thực hóa mục tiêu trở thành trung tâm đổi mới sáng tạo hàng đầu ASEAN vào năm 2030.
Sóng điện từ của trạm phát sóng thông tin di động BTS: Hiểu đúng để an tâm trong cuộc sống và sinh hoạt

Sóng điện từ của trạm phát sóng thông tin di động BTS: Hiểu đúng để an tâm trong cuộc sống và sinh hoạt

Hệ thống thông tin di động không chỉ là công cụ liên lạc mà còn là động lực thúc đẩy sự tiến bộ xã hội, kinh tế và văn hóa trong kỷ nguyên số. Với sự phát triển không ngừng của công nghệ, vai trò của nó ngày càng trở nên quan trọng và không thể thiếu trong đời sống hiện đại.
Hợp tác Việt - Nhật: Nâng cấp "mắt thần" vệ tinh ALOS-4 giám sát tài nguyên

Hợp tác Việt - Nhật: Nâng cấp "mắt thần" vệ tinh ALOS-4 giám sát tài nguyên

Trong khuôn khổ chuyến thăm của Thủ tướng Nhật Bản Takaichi Sanae, VNSC và JAXA đã ký kết thỏa thuận quan trọng về trao đổi dữ liệu vệ tinh. Bước đi này không chỉ đảm bảo tính liên tục của nguồn tin mà còn mở ra đặc quyền tiếp cận công nghệ radar ALOS-4 giúp đột phá năng lượng quan trắc thiên tai và nông nghiệp.
Bị rút sạch tiền trong tài khoản vì sập bẫy lừa đảo cài đặt loa thông báo số dư

Bị rút sạch tiền trong tài khoản vì sập bẫy lừa đảo cài đặt loa thông báo số dư

Công an TP. Đà Nẵng vừa phát đi cảnh báo khẩn về một thủ đoạn lừa đảo công nghệ cao mới. Bằng cách giả danh nhân viên hỗ trợ kỹ thuật cài đặt loa thông báo biến động số dư, đối tượng đã dẫn dụ nạn nhân thực hiện quy trình eKYC trái phép, từ đó chiếm quyền kiểm soát tài khoản ngân hàng và thực hiện hàng loạt lệnh chuyển tiền chớp nhoáng.
Bí mật sau hợp đồng 9.000 tỷ của Hyundai Rotem và tham vọng đường sắt Việt Nam

Bí mật sau hợp đồng 9.000 tỷ của Hyundai Rotem và tham vọng đường sắt Việt Nam

Từ việc đứng trên vai "khổng lồ" Alstom đến khi tự chủ dòng tàu KTX-Cheongryong, hành trình của Hyundai Rotem là bài học đắt giá cho Việt Nam. Cú bắt tay với THACO không chỉ dừng lại ở Metro số 2 mà là "bàn đạp" để nội địa hóa toàn diện ngành công nghiệp đường sắt tốc độ cao.
Doanh nghiệp Việt Nam đối mặt làn sóng tấn công mạng ngày càng tinh vi

Doanh nghiệp Việt Nam đối mặt làn sóng tấn công mạng ngày càng tinh vi

Không chỉ gia tăng về số lượng, các cuộc tấn công mạng còn liên tục biến đổi, nhắm trực tiếp vào điểm yếu của doanh nghiệp. Nhận diện đúng rủi ro và cách phòng tránh đang trở thành yêu cầu cấp thiết.
Doanh nghiệp vận tải giải bài toán chi phí khi Hà Nội siết xe vào vùng phát thải thấp

Doanh nghiệp vận tải giải bài toán chi phí khi Hà Nội siết xe vào vùng phát thải thấp

Việc Hà Nội bắt đầu triển khai hệ thống camera tự động nhận diện phương tiện để kiểm soát vùng phát thải thấp đang thu hút sự chú ý lớn. Không chỉ là câu chuyện môi trường, chính sách này còn tác động trực tiếp đến hoạt động của doanh nghiệp vận tải, logistics và nhiều ngành kinh doanh phụ thuộc vào phương tiện cơ giới.
Zalo chặn chụp màn hình ảnh đại diện, tăng lớp bảo vệ quyền riêng tư người dùng

Zalo chặn chụp màn hình ảnh đại diện, tăng lớp bảo vệ quyền riêng tư người dùng

Zalo vừa bổ sung tính năng ngăn chụp hoặc quay màn hình ảnh đại diện của người dùng trên ứng dụng di động, tiếp tục đẩy mạnh định vị “riêng tư là cốt lõi” trong bối cảnh bảo mật dữ liệu cá nhân ngày càng được quan tâm. Tuy vậy, khả năng bảo vệ hiện vẫn chưa đồng bộ trên mọi nền tảng, đặt ra yêu cầu tiếp tục hoàn thiện trải nghiệm và độ an toàn cho người dùng.
TMT-EGreen lên kế hoạch 30.000 trụ sạc CCS2 toàn quốc đến năm 2030

TMT-EGreen lên kế hoạch 30.000 trụ sạc CCS2 toàn quốc đến năm 2030

Trong bối cảnh xe điện tăng trưởng nhanh tại Việt Nam, hạ tầng sạc đang trở thành yếu tố then chốt. TMT-EGreen – đơn vị thuộc TMT Group – đã công bố kế hoạch đầu tư quy mô lớn với mục tiêu xây dựng 30.000 trụ sạc tiêu chuẩn châu Âu CCS2 trên toàn quốc đến năm 2030, đồng thời bắt đầu triển khai giai đoạn đầu từ năm 2026.
Những điểm yếu khiến doanh nghiệp Việt Nam hứng chịu 46% vụ tấn công mạng

Những điểm yếu khiến doanh nghiệp Việt Nam hứng chịu 46% vụ tấn công mạng

Không chỉ dẫn đầu khu vực về số vụ tấn công mạng, doanh nghiệp Việt Nam còn đối mặt những lỗ hổng kéo dài từ con người đến hệ thống, khiến rủi ro tài chính và dữ liệu ngày càng lớn.
VNeID thêm chức năng tố giác tội phạm: Người dân cần biết gì để dùng đúng?

VNeID thêm chức năng tố giác tội phạm: Người dân cần biết gì để dùng đúng?

VNeID đang trở thành một kênh tiếp nhận tố giác, tin báo về tội phạm ngay trên điện thoại, giúp người dân phản ánh vụ việc nhanh hơn, kín hơn và theo dõi tiến độ xử lý. Nhưng cũng chính lúc ứng dụng này ngày càng phổ biến, các chiêu lừa đảo mạo danh cơ quan chức năng, yêu cầu “cập nhật VNeID”, “đồng bộ thông tin”, “xác thực lại dữ liệu” lại xuất hiện dày hơn, nhắm thẳng vào tiền trong tài khoản và dữ liệu cá nhân của người dùng.
Không xác thực SIM ngay, thuê bao có thể bị khóa từ hôm nay

Không xác thực SIM ngay, thuê bao có thể bị khóa từ hôm nay

Từ ngày 15/4/2026, quy định mới về xác thực thông tin thuê bao di động bằng dữ liệu định danh và ảnh khuôn mặt chính thức có hiệu lực. Với những thuê bao chưa chuẩn hóa, nhất là số đăng ký bằng CMND 9 số, nguy cơ bị tạm dừng một chiều, khóa hai chiều rồi chấm dứt hợp đồng là hoàn toàn có thể xảy ra nếu không sớm thực hiện.
Australia muốn hợp tác phát triển Fintech tại Việt Nam

Australia muốn hợp tác phát triển Fintech tại Việt Nam

Việt Nam đang tăng trưởng mạnh mẽ về thanh toán số, tài chính di động và xu hướng ứng dụng trí tuệ nhân tạo (AI) trong lĩnh vực ngân hàng. Điều này tạo ra nhu cầu lớn về các giải pháp công nghệ nhằm nâng cao quản trị rủi ro, bảo mật dữ liệu và tuân thủ pháp lý.