Thứ năm 11/06/2026 03:40
Hotline: 024.355.63.010
Kinh tế số

Ai đang dạy cho trí tuệ nhân tạo?

12/10/2020 00:00
Cụm từ AI (trí tuệ thông minh nhân tạo) thường tạo ở người nghe một hình ảnh về một hệ thống phức tạp, tân kỳ, hiện đại và hào nhoáng. Thế nên có ai bảo tù nhân ở Phần Lan hay công nhân giá rẻ ở Trung Quốc đang dạy cho AI học, ắt ta sẽ nghĩ đây chỉ l

Ảnh minh họa. Nguồn: Internet

Vainu, một công ty khởi nghiệp ở Phần Lan, đang xây dựng một cơ sở dữ liệu khổng lồ về tất cả mọi doanh nghiệp trên thế giới với tham vọng cung cấp dịch vụ giúp kết nối doanh nghiệp với đúng đối tác họ cần. Để cơ sở dữ liệu được cập nhật và có các thông tin riêng độc đáo, Vainu tổ chức để thuê người đọc hàng trăm ngàn bài viết về doanh nghiệp thu thập từ Internet và dán nhãn để miêu tả chúng, ví dụ bài này là về hãng Apple sản xuất iPhone, bài kia là về doanh nghiệp xuất khẩu táo.

Với các bài bằng tiếng Anh, Vainu sử dụng chợ nhân công giá rẻ trên mạng gọi là “Amazon Mechanical Turk” - một nơi doanh nghiệp thường dùng để thuê người làm những phần việc mang tính lặp đi lặp lại, loại công việc có thể làm từ xa. Nhưng với tiếng Phần Lan thì các chợ này bó tay, không tìm ra người chịu làm việc giá rẻ. Thế là Vainu bèn hợp tác với cơ quan quản lý tù nhân của Phần Lan, danh nghĩa là giúp tù nhân học nghề nhưng cũng là cách tận dụng lao động rẻ bằng cách trang bị máy tính cho hai nhà tù để tù nhân ngồi dán nhãn các bài báo cho họ. Sau khi có dữ liệu đã dán nhãn, Vainu mới dạy cho máy học các thuật toán phân tích dữ liệu.

Máy tính làm các phép tính rất nhanh, nhưng thiếu khả năng nhận biết nên thua ngay cả một em bé trong khía cạnh này. Các em bé nhìn một con béc-giê và một con chihuahua thì dù chúng khác nhau một trời một vực các em cũng biết chúng đều là chó. Máy tính thì phải dạy và không phải chỉ dạy từng hình, bằng không thì dù đã thấy hình chó mực nhưng sau đó thấy một con chó đốm nó sẽ bảo đó không phải là chó.

Trí tuệ thông minh nhân tạo cần một lượng dữ liệu khổng lồ để máy học, ví dụ đưa các phim chụp cộng hưởng từ (MRI) vào máy kèm theo là chẩn đoán đúng của các bác sĩ. Từ hàng ngàn, hàng chục ngàn phim MRI có chẩn đoán của con người, máy sẽ học để sau đó nhìn vào phim bắt chước đưa ra chẩn đoán. Vì máy không bị môi trường bên ngoài chi phối, lại học từ các bác sĩ giỏi nhất, rút kinh nghiệm từ các chẩn đoán sai, nên dần dần máy sẽ “thông minh” hơn người, tỷ lệ chẩn đoán chính xác ngày càng cao.

Nhưng, như chúng ta đã hình dung phần nào, công đoạn quan trọng đầu tiên là máy phải có hình ảnh từ phim MRI và các nhãn chẩn đoán nó mới học được. Công đoạn đưa phim vào bộ nhớ của máy, gõ các chẩn đoán là công đoạn cần nhiều lao động mà các lao động này không cần trình độ học vấn cao, chỉ cần làm đúng một số thao tác được huấn luyện. Đây là loại công việc nhàm chán, tiền công lại rẻ nên phù hợp cho các thị trường như Trung Quốc.

Ở một địa điểm được mệnh danh là “nông trại dữ liệu”, nhiều công nhân mở các file hình và gõ các nhãn miêu tả chúng; từ các cụm từ định danh như “con chó”, “con mèo” đến các dòng chi tiết hơn như “đây là hình một đứa bé đang tập đi”... Ngành nhập dữ liệu như thế đang là ngành thu hút nhiều lao động ở Trung Quốc một khi các ngành lắp ráp điện tử hay may mặc bị chuyển đi nước khác. Các doanh nghiệp khởi nghiệp tỏa ra lập các “nông trại dữ liệu” ở các vùng giá lao động còn rẻ để dán nhãn cho hàng triệu triệu tấm ảnh và hàng triệu triệu giờ video. Loại công việc cần sự cần cù, nhẫn nại này đang giúp Trung Quốc có một lợi thế trong lĩnh vực AI so với Mỹ và châu Âu.

Chẳng hạn một siêu thị xây dựng được hệ thống tính tiền tự động, nhưng để hệ thống hoạt động cần đính thẻ cho khoảng 20.000 hình ảnh hàng hóa nhìn từ đủ góc cạnh; tức cũng là cái bánh nhưng lấp ló sau hộp kem thì máy cũng phải nhận ra. Thế là siêu thị phải thuê một “nông trại dữ liệu” làm gấp trong ba ngày, tiền công chỉ vài ngàn đô la. Một nơi khác thuê đính thẻ cho ba triệu tấm hình chụp miệng người.

Ở đây, chính phủ và doanh nghiệp Trung Quốc có một lợi thế khác nữa, đó là họ đang tiếp cận kho dữ liệu khổng lồ của một xã hội 1,4 tỉ dân, nơi tính riêng tư của thông tin không được coi trọng cho lắm. Ở châu Âu, muốn thu thập dữ liệu phải xin phép người dùng một cách rõ ràng, ai vi phạm dễ bị kiện cáo và chịu phạt những khoản tiền lớn. Chính vì thế có nhiều dự báo Trung Quốc sẽ dẫn đầu thế giới trong lĩnh vực AI trước năm 2030, một phần nào đó là do mọi AI đều được xây dựng dựa trên lao động mang tính thủ công của con người.

Nguyễn Vũ

Tin bài khác
Bắt tay Infineon, VinRobotics  quyết giành vé vào kỷ nguyên AI vật lý

Bắt tay Infineon, VinRobotics quyết giành vé vào kỷ nguyên AI vật lý

Sự kiện VinRobotics công bố ký kết Biên bản ghi nhớ hợp tác với Infineon Technologies AG không đơn thuần là một cái bắt tay thương mại thông thường giữa hai doanh nghiệp. Trong bối cảnh làn sóng tự động hóa và trí tuệ nhân tạo đang định hình lại nền kinh tế số, việc công ty công nghệ của Tập đoàn Vingroup chủ động liên minh với gã khổng lồ bán dẫn toàn cầu chính là phát súng mở màn cho chiến dịch giành quyền làm chủ công nghệ lõi mang tầm quốc tế, khẳng định vị thế ngày càng rõ nét của Việt Nam trong chuỗi cung ứng công nghệ cao toàn cầu.
Vì sao Google tăng giá YouTube Premium trên toàn cầu?

Vì sao Google tăng giá YouTube Premium trên toàn cầu?

Google đã chính thức áp dụng mức giá mới đối với dịch vụ YouTube Premium từ ngày 8/6, khiến chi phí đăng ký tăng thêm từ 1-4 USD mỗi tháng tùy gói sử dụng.
Thủ tướng Anh yêu cầu các hãng công nghệ tăng biện pháp bảo vệ trẻ em trên thiết bị số

Thủ tướng Anh yêu cầu các hãng công nghệ tăng biện pháp bảo vệ trẻ em trên thiết bị số

Chính phủ Anh đang gia tăng sức ép đối với các tập đoàn công nghệ lớn nhằm sớm triển khai công cụ bảo vệ trẻ em trên điện thoại và máy tính bảng, trong bối cảnh nhiều quốc gia châu Âu cũng đẩy mạnh kiểm soát việc trẻ vị thành niên tiếp cận nội dung độc hại trên không gian mạng.
Trung Quốc cảnh báo nguy cơ rò rỉ dữ liệu từ các nền tảng trung gian AI

Trung Quốc cảnh báo nguy cơ rò rỉ dữ liệu từ các nền tảng trung gian AI

Trung Quốc cảnh báo các nền tảng trung gian AI có thể trở thành mắt xích làm gia tăng nguy cơ rò rỉ dữ liệu, lộ thông tin cá nhân và phát sinh các rủi ro an ninh mạng nếu không được quản lý chặt chẽ.
Nvidia bắt tay SK Hynix, Naver và Doosan để mở rộng hạ tầng AI tại Hàn Quốc

Nvidia bắt tay SK Hynix, Naver và Doosan để mở rộng hạ tầng AI tại Hàn Quốc

Các thỏa thuận mới với SK Hynix, Naver và Doosan cho thấy Nvidia đang đẩy mạnh hiện diện tại Hàn Quốc - một mắt xích quan trọng trong chuỗi cung ứng bán dẫn toàn cầu - trong bối cảnh cuộc đua đầu tư trung tâm dữ liệu và hạ tầng AI tiếp tục tăng tốc.
Threads: Kênh đối thoại mới doanh nghiệp không nên bỏ lỡ

Threads: Kênh đối thoại mới doanh nghiệp không nên bỏ lỡ

Threads đang nổi lên như nền tảng đối thoại tiềm năng, giúp doanh nghiệp xây dựng thương hiệu, kết nối khách hàng và mở rộng hoạt động marketing số.
Thanh toán xuyên biên giới trên máy POS Payoo

Thanh toán xuyên biên giới trên máy POS Payoo

VietQRGlobal cho phép du khách quốc tế có thể thanh toán xuyên biên giới trên máy POS Payoo bằng chính ứng dụng ngân hàng, hoặc ví điện tử của quốc gia họ…
Thanh toán số tăng tốc, Việt Nam hướng tới giá trị giao dịch không tiền mặt gấp 30 lần GDP

Thanh toán số tăng tốc, Việt Nam hướng tới giá trị giao dịch không tiền mặt gấp 30 lần GDP

Thanh toán số đang trở thành hạ tầng thiết yếu của nền kinh tế số, khi giá trị giao dịch không dùng tiền mặt tại Việt Nam đã đạt mức gấp 28 lần GDP và tiếp tục tăng trưởng mạnh trong những tháng đầu năm 2026. Đây là một trong những thông tin đáng chú ý được đưa ra tại Hội thảo “Thanh toán thông minh trong kỷ nguyên số” diễn ra ngày 6/6 tại TP.HCM.
CEO Nvidia: Robot sẽ là động lực tăng trưởng mới của Hàn Quốc

CEO Nvidia: Robot sẽ là động lực tăng trưởng mới của Hàn Quốc

CEO Nvidia Jensen Huang cho rằng robot sẽ trở thành ngành công nghiệp tăng trưởng lớn tiếp theo của Hàn Quốc, đồng thời cho biết Nvidia sẽ mở rộng hợp tác về AI, robot và sản xuất tiên tiến với các doanh nghiệp nước này.
Amazon ra mắt robot AI thế hệ mới, tăng tốc tự động hóa kho hàng

Amazon ra mắt robot AI thế hệ mới, tăng tốc tự động hóa kho hàng

Theo Reuters, Amazon vừa giới thiệu thế hệ robot di động mới tích hợp trí tuệ nhân tạo (AI), có khả năng tiếp nhận và phản hồi các chỉ dẫn bằng ngôn ngữ tự nhiên của con người.
Ứng dụng công nghệ để nâng cao hiệu quả giám sát giao dịch thương mại điện tử

Ứng dụng công nghệ để nâng cao hiệu quả giám sát giao dịch thương mại điện tử

Thương mại điện tử phát triển nhanh chóng mang lại nhiều tiện ích nhưng cũng đặt ra không ít thách thức về kiểm soát chất lượng hàng hóa và xử lý tranh chấp. Việc tăng cường định danh người bán, chia sẻ dữ liệu liên thông giữa các cơ quan quản lý và áp dụng quy trình xử lý khiếu nại nghiêm ngặt được xem là những giải pháp then chốt nhằm thiết lập môi trường kinh doanh trực tuyến minh bạch.
Anh siết quản lý AI, yêu cầu Google tăng quyền kiểm soát nội dung cho website

Anh siết quản lý AI, yêu cầu Google tăng quyền kiểm soát nội dung cho website

Cơ quan quản lý cạnh tranh Anh đề xuất Google cho phép các website lựa chọn không đưa nội dung vào các tính năng tìm kiếm sử dụng AI nhằm bảo vệ quyền lợi của nhà xuất bản và đơn vị sáng tạo nội dung.
ROAD TO AI 2026 – Doanh nghiệp đặt hàng tìm thế hệ kỹ sư AI tương lai

ROAD TO AI 2026 – Doanh nghiệp đặt hàng tìm thế hệ kỹ sư AI tương lai

Trong bối cảnh Trí tuệ nhân tạo (AI) đang trở thành động lực quan trọng thúc đẩy tăng trưởng kinh tế và đổi mới sáng tạo trên toàn cầu, việc đào tạo nguồn nhân lực AI có khả năng giải quyết các bài toán thực tiễn đang trở thành yêu cầu cấp thiết đối với Việt Nam.
YouTube giảm quảng cáo trong livestream khi tương tác người xem tăng cao

YouTube giảm quảng cáo trong livestream khi tương tác người xem tăng cao

YouTube vừa triển khai tính năng tự động hạn chế quảng cáo trong các buổi phát trực tiếp có lượng tương tác lớn, đồng thời bổ sung thêm công cụ hỗ trợ kiếm tiền cho nhà sáng tạo nội dung.
OpenAI mở rộng Codex với loạt công cụ mới cho môi trường doanh nghiệp

OpenAI mở rộng Codex với loạt công cụ mới cho môi trường doanh nghiệp

OpenAI vừa bổ sung nhiều tính năng mới cho Codex, hướng tới nhóm người dùng doanh nghiệp và lao động tri thức ngoài lĩnh vực lập trình.