Thứ tư 20/05/2026 21:10
Hotline: 024.355.63.010
Kinh tế số

Ai đang dạy cho trí tuệ nhân tạo?

12/10/2020 00:00
Cụm từ AI (trí tuệ thông minh nhân tạo) thường tạo ở người nghe một hình ảnh về một hệ thống phức tạp, tân kỳ, hiện đại và hào nhoáng. Thế nên có ai bảo tù nhân ở Phần Lan hay công nhân giá rẻ ở Trung Quốc đang dạy cho AI học, ắt ta sẽ nghĩ đây chỉ l

Ảnh minh họa. Nguồn: Internet

Vainu, một công ty khởi nghiệp ở Phần Lan, đang xây dựng một cơ sở dữ liệu khổng lồ về tất cả mọi doanh nghiệp trên thế giới với tham vọng cung cấp dịch vụ giúp kết nối doanh nghiệp với đúng đối tác họ cần. Để cơ sở dữ liệu được cập nhật và có các thông tin riêng độc đáo, Vainu tổ chức để thuê người đọc hàng trăm ngàn bài viết về doanh nghiệp thu thập từ Internet và dán nhãn để miêu tả chúng, ví dụ bài này là về hãng Apple sản xuất iPhone, bài kia là về doanh nghiệp xuất khẩu táo.

Với các bài bằng tiếng Anh, Vainu sử dụng chợ nhân công giá rẻ trên mạng gọi là “Amazon Mechanical Turk” - một nơi doanh nghiệp thường dùng để thuê người làm những phần việc mang tính lặp đi lặp lại, loại công việc có thể làm từ xa. Nhưng với tiếng Phần Lan thì các chợ này bó tay, không tìm ra người chịu làm việc giá rẻ. Thế là Vainu bèn hợp tác với cơ quan quản lý tù nhân của Phần Lan, danh nghĩa là giúp tù nhân học nghề nhưng cũng là cách tận dụng lao động rẻ bằng cách trang bị máy tính cho hai nhà tù để tù nhân ngồi dán nhãn các bài báo cho họ. Sau khi có dữ liệu đã dán nhãn, Vainu mới dạy cho máy học các thuật toán phân tích dữ liệu.

Máy tính làm các phép tính rất nhanh, nhưng thiếu khả năng nhận biết nên thua ngay cả một em bé trong khía cạnh này. Các em bé nhìn một con béc-giê và một con chihuahua thì dù chúng khác nhau một trời một vực các em cũng biết chúng đều là chó. Máy tính thì phải dạy và không phải chỉ dạy từng hình, bằng không thì dù đã thấy hình chó mực nhưng sau đó thấy một con chó đốm nó sẽ bảo đó không phải là chó.

Trí tuệ thông minh nhân tạo cần một lượng dữ liệu khổng lồ để máy học, ví dụ đưa các phim chụp cộng hưởng từ (MRI) vào máy kèm theo là chẩn đoán đúng của các bác sĩ. Từ hàng ngàn, hàng chục ngàn phim MRI có chẩn đoán của con người, máy sẽ học để sau đó nhìn vào phim bắt chước đưa ra chẩn đoán. Vì máy không bị môi trường bên ngoài chi phối, lại học từ các bác sĩ giỏi nhất, rút kinh nghiệm từ các chẩn đoán sai, nên dần dần máy sẽ “thông minh” hơn người, tỷ lệ chẩn đoán chính xác ngày càng cao.

Nhưng, như chúng ta đã hình dung phần nào, công đoạn quan trọng đầu tiên là máy phải có hình ảnh từ phim MRI và các nhãn chẩn đoán nó mới học được. Công đoạn đưa phim vào bộ nhớ của máy, gõ các chẩn đoán là công đoạn cần nhiều lao động mà các lao động này không cần trình độ học vấn cao, chỉ cần làm đúng một số thao tác được huấn luyện. Đây là loại công việc nhàm chán, tiền công lại rẻ nên phù hợp cho các thị trường như Trung Quốc.

Ở một địa điểm được mệnh danh là “nông trại dữ liệu”, nhiều công nhân mở các file hình và gõ các nhãn miêu tả chúng; từ các cụm từ định danh như “con chó”, “con mèo” đến các dòng chi tiết hơn như “đây là hình một đứa bé đang tập đi”... Ngành nhập dữ liệu như thế đang là ngành thu hút nhiều lao động ở Trung Quốc một khi các ngành lắp ráp điện tử hay may mặc bị chuyển đi nước khác. Các doanh nghiệp khởi nghiệp tỏa ra lập các “nông trại dữ liệu” ở các vùng giá lao động còn rẻ để dán nhãn cho hàng triệu triệu tấm ảnh và hàng triệu triệu giờ video. Loại công việc cần sự cần cù, nhẫn nại này đang giúp Trung Quốc có một lợi thế trong lĩnh vực AI so với Mỹ và châu Âu.

Chẳng hạn một siêu thị xây dựng được hệ thống tính tiền tự động, nhưng để hệ thống hoạt động cần đính thẻ cho khoảng 20.000 hình ảnh hàng hóa nhìn từ đủ góc cạnh; tức cũng là cái bánh nhưng lấp ló sau hộp kem thì máy cũng phải nhận ra. Thế là siêu thị phải thuê một “nông trại dữ liệu” làm gấp trong ba ngày, tiền công chỉ vài ngàn đô la. Một nơi khác thuê đính thẻ cho ba triệu tấm hình chụp miệng người.

Ở đây, chính phủ và doanh nghiệp Trung Quốc có một lợi thế khác nữa, đó là họ đang tiếp cận kho dữ liệu khổng lồ của một xã hội 1,4 tỉ dân, nơi tính riêng tư của thông tin không được coi trọng cho lắm. Ở châu Âu, muốn thu thập dữ liệu phải xin phép người dùng một cách rõ ràng, ai vi phạm dễ bị kiện cáo và chịu phạt những khoản tiền lớn. Chính vì thế có nhiều dự báo Trung Quốc sẽ dẫn đầu thế giới trong lĩnh vực AI trước năm 2030, một phần nào đó là do mọi AI đều được xây dựng dựa trên lao động mang tính thủ công của con người.

Nguyễn Vũ

Tin bài khác
TP. Hồ Chí Minh lần đầu lọt Top 100 hệ sinh thái khởi nghiệp toàn cầu, vượt mục tiêu trước 4 năm

TP. Hồ Chí Minh lần đầu lọt Top 100 hệ sinh thái khởi nghiệp toàn cầu, vượt mục tiêu trước 4 năm

TP. Hồ Chí Minh lần đầu tiên góp mặt trong Top 100 hệ sinh thái khởi nghiệp sáng tạo năng động nhất thế giới, đánh dấu cột mốc quan trọng trong hành trình xây dựng đô thị đổi mới sáng tạo và khẳng định vị thế đầu tàu công nghệ, khởi nghiệp của Việt Nam trên bản đồ toàn cầu.
Google và Blackstone hợp tác: Doanh nghiệp toàn cầu sẽ vận hành ra sao?

Google và Blackstone hợp tác: Doanh nghiệp toàn cầu sẽ vận hành ra sao?

Có một câu hỏi rất đáng suy nghĩ đang xuất hiện trong giới công nghệ và quản trị toàn cầu, nếu một ngày nào đó doanh nghiệp không còn phải mua phần mềm, không cần xây trung tâm dữ liệu, không cần đầu tư đội ngũ kỹ thuật khổng lồ mà chỉ cần bật một “công tắc” để sử dụng trí tuệ nhân tạo như sử dụng điện, điều gì sẽ xảy ra?
Apple tăng tốc AI trên iOS 27, bổ sung loạt công cụ viết thông minh cho Siri

Apple tăng tốc AI trên iOS 27, bổ sung loạt công cụ viết thông minh cho Siri

Theo Bloomberg, Apple đang chuẩn bị nâng cấp mạnh mẽ Siri và bộ Writing Tools trên iOS 27, với nhiều tính năng AI hỗ trợ viết, chỉnh sửa và kiểm tra ngữ pháp ngay trên thiết bị.
Meta lên kế hoạch tái cấu trúc quy mô lớn, cắt giảm 10% nhân sự toàn cầu

Meta lên kế hoạch tái cấu trúc quy mô lớn, cắt giảm 10% nhân sự toàn cầu

Meta dự kiến sa thải khoảng 10% nhân sự toàn cầu, đồng thời điều chuyển 7.000 nhân viên sang các dự án AI trong kế hoạch tái cấu trúc quy mô lớn đang gây nhiều tranh cãi nội bộ.
Cuộc đua toàn cầu mới bắt đầu khi quyền lực thế kỷ 21 không còn nằm ở dầu mỏ

Cuộc đua toàn cầu mới bắt đầu khi quyền lực thế kỷ 21 không còn nằm ở dầu mỏ

Trong nhiều năm, khi nhắc tới cạnh tranh Mỹ – Trung, thế giới thường nghĩ tới chiến tranh thương mại, thuế quan hay căng thẳng địa chính trị. Nhưng hiện nay, một nỗi lo lớn hơn nhiều đang âm thầm xuất hiện trong giới công nghệ, tài chính và hoạch định chiến lược toàn cầu. Quyền lực thế kỷ 21 không còn nằm ở dầu mỏ mà nằm ở đâu?
Bảo vệ dữ liệu cá nhân trước làn sóng lừa đảo công nghệ AI

Bảo vệ dữ liệu cá nhân trước làn sóng lừa đảo công nghệ AI

Trong kỷ nguyên số, dữ liệu đang trở thành loại “tài sản mới” có giá trị không thua kém vốn, tài nguyên hay nhân lực. Với lĩnh vực ngân hàng – tài chính.
Techmart AI 2026: Doanh nghiệp tăng tốc ứng dụng trí tuệ nhân tạo vào sản xuất và quản trị

Techmart AI 2026: Doanh nghiệp tăng tốc ứng dụng trí tuệ nhân tạo vào sản xuất và quản trị

Trong bối cảnh AI được xác định là công nghệ chiến lược quốc gia, Techmart chuyên ngành “Sản phẩm ứng dụng trí tuệ nhân tạo” đang trở thành điểm kết nối giữa doanh nghiệp, viện nghiên cứu và nhà đầu tư nhằm thúc đẩy thương mại hóa các giải pháp AI tại Việt Nam.
BizTech và AI đang tái định nghĩa năng lực cạnh tranh doanh nghiệp

BizTech và AI đang tái định nghĩa năng lực cạnh tranh doanh nghiệp

BizTech và AI đang tái định nghĩa năng lực cạnh tranh doanh nghiệp, trong làn sóng chuyển đổi số toàn cầu, công nghệ không còn đứng phía sau để “hỗ trợ” vận hành doanh nghiệp mà đang dần trở thành lõi trung tâm quyết định năng lực cạnh tranh, tốc độ tăng trưởng và khả năng thích ứng của doanh nghiệp trong nền kinh tế số.
Phỏng vấn 4.400 CEO toàn cầu nhưng kết quả thật bất ngờ về ứng dụng AI hiệu quả

Phỏng vấn 4.400 CEO toàn cầu nhưng kết quả thật bất ngờ về ứng dụng AI hiệu quả

Trong khi phần lớn thế giới vẫn nói về AI như động lực của một cuộc cách mạng công nghệ, thì phía sau cánh cửa phòng họp của các tập đoàn lớn toàn cầu, một tâm lý hoàn toàn khác đang xuất hiện: các CEO buộc phải tăng tốc đầu tư AI vì sợ bị bỏ lại phía sau, nhưng đồng thời ngày càng lo ngại rằng thị trường đang tiến tới giai đoạn “AI phải tạo lợi nhuận thật” thay vì chỉ tạo hiệu ứng truyền thông.
Máy bay A380 của Emirates được trang bị wi-fi Starlink

Máy bay A380 của Emirates được trang bị wi-fi Starlink

Tính đến thời điểm hiện tại, 25 chiếc Boeing 777-300ER đã được trang bị Starlink, và chiếc A380 đầu tiên cũng đã chính thức đi vào vận hành, đã có hơn 650.000 hành khách của Emirates được trải nghiệm dịch vụ kết nối hiện đại này trên các chuyến bay có trang bị Starlink.
Đà Nẵng số hóa di sản bằng VR360

Đà Nẵng số hóa di sản bằng VR360

Phường Hải Vân và Bàn Thạch (Đà Nẵng) đồng loạt triển khai nền tảng thực tế ảo VR360 để số hóa di tích lịch sử, văn hóa, mở hướng phát triển du lịch thông minh và đưa di sản đến gần hơn với cộng đồng, đặc biệt là giới trẻ.
YouTube ghi nhận hơn 2 tỉ giờ xem Shorts mỗi tháng trên TV

YouTube ghi nhận hơn 2 tỉ giờ xem Shorts mỗi tháng trên TV

Xu hướng xem video ngắn trên màn hình TV đang tăng mạnh khi YouTube ghi nhận hơn 2 tỉ giờ xem Shorts mỗi tháng, cho thấy nội dung dọc ngày càng mở rộng khỏi nền tảng điện thoại.
Đèn LED panel lên ngôi trong văn phòng hiện đại: Giải pháp tiết kiệm điện và nâng cao trải nghiệm làm việc

Đèn LED panel lên ngôi trong văn phòng hiện đại: Giải pháp tiết kiệm điện và nâng cao trải nghiệm làm việc

Đèn LED panel đang trở thành lựa chọn phổ biến trong các văn phòng hiện đại không chỉ giúp tiết kiệm điện năng tới 50-70% so với đèn huỳnh quang truyền thống, dòng đèn này còn ghi điểm nhờ khả năng chiếu sáng đồng đều, hạn chế chói lóa và phù hợp với nhiều mô hình không gian làm việc.
Mỹ duyệt bán chip H200 cho Trung Quốc, Nvidia vẫn mắc kẹt giữa thế đối đầu công nghệ

Mỹ duyệt bán chip H200 cho Trung Quốc, Nvidia vẫn mắc kẹt giữa thế đối đầu công nghệ

Dù Mỹ đã cho phép khoảng 10 công ty Trung Quốc mua chip AI H200 của Nvidia, các lô hàng vẫn chưa thể giao do trở ngại từ Bắc Kinh và những điều kiện kiểm soát phức tạp từ cả hai phía. Diễn biến này cho thấy Nvidia đang chịu sức ép ngày càng lớn trong cuộc cạnh tranh công nghệ giữa Mỹ và Trung Quốc.
Chuẩn hóa dữ liệu IoT giao thông, tăng tốc cho hạ tầng giao thông thông minh thông minh

Chuẩn hóa dữ liệu IoT giao thông, tăng tốc cho hạ tầng giao thông thông minh thông minh

Bộ Xây dựng vừa ban hành Kế hoạch triển khai Đề án “Ứng dụng Internet vạn vật (IoT) trong lĩnh vực giao thông thông minh”, đặt mục tiêu chuẩn hóa và liên thông toàn bộ dữ liệu IoT giao thông giữa Bộ Xây dựng, Bộ Công an và các địa phương vào giai đoạn 2029-2035.