Chủ nhật 26/10/2025 03:42
Hotline: 024.355.63.010
Kinh tế số

Ai đang dạy cho trí tuệ nhân tạo?

12/10/2020 00:00
Cụm từ AI (trí tuệ thông minh nhân tạo) thường tạo ở người nghe một hình ảnh về một hệ thống phức tạp, tân kỳ, hiện đại và hào nhoáng. Thế nên có ai bảo tù nhân ở Phần Lan hay công nhân giá rẻ ở Trung Quốc đang dạy cho AI học, ắt ta sẽ nghĩ đây chỉ l

Ảnh minh họa. Nguồn: Internet

Vainu, một công ty khởi nghiệp ở Phần Lan, đang xây dựng một cơ sở dữ liệu khổng lồ về tất cả mọi doanh nghiệp trên thế giới với tham vọng cung cấp dịch vụ giúp kết nối doanh nghiệp với đúng đối tác họ cần. Để cơ sở dữ liệu được cập nhật và có các thông tin riêng độc đáo, Vainu tổ chức để thuê người đọc hàng trăm ngàn bài viết về doanh nghiệp thu thập từ Internet và dán nhãn để miêu tả chúng, ví dụ bài này là về hãng Apple sản xuất iPhone, bài kia là về doanh nghiệp xuất khẩu táo.

Với các bài bằng tiếng Anh, Vainu sử dụng chợ nhân công giá rẻ trên mạng gọi là “Amazon Mechanical Turk” - một nơi doanh nghiệp thường dùng để thuê người làm những phần việc mang tính lặp đi lặp lại, loại công việc có thể làm từ xa. Nhưng với tiếng Phần Lan thì các chợ này bó tay, không tìm ra người chịu làm việc giá rẻ. Thế là Vainu bèn hợp tác với cơ quan quản lý tù nhân của Phần Lan, danh nghĩa là giúp tù nhân học nghề nhưng cũng là cách tận dụng lao động rẻ bằng cách trang bị máy tính cho hai nhà tù để tù nhân ngồi dán nhãn các bài báo cho họ. Sau khi có dữ liệu đã dán nhãn, Vainu mới dạy cho máy học các thuật toán phân tích dữ liệu.

Máy tính làm các phép tính rất nhanh, nhưng thiếu khả năng nhận biết nên thua ngay cả một em bé trong khía cạnh này. Các em bé nhìn một con béc-giê và một con chihuahua thì dù chúng khác nhau một trời một vực các em cũng biết chúng đều là chó. Máy tính thì phải dạy và không phải chỉ dạy từng hình, bằng không thì dù đã thấy hình chó mực nhưng sau đó thấy một con chó đốm nó sẽ bảo đó không phải là chó.

Trí tuệ thông minh nhân tạo cần một lượng dữ liệu khổng lồ để máy học, ví dụ đưa các phim chụp cộng hưởng từ (MRI) vào máy kèm theo là chẩn đoán đúng của các bác sĩ. Từ hàng ngàn, hàng chục ngàn phim MRI có chẩn đoán của con người, máy sẽ học để sau đó nhìn vào phim bắt chước đưa ra chẩn đoán. Vì máy không bị môi trường bên ngoài chi phối, lại học từ các bác sĩ giỏi nhất, rút kinh nghiệm từ các chẩn đoán sai, nên dần dần máy sẽ “thông minh” hơn người, tỷ lệ chẩn đoán chính xác ngày càng cao.

Nhưng, như chúng ta đã hình dung phần nào, công đoạn quan trọng đầu tiên là máy phải có hình ảnh từ phim MRI và các nhãn chẩn đoán nó mới học được. Công đoạn đưa phim vào bộ nhớ của máy, gõ các chẩn đoán là công đoạn cần nhiều lao động mà các lao động này không cần trình độ học vấn cao, chỉ cần làm đúng một số thao tác được huấn luyện. Đây là loại công việc nhàm chán, tiền công lại rẻ nên phù hợp cho các thị trường như Trung Quốc.

Ở một địa điểm được mệnh danh là “nông trại dữ liệu”, nhiều công nhân mở các file hình và gõ các nhãn miêu tả chúng; từ các cụm từ định danh như “con chó”, “con mèo” đến các dòng chi tiết hơn như “đây là hình một đứa bé đang tập đi”... Ngành nhập dữ liệu như thế đang là ngành thu hút nhiều lao động ở Trung Quốc một khi các ngành lắp ráp điện tử hay may mặc bị chuyển đi nước khác. Các doanh nghiệp khởi nghiệp tỏa ra lập các “nông trại dữ liệu” ở các vùng giá lao động còn rẻ để dán nhãn cho hàng triệu triệu tấm ảnh và hàng triệu triệu giờ video. Loại công việc cần sự cần cù, nhẫn nại này đang giúp Trung Quốc có một lợi thế trong lĩnh vực AI so với Mỹ và châu Âu.

Chẳng hạn một siêu thị xây dựng được hệ thống tính tiền tự động, nhưng để hệ thống hoạt động cần đính thẻ cho khoảng 20.000 hình ảnh hàng hóa nhìn từ đủ góc cạnh; tức cũng là cái bánh nhưng lấp ló sau hộp kem thì máy cũng phải nhận ra. Thế là siêu thị phải thuê một “nông trại dữ liệu” làm gấp trong ba ngày, tiền công chỉ vài ngàn đô la. Một nơi khác thuê đính thẻ cho ba triệu tấm hình chụp miệng người.

Ở đây, chính phủ và doanh nghiệp Trung Quốc có một lợi thế khác nữa, đó là họ đang tiếp cận kho dữ liệu khổng lồ của một xã hội 1,4 tỉ dân, nơi tính riêng tư của thông tin không được coi trọng cho lắm. Ở châu Âu, muốn thu thập dữ liệu phải xin phép người dùng một cách rõ ràng, ai vi phạm dễ bị kiện cáo và chịu phạt những khoản tiền lớn. Chính vì thế có nhiều dự báo Trung Quốc sẽ dẫn đầu thế giới trong lĩnh vực AI trước năm 2030, một phần nào đó là do mọi AI đều được xây dựng dựa trên lao động mang tính thủ công của con người.

Nguyễn Vũ

Tin bài khác
Camera AI – Bước tiến hiện đại trong quản lý giao thông đô thị TP. Hồ Chí Minh

Camera AI – Bước tiến hiện đại trong quản lý giao thông đô thị TP. Hồ Chí Minh

Tính từ ngày 01/09/2025 – 06/10/2025, sau gần một tháng triển khai hệ thống camera trí tuệ nhân tạo (AI) trong giám sát và xử lý vi phạm giao thông, Phòng CSGT TP. Hồ Chí Minh đã phát hiện, lập biên bản vi phạm hành chính, hoàn thiện hồ sơ 3.476 trường hợp.
Một nền tảng blockchain Việt sẽ giao dịch trên Kraken, mở đường cho công nghệ Việt Nam vào Mỹ

Một nền tảng blockchain Việt sẽ giao dịch trên Kraken, mở đường cho công nghệ Việt Nam vào Mỹ

U2U Network, nền tảng blockchain Layer-1 do đội ngũ kỹ sư Việt Nam phát triển, chính thức được Kraken – sàn giao dịch tài sản số Tier-1 có trụ sở tại Hoa Kỳ – thông báo niêm yết token U2U. Theo kế hoạch, U2U sẽ bắt đầu giao dịch trên Kraken vào ngày 17/10/2025.
Cảnh báo: 40% trung tâm dữ liệu AI có nguy cơ thiếu điện vào năm 2027

Cảnh báo: 40% trung tâm dữ liệu AI có nguy cơ thiếu điện vào năm 2027

Theo cảnh báo từ Gartner, đến năm 2027, khoảng 40% trung tâm dữ liệu AI trên toàn cầu có thể phải đối mặt với tình trạng thiếu điện – một thách thức có thể làm chậm lại toàn bộ tiến trình chuyển đổi số và tăng trưởng của nền kinh tế số.
Đà Nẵng đăng cai khởi động khoa học công nghệ hạt nhân

Đà Nẵng đăng cai khởi động khoa học công nghệ hạt nhân

Chính quyền thành phố Đà Nẵng thông tin đã phối hợp cùng Bộ Khoa học Công nghệ khai mạc Hội nghị Khoa học và Công nghệ hạt nhân Việt Nam lần thứ 16 (VINANST 16), bàn về năng lượng nguyên tử vào sáng nay 10/10/2025 tại cung hội nghị Furama.
Bí mật phía sau tờ tiền polymer: Hành trình làm chủ công nghệ của Việt Nam

Bí mật phía sau tờ tiền polymer: Hành trình làm chủ công nghệ của Việt Nam

Khi nói về tiền tệ, đa phần người dân chỉ quan tâm đến giá trị mệnh giá. Ít ai biết đằng sau tờ tiền còn là cả một hệ thống công nghệ bảo an khắt khe, gắn liền trực tiếp với an ninh quốc gia.
CC1 tiên phong nghiên cứu giải pháp công nghệ hiện đại, sẵn sàng đón đầu kỷ nguyên ngành đường sắt đô thị

CC1 tiên phong nghiên cứu giải pháp công nghệ hiện đại, sẵn sàng đón đầu kỷ nguyên ngành đường sắt đô thị

Ngày 27/9 vừa qua, Chủ tịch HĐQT CC1 – Ông Phan Hữu Duy Quốc cùng Chuyên gia cao cấp CC1 – Ông Lê Thanh Liêm đã tham dự Hội thảo khoa học trực tuyến với chủ đề “Giải pháp cầu cạn cho đường sắt đô thị, đường sắt tốc độ cao” do Tạp chí Xây dựng – Bộ Xây dựng phối hợp tổ chức.
GiHub đạt chứng chỉ SPIRE: Bước tiến mới cho tòa nhà thông minh Việt Nam

GiHub đạt chứng chỉ SPIRE: Bước tiến mới cho tòa nhà thông minh Việt Nam

Nằm trong chuỗi sự kiện công nghệ Galaxy of Innovation 2025 diễn ra từ ngày 25 - 26/9/2025, tại TP. Hồ Chí Minh, Trung tâm Đổi mới sáng tạo Galaxy Innovation Hub (GiHub) chính thức được công bố là Tòa nhà thông minh đầu tiên tại Việt Nam đạt chứng chỉ SPIRE.
Tốc độ Internet Việt Nam bứt phá, lọt Top 10 toàn cầu

Tốc độ Internet Việt Nam bứt phá, lọt Top 10 toàn cầu

Tốc độ Internet cố định của Việt Nam đạt 261,8 Mbps trong tháng 8/2025, vươn lên hạng 10 thế giới, đánh dấu cột mốc lịch sử sau gần 30 năm hiện diện và giúp quốc gia vượt nhiều nước phát triển về kết nối.
Việt Nam dẫn đầu xuất khẩu hàng hóa sáng tạo

Việt Nam dẫn đầu xuất khẩu hàng hóa sáng tạo

Theo Báo cáo Chỉ số Đổi mới sáng tạo toàn cầu (Global Innovation Index – GII) 2025 của Tổ chức Sở hữu trí tuệ thế giới (WIPO), Việt Nam giữ hạng 44 nhưng nổi bật với ba chỉ số đứng đầu toàn cầu: nhập khẩu công nghệ cao, xuất khẩu công nghệ cao và xuất khẩu hàng hóa sáng tạo.
Du lịch Đà Nẵng: Tăng tương tác với dịch vụ truyền hình đột phá

Du lịch Đà Nẵng: Tăng tương tác với dịch vụ truyền hình đột phá

VNPT Đà Nẵng thông tin vừa tổ chức hội thảo “Truyền hình đột phá” nhằm giới thiệu dịch vụ truyền hình tương tác đa dạng hóa với các cơ sở lưu trú du lịch, khách sạn nghỉ dưỡng tại địa bàn.
Vị Phó Giáo sư bỏ “xứ sở giàu nhất thế giới” sang Việt Nam bồi dưỡng tài năng công nghệ

Vị Phó Giáo sư bỏ “xứ sở giàu nhất thế giới” sang Việt Nam bồi dưỡng tài năng công nghệ

“Chúng tôi không chỉ đào tạo kỹ sư mà còn đào tạo người dẫn dắt”, là tôn chỉ mà Phó Giáo sư Ali Al-Dulaimi mang theo trong hành trình giáo dục tại Việt Nam. Với vai trò Trưởng khoa Khoa học Máy tính & Công nghệ tại Trường Đại học Anh Quốc Việt Nam (BUV), ông đang từng bước hiện thực hóa triết lý giáo dục gắn với thực tiễn, đổi mới sáng tạo và phát triển bền vững cho thế hệ công nghệ trẻ.
PCI 2.0: Công cụ mới thúc đẩy năng lực cạnh tranh và phát triển kinh tế tư nhân

PCI 2.0: Công cụ mới thúc đẩy năng lực cạnh tranh và phát triển kinh tế tư nhân

PCI 2.0 được coi là bước tiến quan trọng trong nghiên cứu, phản ánh thực trạng kinh tế tư nhân và góp phần cải thiện năng lực điều hành kinh tế địa phương.
Phát triển hệ sinh thái AI tại Việt Nam: Cần hợp tác công – tư

Phát triển hệ sinh thái AI tại Việt Nam: Cần hợp tác công – tư

Chia sẻ với Tạp chí Doanh nghiệp và Hội nhập, ông Nguyễn Tử Quảng - Chủ tịch Tập đoàn công nghệ Bkav cho rằng, để khai thác dữ liệu và phát triển hệ sinh thái trí tuệ nhân tạo (AI) tại Việt Nam, chỉ có hợp tác công - tư mới mang lại hiệu quả.
Cảnh báo rò rỉ dữ liệu khách hàng bị rao bán bởi tin tặc quốc tế - Người dân và Doanh nghiệp cần hành động ngay

Cảnh báo rò rỉ dữ liệu khách hàng bị rao bán bởi tin tặc quốc tế - Người dân và Doanh nghiệp cần hành động ngay

Ngày 11/9/2025, Trung tâm Thông tin Tín dụng Quốc gia Việt Nam (CIC) thuộc Ngân hàng Nhà nước đã phát đi công văn khẩn gửi tới toàn bộ hệ thống tổ chức tín dụng, cảnh báo nguy cơ dữ liệu khách hàng bị rao bán trên các diễn đàn tin tặc quốc tế. Dù hệ thống vận hành hiện tại vẫn bình thường và chưa ghi nhận thiệt hại cụ thể, sự kiện này lập tức trở thành tâm điểm quan ngại khi xuất hiện thông tin nhóm hacker khét tiếng ShinyHunters có thể đứng sau.
Trí tuệ nhân tạo và dữ liệu: Nhân tố cốt lõi quyết định sức cạnh tranh

Trí tuệ nhân tạo và dữ liệu: Nhân tố cốt lõi quyết định sức cạnh tranh

Chia sẻ tại Hội thảo “Chiến lược AI và Kiến trúc dữ liệu quốc gia, tổ chức và doanh nghiệp” (ASDA 1), các diễn giả đều có chung quan điểm: Trí tuệ nhân tạo (AI) và dữ liệu không còn là lĩnh vực công nghệ thuần túy, mà là nhân tố cốt lõi quyết định chủ quyền, sức cạnh tranh và vị thế quốc gia trong kỷ nguyên mới.