Thứ năm 25/06/2026 03:54
Hotline: 024.355.63.010
Kinh tế số

Ai đang dạy cho trí tuệ nhân tạo?

12/10/2020 00:00
Cụm từ AI (trí tuệ thông minh nhân tạo) thường tạo ở người nghe một hình ảnh về một hệ thống phức tạp, tân kỳ, hiện đại và hào nhoáng. Thế nên có ai bảo tù nhân ở Phần Lan hay công nhân giá rẻ ở Trung Quốc đang dạy cho AI học, ắt ta sẽ nghĩ đây chỉ l

Ảnh minh họa. Nguồn: Internet

Vainu, một công ty khởi nghiệp ở Phần Lan, đang xây dựng một cơ sở dữ liệu khổng lồ về tất cả mọi doanh nghiệp trên thế giới với tham vọng cung cấp dịch vụ giúp kết nối doanh nghiệp với đúng đối tác họ cần. Để cơ sở dữ liệu được cập nhật và có các thông tin riêng độc đáo, Vainu tổ chức để thuê người đọc hàng trăm ngàn bài viết về doanh nghiệp thu thập từ Internet và dán nhãn để miêu tả chúng, ví dụ bài này là về hãng Apple sản xuất iPhone, bài kia là về doanh nghiệp xuất khẩu táo.

Với các bài bằng tiếng Anh, Vainu sử dụng chợ nhân công giá rẻ trên mạng gọi là “Amazon Mechanical Turk” - một nơi doanh nghiệp thường dùng để thuê người làm những phần việc mang tính lặp đi lặp lại, loại công việc có thể làm từ xa. Nhưng với tiếng Phần Lan thì các chợ này bó tay, không tìm ra người chịu làm việc giá rẻ. Thế là Vainu bèn hợp tác với cơ quan quản lý tù nhân của Phần Lan, danh nghĩa là giúp tù nhân học nghề nhưng cũng là cách tận dụng lao động rẻ bằng cách trang bị máy tính cho hai nhà tù để tù nhân ngồi dán nhãn các bài báo cho họ. Sau khi có dữ liệu đã dán nhãn, Vainu mới dạy cho máy học các thuật toán phân tích dữ liệu.

Máy tính làm các phép tính rất nhanh, nhưng thiếu khả năng nhận biết nên thua ngay cả một em bé trong khía cạnh này. Các em bé nhìn một con béc-giê và một con chihuahua thì dù chúng khác nhau một trời một vực các em cũng biết chúng đều là chó. Máy tính thì phải dạy và không phải chỉ dạy từng hình, bằng không thì dù đã thấy hình chó mực nhưng sau đó thấy một con chó đốm nó sẽ bảo đó không phải là chó.

Trí tuệ thông minh nhân tạo cần một lượng dữ liệu khổng lồ để máy học, ví dụ đưa các phim chụp cộng hưởng từ (MRI) vào máy kèm theo là chẩn đoán đúng của các bác sĩ. Từ hàng ngàn, hàng chục ngàn phim MRI có chẩn đoán của con người, máy sẽ học để sau đó nhìn vào phim bắt chước đưa ra chẩn đoán. Vì máy không bị môi trường bên ngoài chi phối, lại học từ các bác sĩ giỏi nhất, rút kinh nghiệm từ các chẩn đoán sai, nên dần dần máy sẽ “thông minh” hơn người, tỷ lệ chẩn đoán chính xác ngày càng cao.

Nhưng, như chúng ta đã hình dung phần nào, công đoạn quan trọng đầu tiên là máy phải có hình ảnh từ phim MRI và các nhãn chẩn đoán nó mới học được. Công đoạn đưa phim vào bộ nhớ của máy, gõ các chẩn đoán là công đoạn cần nhiều lao động mà các lao động này không cần trình độ học vấn cao, chỉ cần làm đúng một số thao tác được huấn luyện. Đây là loại công việc nhàm chán, tiền công lại rẻ nên phù hợp cho các thị trường như Trung Quốc.

Ở một địa điểm được mệnh danh là “nông trại dữ liệu”, nhiều công nhân mở các file hình và gõ các nhãn miêu tả chúng; từ các cụm từ định danh như “con chó”, “con mèo” đến các dòng chi tiết hơn như “đây là hình một đứa bé đang tập đi”... Ngành nhập dữ liệu như thế đang là ngành thu hút nhiều lao động ở Trung Quốc một khi các ngành lắp ráp điện tử hay may mặc bị chuyển đi nước khác. Các doanh nghiệp khởi nghiệp tỏa ra lập các “nông trại dữ liệu” ở các vùng giá lao động còn rẻ để dán nhãn cho hàng triệu triệu tấm ảnh và hàng triệu triệu giờ video. Loại công việc cần sự cần cù, nhẫn nại này đang giúp Trung Quốc có một lợi thế trong lĩnh vực AI so với Mỹ và châu Âu.

Chẳng hạn một siêu thị xây dựng được hệ thống tính tiền tự động, nhưng để hệ thống hoạt động cần đính thẻ cho khoảng 20.000 hình ảnh hàng hóa nhìn từ đủ góc cạnh; tức cũng là cái bánh nhưng lấp ló sau hộp kem thì máy cũng phải nhận ra. Thế là siêu thị phải thuê một “nông trại dữ liệu” làm gấp trong ba ngày, tiền công chỉ vài ngàn đô la. Một nơi khác thuê đính thẻ cho ba triệu tấm hình chụp miệng người.

Ở đây, chính phủ và doanh nghiệp Trung Quốc có một lợi thế khác nữa, đó là họ đang tiếp cận kho dữ liệu khổng lồ của một xã hội 1,4 tỉ dân, nơi tính riêng tư của thông tin không được coi trọng cho lắm. Ở châu Âu, muốn thu thập dữ liệu phải xin phép người dùng một cách rõ ràng, ai vi phạm dễ bị kiện cáo và chịu phạt những khoản tiền lớn. Chính vì thế có nhiều dự báo Trung Quốc sẽ dẫn đầu thế giới trong lĩnh vực AI trước năm 2030, một phần nào đó là do mọi AI đều được xây dựng dựa trên lao động mang tính thủ công của con người.

Nguyễn Vũ

Tin bài khác
Giá chip AI Nvidia tăng vọt trên thị trường chợ đen Trung Quốc

Giá chip AI Nvidia tăng vọt trên thị trường chợ đen Trung Quốc

Các biện pháp kiểm soát xuất khẩu của Mỹ cùng động thái siết nhập khẩu từ Trung Quốc đang khiến nguồn cung chip AI Nvidia ngày càng khan hiếm, đẩy giá thiết bị trên thị trường chợ đen tăng mạnh và làm chi phí tính toán AI tại Trung Quốc leo thang.
Khi không có ai chăm sóc người già, người ốm, LG trình làng giải pháp CLOiD cho nỗi đau thế kỷ

Khi không có ai chăm sóc người già, người ốm, LG trình làng giải pháp CLOiD cho nỗi đau thế kỷ

Có một “nỗi đau” thế kỷ đang âm thầm diễn ra trên khắp thế giới mà không nhiều người nhận ra cho đến khi điều đó chạm đến chính gia đình mình. Con người đang sống lâu hơn, nhưng lại ngày càng thiếu người chăm sóc.
EU chuẩn bị siết điều tra Meta vì lo ngại mạng xã hội gây nghiện với trẻ em

EU chuẩn bị siết điều tra Meta vì lo ngại mạng xã hội gây nghiện với trẻ em

Ủy ban châu Âu được cho là đang chuẩn bị đưa ra kết luận sơ bộ trong cuộc điều tra đối với Meta, với cáo buộc Facebook và Instagram sử dụng các thiết kế có thể khiến người dùng trẻ tuổi bị cuốn vào nền tảng.
HostVN bắt tay Blackwall, đưa công nghệ bảo vệ lưu lượng web châu Âu vào Việt Nam

HostVN bắt tay Blackwall, đưa công nghệ bảo vệ lưu lượng web châu Âu vào Việt Nam

Việt Nam trở thành thị trường đầu tiên của Blackwall tại Đông Nam Á khi công ty an ninh mạng đến từ Estonia lựa chọn HostVN làm đối tác chiến lược, mở đường đưa công nghệ bảo vệ lưu lượng web cấp doanh nghiệp đến cộng đồng doanh nghiệp trong nước.
Thời của smartphone Android 8GB RAM đã hết và chiếc bẫy lỗi thời ngay khi bóc hộp!

Thời của smartphone Android 8GB RAM đã hết và chiếc bẫy lỗi thời ngay khi bóc hộp!

Kỷ nguyên trí tuệ nhân tạo (AI) trên di động đang châm ngòi cho một cuộc chạy đua vũ trang phần cứng khốc liệt, ép người dùng phải thay đổi tư duy mua sắm. Cây bút Robert Triggs từ chuyên trang công nghệ Android Authority khẳng định việc xuống tiền mua smartphone RAM 8GB vào năm 2026 là một sai lầm lớn. Sự xuất hiện của các mô hình AI vận hành trực tiếp trên máy như Gemini Nano hay Apple Intelligence với dung lượng phình to liên tục đang biến 12GB RAM từ mức "thừa thãi" trở thành tiêu chuẩn tối thiểu bắt buộc nếu người dùng không muốn bị gạt ra khỏi các trải nghiệm công nghệ mới.
Pháp ra mắt Robot Eno của Genesis AI: Trợ lý đắc lực mới của ngành công nghiệp toàn cầu

Pháp ra mắt Robot Eno của Genesis AI: Trợ lý đắc lực mới của ngành công nghiệp toàn cầu

Có một câu hỏi mà ngành robot toàn cầu hiếm khi đặt ra một cách thẳng thắn: nếu mục tiêu cuối cùng là giúp con người làm việc hiệu quả hơn, tại sao robot nhất thiết phải có hai chân, một gương mặt và một giọng nói để trông giống con người? Trong khi Tesla, Figure và nhiều tên tuổi lớn vẫn đang đầu tư hàng tỷ USD để dạy robot bước đi như con người, một startup non trẻ tại Paris lại chọn hướng tiếp cận hoàn toàn khác.
Tham vọng lập “bản đồ thanh toán khu vực”, NAPAS đẩy mạnh phủ sóng QR xuyên biên giới

Tham vọng lập “bản đồ thanh toán khu vực”, NAPAS đẩy mạnh phủ sóng QR xuyên biên giới

Tại hội thảo "Thanh toán thông minh trong kỷ nguyên số", Công ty cổ phần Thanh toán quốc gia (NAPAS) cho biết đang đẩy mạnh triển khai hai giải pháp chiến lược là VietQRPay (nội địa) và VietQRGlobal (xuyên biên giới). Đây là bước đi nhằm đón đầu làn sóng phục hồi của du lịch toàn cầu, khắc phục các hạn chế chi phí của phương thức thanh toán bằng thẻ hay tiền mặt truyền thống, đồng thời đưa Việt Nam hội nhập sâu hơn vào hệ sinh thái thanh toán số quốc tế.
AI của Anthropic châm ngòi cảnh báo ở Nhà Trắng

AI của Anthropic châm ngòi cảnh báo ở Nhà Trắng

Những cảnh báo an ninh quanh Anthropic cho thấy chính quyền Mỹ đang siết chặt hơn với các mô hình AI tiên tiến, trong khi vẫn phải cân nhắc mục tiêu duy trì lợi thế công nghệ trước Trung Quốc. Đây là trọng tâm trong cuộc phỏng vấn giữa Tổng thống Donald Trump với hãng tin Axios hôm 19/6 (giờ địa phương).
Giải pháp tối ưu quản trị dòng tiền và nâng cao trải nghiệm khách hàng từ máy POS

Giải pháp tối ưu quản trị dòng tiền và nâng cao trải nghiệm khách hàng từ máy POS

Sự dịch chuyển trong thói quen tiêu dùng không tiền mặt thúc đẩy các cơ sở kinh doanh đưa máy POS vào vận hành chuyên nghiệp, giúp tự động hóa quy trình kế toán và giảm thiểu sai sót trong quản lý tài chính.
Việt Nam đề xuất mô hình "Hub-and-Nodes" để định hình chiến lược công nghệ lượng tử

Việt Nam đề xuất mô hình "Hub-and-Nodes" để định hình chiến lược công nghệ lượng tử

Tại hội thảo khoa học diễn ra ở Thành phố Hồ Chí Minh, các chuyên gia hàng đầu đã thảo luận về giải pháp giúp Việt Nam bứt phá trong kỷ nguyên công nghệ mới, trong đó nhấn mạnh ba định hướng trọng tâm và khung kiến trúc chiến lược mạng lưới lượng tử quốc gia.
Robot quản gia Ballie tận tụy của Samsung: Một thành viên gia đình của nhà thông minh

Robot quản gia Ballie tận tụy của Samsung: Một thành viên gia đình của nhà thông minh

Có một câu hỏi mà ngành công nghệ toàn cầu đã loay hoay đi tìm lời giải suốt hơn một thập kỷ qua: làm sao để một ngôi nhà thực sự trở nên thông minh, chứ không chỉ là một ngôi nhà chứa đầy thiết bị thông minh? Các tập đoàn công nghệ lớn từ Mỹ, Hàn Quốc đến Trung Quốc đã đổ hàng tỷ USD vào camera kết nối, loa thông minh, cảm biến, robot hút bụi, khóa cửa điện tử hay điều hòa, bình nước nóng, rèm cửa, thiết bị chiếu sáng… điều khiển từ xa. Thế nhưng nghịch lý là càng nhiều thiết bị xuất hiện trong nhà, cuộc sống của người dùng phổ thông lại càng trở nên phức tạp, khó dùng hơn thay vì đơn giản.
Google Gemini, NotebookLM - Công cụ AI hỗ trợ học tập, làm việc và sáng tạo hiệu quả

Google Gemini, NotebookLM - Công cụ AI hỗ trợ học tập, làm việc và sáng tạo hiệu quả

Ngày 18/6, Google tổ chức buổi chia sẻ về “AI for Learning” cập nhật công nghệ mới nhất, mang đến góc nhìn trực quan, hữu ích, góp phần hỗ trợ thiết thực cho công việc biên tập, sáng tạo nội dung cũng như tác nghiệp hằng ngày.
Khu công nghệ cao TP. Hồ Chí Minh: Ưu tiên các dự án công nghệ chiến lược

Khu công nghệ cao TP. Hồ Chí Minh: Ưu tiên các dự án công nghệ chiến lược

Dòng vốn FDI hơn 11 tỷ USD đang tạo động lực quan trọng cho Khu Công nghệ cao TP. H Chí Minh chuyển dịch từ gia công sang các lĩnh vực công nghệ chiến lược như AI, bán dẫn và trung tâm dữ liệu.
CEO Anthropic kêu gọi G7 không chia rẽ trong phát triển AI

CEO Anthropic kêu gọi G7 không chia rẽ trong phát triển AI

Ông Dario Amodei – CEO của Anthropic – kêu gọi các nước G7 tăng phối hợp trong phát triển AI tiên tiến, trong bối cảnh Mỹ chặn Anthropic xuất khẩu hai mô hình mới vì lo ngại an ninh quốc gia.
Chiến lược xây dựng 10 doanh nghiệp công nghệ tỷ USD của Việt Nam đến năm 2030

Chiến lược xây dựng 10 doanh nghiệp công nghệ tỷ USD của Việt Nam đến năm 2030

Làm thế nào để Việt Nam sở hữu 10 doanh nghiệp công nghệ có doanh thu tỷ USD, sở hữu bằng sáng chế quốc tế và đưa quốc gia lọt vào top 3 Đông Nam Á về trí tuệ nhân tạo (AI)? Câu trả lời nằm ở bộ khung tiêu chuẩn khắt khe cùng những cơ chế thử nghiệm đột phá vừa được ban hành, hứa hẹn thay đổi hoàn toàn diện mạo hạ tầng số nước nhà trước năm 2030.