Thứ năm 02/07/2026 05:30
Hotline: 024.355.63.010
Kinh tế số

Ai đang dạy cho trí tuệ nhân tạo?

12/10/2020 00:00
Cụm từ AI (trí tuệ thông minh nhân tạo) thường tạo ở người nghe một hình ảnh về một hệ thống phức tạp, tân kỳ, hiện đại và hào nhoáng. Thế nên có ai bảo tù nhân ở Phần Lan hay công nhân giá rẻ ở Trung Quốc đang dạy cho AI học, ắt ta sẽ nghĩ đây chỉ l

Ảnh minh họa. Nguồn: Internet

Vainu, một công ty khởi nghiệp ở Phần Lan, đang xây dựng một cơ sở dữ liệu khổng lồ về tất cả mọi doanh nghiệp trên thế giới với tham vọng cung cấp dịch vụ giúp kết nối doanh nghiệp với đúng đối tác họ cần. Để cơ sở dữ liệu được cập nhật và có các thông tin riêng độc đáo, Vainu tổ chức để thuê người đọc hàng trăm ngàn bài viết về doanh nghiệp thu thập từ Internet và dán nhãn để miêu tả chúng, ví dụ bài này là về hãng Apple sản xuất iPhone, bài kia là về doanh nghiệp xuất khẩu táo.

Với các bài bằng tiếng Anh, Vainu sử dụng chợ nhân công giá rẻ trên mạng gọi là “Amazon Mechanical Turk” - một nơi doanh nghiệp thường dùng để thuê người làm những phần việc mang tính lặp đi lặp lại, loại công việc có thể làm từ xa. Nhưng với tiếng Phần Lan thì các chợ này bó tay, không tìm ra người chịu làm việc giá rẻ. Thế là Vainu bèn hợp tác với cơ quan quản lý tù nhân của Phần Lan, danh nghĩa là giúp tù nhân học nghề nhưng cũng là cách tận dụng lao động rẻ bằng cách trang bị máy tính cho hai nhà tù để tù nhân ngồi dán nhãn các bài báo cho họ. Sau khi có dữ liệu đã dán nhãn, Vainu mới dạy cho máy học các thuật toán phân tích dữ liệu.

Máy tính làm các phép tính rất nhanh, nhưng thiếu khả năng nhận biết nên thua ngay cả một em bé trong khía cạnh này. Các em bé nhìn một con béc-giê và một con chihuahua thì dù chúng khác nhau một trời một vực các em cũng biết chúng đều là chó. Máy tính thì phải dạy và không phải chỉ dạy từng hình, bằng không thì dù đã thấy hình chó mực nhưng sau đó thấy một con chó đốm nó sẽ bảo đó không phải là chó.

Trí tuệ thông minh nhân tạo cần một lượng dữ liệu khổng lồ để máy học, ví dụ đưa các phim chụp cộng hưởng từ (MRI) vào máy kèm theo là chẩn đoán đúng của các bác sĩ. Từ hàng ngàn, hàng chục ngàn phim MRI có chẩn đoán của con người, máy sẽ học để sau đó nhìn vào phim bắt chước đưa ra chẩn đoán. Vì máy không bị môi trường bên ngoài chi phối, lại học từ các bác sĩ giỏi nhất, rút kinh nghiệm từ các chẩn đoán sai, nên dần dần máy sẽ “thông minh” hơn người, tỷ lệ chẩn đoán chính xác ngày càng cao.

Nhưng, như chúng ta đã hình dung phần nào, công đoạn quan trọng đầu tiên là máy phải có hình ảnh từ phim MRI và các nhãn chẩn đoán nó mới học được. Công đoạn đưa phim vào bộ nhớ của máy, gõ các chẩn đoán là công đoạn cần nhiều lao động mà các lao động này không cần trình độ học vấn cao, chỉ cần làm đúng một số thao tác được huấn luyện. Đây là loại công việc nhàm chán, tiền công lại rẻ nên phù hợp cho các thị trường như Trung Quốc.

Ở một địa điểm được mệnh danh là “nông trại dữ liệu”, nhiều công nhân mở các file hình và gõ các nhãn miêu tả chúng; từ các cụm từ định danh như “con chó”, “con mèo” đến các dòng chi tiết hơn như “đây là hình một đứa bé đang tập đi”... Ngành nhập dữ liệu như thế đang là ngành thu hút nhiều lao động ở Trung Quốc một khi các ngành lắp ráp điện tử hay may mặc bị chuyển đi nước khác. Các doanh nghiệp khởi nghiệp tỏa ra lập các “nông trại dữ liệu” ở các vùng giá lao động còn rẻ để dán nhãn cho hàng triệu triệu tấm ảnh và hàng triệu triệu giờ video. Loại công việc cần sự cần cù, nhẫn nại này đang giúp Trung Quốc có một lợi thế trong lĩnh vực AI so với Mỹ và châu Âu.

Chẳng hạn một siêu thị xây dựng được hệ thống tính tiền tự động, nhưng để hệ thống hoạt động cần đính thẻ cho khoảng 20.000 hình ảnh hàng hóa nhìn từ đủ góc cạnh; tức cũng là cái bánh nhưng lấp ló sau hộp kem thì máy cũng phải nhận ra. Thế là siêu thị phải thuê một “nông trại dữ liệu” làm gấp trong ba ngày, tiền công chỉ vài ngàn đô la. Một nơi khác thuê đính thẻ cho ba triệu tấm hình chụp miệng người.

Ở đây, chính phủ và doanh nghiệp Trung Quốc có một lợi thế khác nữa, đó là họ đang tiếp cận kho dữ liệu khổng lồ của một xã hội 1,4 tỉ dân, nơi tính riêng tư của thông tin không được coi trọng cho lắm. Ở châu Âu, muốn thu thập dữ liệu phải xin phép người dùng một cách rõ ràng, ai vi phạm dễ bị kiện cáo và chịu phạt những khoản tiền lớn. Chính vì thế có nhiều dự báo Trung Quốc sẽ dẫn đầu thế giới trong lĩnh vực AI trước năm 2030, một phần nào đó là do mọi AI đều được xây dựng dựa trên lao động mang tính thủ công của con người.

Nguyễn Vũ

Tin bài khác
Tối ưu hóa trải nghiệm mua sắm cùng Gemini

Tối ưu hóa trải nghiệm mua sắm cùng Gemini

Google chính thức ra mắt bản cập nhật lớn cho trải nghiệm mua sắm tích hợp AI trên ứng dụng Gemini tại Việt Nam, giúp việc tìm kiếm thông tin sản phẩm và chọn lựa quà tặng trở nên dễ dàng hơn bao giờ hết.
Từ 1/7, camera IP bán tại Việt Nam phải đáp ứng loạt yêu cầu bảo mật mới

Từ 1/7, camera IP bán tại Việt Nam phải đáp ứng loạt yêu cầu bảo mật mới

Từ ngày 1/7/2026, Thông tư số 48 của Bộ Công an chính thức có hiệu lực, lần đầu ban hành Quy chuẩn kỹ thuật quốc gia đối với camera IP, bổ sung nhiều yêu cầu về bảo mật, quản lý dữ liệu và quyền riêng tư nhằm tăng cường an toàn cho người dùng.
Doanh nghiệp cơ khí Việt tìm sức bật toàn cầu từ công nghệ sản xuất tiên tiến

Doanh nghiệp cơ khí Việt tìm sức bật toàn cầu từ công nghệ sản xuất tiên tiến

Trong bối cảnh chỉ số sản xuất công nghiệp ngành cơ khí ghi nhận mức tăng trưởng ấn tượng 11,3%, Triển lãm Quốc tế MTA Vietnam 2026 trở thành cầu nối chiến lược giúp doanh nghiệp nội địa tiếp cận công nghệ tự động hóa và các tiêu chuẩn khắt khe từ châu Âu.
Techcombank nâng tiêu chuẩn hệ điều hành và bảo mật trên ứng dụng ngân hàng số

Techcombank nâng tiêu chuẩn hệ điều hành và bảo mật trên ứng dụng ngân hàng số

Nhằm tăng cường an toàn thông tin và tuân thủ các quy định mới của Ngân hàng Nhà nước, từ ngày 1/7/2026, Techcombank chính thức áp dụng yêu cầu tối thiểu về hệ điều hành đối với thiết bị Android, đồng thời triển khai nâng cấp phương thức xác thực giao dịch.
Softel Solutions nâng cao năng lực bảo mật đám mây cùng AWS và Noventiq

Softel Solutions nâng cao năng lực bảo mật đám mây cùng AWS và Noventiq

Trước áp lực tăng trưởng nhanh của nền kinh tế số, việc hợp tác với Noventiq và AWS giúp doanh nghiệp viễn thông Việt Nam khắc phục hoàn toàn các lỗ hổng hệ thống nghiêm trọng, thiết lập kiến trúc an ninh mạng đồng bộ đạt tiêu chuẩn quốc tế.
Farm-ng Amiga: Chiếc máy kéo điện thông minh giúp ngành nông nghiệp toàn cầu tìm ra lời giải trong suốt một thế kỷ

Farm-ng Amiga: Chiếc máy kéo điện thông minh giúp ngành nông nghiệp toàn cầu tìm ra lời giải trong suốt một thế kỷ

Có một cuộc khủng hoảng đang xảy ra âm thầm trên những cánh đồng khắp thế giới, và người tiêu dùng thường chỉ nhận ra khi giá thực phẩm trên kệ siêu thị bắt đầu tăng không rõ lý do. Nông nghiệp đang đối mặt với tình trạng thiếu lao động nghiêm trọng, khi số người sẵn sàng và có khả năng làm việc trong các trang trại đang giảm dần theo từng năm, trong khi nhu cầu thực phẩm toàn cầu tiếp tục tăng theo đà dân số.
Tây Ninh phát triển hệ sinh thái UAV, đón cơ hội tăng trưởng mới

Tây Ninh phát triển hệ sinh thái UAV, đón cơ hội tăng trưởng mới

Tây Ninh đang từng bước hiện thực hóa mục tiêu trở thành trung tâm phát triển hệ sinh thái thiết bị bay không người lái (UAV) khi thúc đẩy hợp tác với doanh nghiệp Hàn Quốc và đồng thời hoàn thiện cơ chế thử nghiệm có kiểm soát (sandbox). Đây được xem là bước đi quan trọng để địa phương mở ra không gian tăng trưởng mới dựa trên công nghệ chiến lược.
Google mở miễn phí tính năng tạo ảnh cá nhân hóa trên Gemini

Google mở miễn phí tính năng tạo ảnh cá nhân hóa trên Gemini

Google vừa mở miễn phí tính năng tạo ảnh cá nhân hóa trên Gemini cho người dùng đủ điều kiện tại Mỹ, cho phép AI khai thác dữ liệu từ Google Photos và các dịch vụ Google để tạo hình ảnh phù hợp với từng người dùng.
Mỹ siết quản lý mạng xã hội, bảo vệ trẻ em trên không gian mạng

Mỹ siết quản lý mạng xã hội, bảo vệ trẻ em trên không gian mạng

Hạ viện Mỹ thông qua dự luật tăng cường an toàn trực tuyến cho trẻ em, trong bối cảnh nhiều quốc gia đang đẩy mạnh các biện pháp hạn chế mạng xã hội đối với người dùng vị thành niên.
Tencent “gom” gần 3 tỷ USD chip nhớ: CXMT được tiếp sức trước IPO bom tấn

Tencent “gom” gần 3 tỷ USD chip nhớ: CXMT được tiếp sức trước IPO bom tấn

Tencent được cho là đã khóa nguồn cung DRAM dài hạn từ CXMT bằng một thỏa thuận trị giá gần 3 tỷ USD, trong lúc cơn sốt AI khiến chip nhớ trở thành “hàng nóng” trên toàn cầu.
Doanh nghiệp và người dân hưởng lợi gì khi vận hành sàn giao dịch carbon trong nước

Doanh nghiệp và người dân hưởng lợi gì khi vận hành sàn giao dịch carbon trong nước

Không chỉ dừng lại ở một công cụ quản lý môi trường, thị trường carbon đóng vai trò như một đòn bẩy kinh tế mang lại nguồn thu trực tiếp cho doanh nghiệp và nâng cao chất lượng sống cho người dân.
GLM-5.2 của Zhipu AI gây chú ý với hiệu năng tiệm cận OpenAI và Anthropic

GLM-5.2 của Zhipu AI gây chú ý với hiệu năng tiệm cận OpenAI và Anthropic

Mô hình AI GLM-5.2 do Zhipu AI phát triển đang thu hút sự quan tâm khi đạt hiệu năng lập trình tiệm cận các mô hình AI hàng đầu của Mỹ, trong khi chi phí sử dụng được đánh giá thấp hơn đáng kể.
Miko: Người bạn AI đầu tiên của trẻ em trong thế giới ngày càng cô đơn

Miko: Người bạn AI đầu tiên của trẻ em trong thế giới ngày càng cô đơn

Ít bậc phụ huynh nào dám thừa nhận thẳng thắn rằng con cái của họ đang lớn lên trong một thế giới kết nối hơn bao giờ hết nhưng cũng cô đơn hơn nhiều thế hệ trước. Cha mẹ đi làm từ sáng đến tối, ông bà sống xa, anh chị em mỗi người một màn hình điện thoại. Không có sự kết nối nào trong gia đình, thậm chí những giờ học trực tuyến khó có thể thay thế sự hiện diện của một người thực sự lắng nghe.
Google “không đủ bán” Gemini cho Meta

Google “không đủ bán” Gemini cho Meta

Cơn sốt AI đang nóng đến mức ngay cả các “ông lớn” công nghệ cũng không còn dư dả năng lực tính toán để phục vụ mọi nhu cầu.
Apple lao vào "canh bạc" chip Trung Quốc

Apple lao vào "canh bạc" chip Trung Quốc

Financial Times dẫn các nguồn tin thân cận cho biết Apple đang tìm kiếm sự chấp thuận từ Washington để mua chip nhớ từ CXMT, trong bối cảnh giá bộ nhớ leo thang mạnh vì làn sóng đầu tư vào trí tuệ nhân tạo.