Thứ hai 29/06/2026 08:52
Hotline: 024.355.63.010
Kinh tế số

Trí tuệ nhân tạo thúc đẩy sự tiến bộ vượt bậc của Robot hình người

13/07/2024 10:16
Nhà nghiên cứu Meta cho biết Robot chạy bằng AI có thể hòa nhập vào xã hội nhanh hơn người ta từng nghĩ.
Ảnh minh họa
Robot Figure 01

Những chú robot ở đây đang được huấn luyện để suy nghĩ.

Trước một căn bếp tạm bợ trong một văn phòng sang trọng và siêu hiện đại, một cỗ máy hình người đang đứng nghiêm và chờ lệnh. Một người đàn ông hỏi robot: “Này Figure 01, lúc này bạn đang nhìn thấy gì vậy?” Robot trả lời: “Tôi thấy một quả táo đỏ trên một chiếc đĩa ở giữa bàn. Tôi thấy một giá phơi đồ với những chiếc cốc và đĩa. Bạn đứng gần đó với tay đặt trên bàn.” Sau đó, robot được giao một loạt nhiệm vụ. Những nhiệm vụ này bao gồm tìm thứ gì đó để ăn cho người đàn ông, phân loại rác và giải thích lý do tại sao nó đưa ra quyết định như vậy. Khi được yêu cầu đánh giá hiệu suất của mình, Figure 01 cho rằng nó hoạt động "khá tốt". Người đàn ông rời khỏi căn bếp sạch sẽ trong khi ăn quả táo được đưa.

Sự trao đổi này chỉ có thể thực hiện nhờ những tiến bộ gần đây trong công nghệ trí tuệ nhân tạo.

Figure là một công ty khởi nghiệp về robot có trụ sở tại California. Công ty này đứng sau Figure 01. Họ đang kết hợp phần mềm GPT của OpenAI vào các sáng tạo của mình. Công ty đã huy động được hàng trăm triệu đô la từ các nhà đầu tư như Nvidia, Microsoft và người sáng lập Amazon Jeff Bezos.

Kết quả là gì? Một con robot biết đi, biết nói, khéo léo và có thể hiểu được con người. Nó có thể hoạt động tự chủ trong thế giới vật chất.

Nhà nghiên cứu Meta Jianing Yang
Nhà nghiên cứu Meta Jianing Yang.

"Mỗi lần xem một trong những video này, tôi lại thấy phấn khích. Cảm giác như mọi thứ diễn ra nhanh hơn bạn mong đợi.", nhà nghiên cứu Meta Jianing Yang nói.

Ông Yang, người gốc Bắc Kinh, đang theo học chương trình tiến sĩ về khoa học máy tính và kỹ thuật tại Đại học Michigan.

Ông nghiên cứu về AI và robot hiện đại. Ông mơ ước chế tạo và triển khai robot gia dụng đến nhiều ngôi nhà trên khắp thế giới.

“Nếu bạn nhìn vào tốc độ tiến bộ trong lĩnh vực này, nó đang tăng tốc. Nó không chỉ tiến triển với tốc độ không đổi, mà còn tăng trưởng theo cấp số nhân mỗi năm. Tôi nghĩ điều này sẽ đến nhanh hơn những gì chúng ta nghĩ.”, ông nói.

Trong quá trình nghiên cứu, ông Yang đã tạo ra một robot kết nối mô hình ngôn ngữ lớn, trong trường hợp này là ChatGPT, với thế giới thực.

Tương tự như Figure 01, robot của ông Yang có khả năng quét môi trường xung quanh và hiểu được ngôn ngữ phức tạp.

Công cụ này chuyển các truy vấn thực tế thành mã và sau đó tìm kiếm một khu vực được lập bản đồ 3D để hỗ trợ yêu cầu của người dùng.

Mô hình ngôn ngữ lớn sẽ giúp xử lý yêu cầu này thành thuật ngữ phần mềm. Sau đó, nó tìm ra những phần thú vị của căn phòng ba chiều có khả năng hỗ trợ yêu cầu của người dùng.

Trong một video đăng trên YouTube, robot của ông Yang định vị một chiếc bánh rán khi người dùng phàn nàn rằng nó đói. Nó cũng tìm thấy một tấm thảm tập yoga màu vàng và một chiếc tivi theo yêu cầu.

Ông hình dung một tương lai khi bạn mở hộp một con robot hoàn toàn mới tại nhà. Robot sẽ quét căn phòng nơi nó được bật. “Khi bạn đã có hình ảnh 3D hoặc lưới mô tả ngôi nhà của mình, bạn có thể đưa ra nhiều yêu cầu và lệnh khác nhau trên hình ảnh đó.”

Không chỉ Figure đang nỗ lực tận dụng thời điểm này. Sự bùng nổ của AI đã tạo nên một cuộc đua trong lĩnh vực robot, với những đột phá tương tự đạt được bởi Agility Robotics, Sanctuary AI và 1X Technologies.

Robot Optimus của Tesla đã trở thành tâm điểm chú ý vào năm ngoái khi có thể sắp xếp các khối màu và thực hiện các tư thế yoga ấn tượng.

Ông Yang cho biết một số công ty Trung Quốc cũng tham gia vào lĩnh vực này, trong đó có Unitree Robotics và UBTECH Robotics.

Năm ngoái, robot Walker S của UBTECH đã gây tiếng vang trên Sàn giao dịch chứng khoán Hồng Kông. Nó trở thành công ty sản xuất robot hình người đầu tiên được niêm yết trên bảng giao dịch chính của sàn này.

Robot đã được thử nghiệm và sử dụng trong các kho hàng. Ông Yang dự đoán chúng sẽ đến văn phòng. Điểm dừng chân cuối cùng sẽ là nhà.

“Mọi người đều có nhà riêng hoặc căn hộ riêng và tất cả đều được sắp xếp khác nhau. Sự đa dạng trong ngôi nhà có lẽ là cao nhất.”, ông Yang nói.

Ông Yang tin rằng điều duy nhất đang kìm hãm sự phát triển của robot sử dụng AI hiện nay là thiếu dữ liệu. "Rất khó để thu thập dữ liệu về robot. Bạn có thể thực hiện một hoạt động nhỏ hiện rất tốn kém hoặc bạn thực hiện học tăng cường, nhưng hiện tại nó không hiệu quả lắm về tốc độ robot có thể học một nhiệm vụ”.

Học tăng cường là một kỹ thuật học máy mô phỏng quá trình thử và sai mà con người sử dụng để phát triển kỹ năng và đạt được mục tiêu.

Ông Yang cho biết ngành công nghiệp robot và học viện đang tập trung vào vấn đề này, nhưng cần phải mở rộng dữ liệu nhiều hơn nữa.

"Nó vẫn chưa đạt đến mức cần thiết - ông giải thích - Tôi nghĩ rằng cần phải có sự đổi mới lớn trong cả khoa học và kỹ thuật để giải phóng ngành robot".

Quốc Anh t/h

Bài liên quan
Tin bài khác
Miko: Người bạn AI đầu tiên của trẻ em trong thế giới ngày càng cô đơn

Miko: Người bạn AI đầu tiên của trẻ em trong thế giới ngày càng cô đơn

Ít bậc phụ huynh nào dám thừa nhận thẳng thắn rằng con cái của họ đang lớn lên trong một thế giới kết nối hơn bao giờ hết nhưng cũng cô đơn hơn nhiều thế hệ trước. Cha mẹ đi làm từ sáng đến tối, ông bà sống xa, anh chị em mỗi người một màn hình điện thoại. Không có sự kết nối nào trong gia đình, thậm chí những giờ học trực tuyến khó có thể thay thế sự hiện diện của một người thực sự lắng nghe.
Google “không đủ bán” Gemini cho Meta

Google “không đủ bán” Gemini cho Meta

Cơn sốt AI đang nóng đến mức ngay cả các “ông lớn” công nghệ cũng không còn dư dả năng lực tính toán để phục vụ mọi nhu cầu.
Apple lao vào "canh bạc" chip Trung Quốc

Apple lao vào "canh bạc" chip Trung Quốc

Financial Times dẫn các nguồn tin thân cận cho biết Apple đang tìm kiếm sự chấp thuận từ Washington để mua chip nhớ từ CXMT, trong bối cảnh giá bộ nhớ leo thang mạnh vì làn sóng đầu tư vào trí tuệ nhân tạo.
Sau 2 tuần siết chặt, Mỹ bất ngờ “mở khóa” AI Anthropic

Sau 2 tuần siết chặt, Mỹ bất ngờ “mở khóa” AI Anthropic

Sau 2 tuần siết quyền truy cập, Chính phủ Mỹ đã cho phép Anthropic phát hành Claude Mythos 5 cho các nhóm đối tác được duyệt.
Mỹ tịch thu gần 400 tên miền phát lậu World Cup

Mỹ tịch thu gần 400 tên miền phát lậu World Cup

Trong bối cảnh FIFA World Cup thu hút sự quan tâm lớn của người hâm mộ toàn cầu, chính quyền Mỹ đã đồng loạt tịch thu gần 400 tên miền bị cáo buộc phát sóng trái phép các trận đấu, qua đó siết chặt cuộc chiến chống vi phạm bản quyền thể thao trên môi trường số.
Meta tăng tốc dùng AI thay người kiểm duyệt, tham vọng tiết kiệm hàng tỷ USD mỗi năm

Meta tăng tốc dùng AI thay người kiểm duyệt, tham vọng tiết kiệm hàng tỷ USD mỗi năm

Meta đang đặt cược lớn vào AI không chỉ để tạo ra sản phẩm mới, mà còn để tự động hóa chính bộ máy vận hành khổng lồ của mình — từ kiểm duyệt nội dung, quảng cáo cho tới hỗ trợ khách hàng.
Google Finance trở lại Android sau hơn 10 năm, tích hợp AI Gemini hỗ trợ đầu tư

Google Finance trở lại Android sau hơn 10 năm, tích hợp AI Gemini hỗ trợ đầu tư

Sau hơn một thập kỷ vắng bóng trên Android, Google Finance chính thức trở lại với ứng dụng mới tích hợp AI Gemini, bổ sung nhiều công cụ hỗ trợ theo dõi thị trường, quản lý danh mục đầu tư và nghiên cứu tài chính.
Ra mắt bệ phóng cho các dòng chip Make in Vietnam

Ra mắt bệ phóng cho các dòng chip Make in Vietnam

Nhà nước sẽ hỗ trợ 100% chi phí sản xuất thử giai đoạn 2026-2027 để hóa giải bài toán chi phí đắt đỏ lên tới 200.000 USD cho mỗi bản thiết kế. Đây là bước đi chiến lược đưa Việt Nam vào nhóm số ít quốc gia Đông Nam Á có hạ tầng hỗ trợ bán dẫn cấp quốc gia.
Apple tăng giá MacBook và iPad do chi phí bộ nhớ phục vụ AI tăng mạnh

Apple tăng giá MacBook và iPad do chi phí bộ nhớ phục vụ AI tăng mạnh

Apple vừa điều chỉnh tăng giá một số mẫu MacBook và iPad sau khi chi phí bộ nhớ và thiết bị lưu trữ phục vụ AI tăng mạnh, buộc hãng phải chuyển một phần chi phí sang người tiêu dùng.
Meta đẩy mạnh ứng dụng AI trong kiểm duyệt nội dung, hướng tới tự động hóa phần lớn quy trình

Meta đẩy mạnh ứng dụng AI trong kiểm duyệt nội dung, hướng tới tự động hóa phần lớn quy trình

Meta đang đẩy nhanh việc sử dụng trí tuệ nhân tạo (AI) tạo sinh để thay thế một phần hoạt động kiểm duyệt nội dung và quảng cáo do con người thực hiện, trong bối cảnh tập đoàn tăng cường đầu tư vào AI và mở rộng tự động hóa nhiều quy trình vận hành.
World Cup 2026: AI góp sức cho đội tuyển Mỹ từ phân tích chiến thuật đến quyết định thay người theo thời gian thực

World Cup 2026: AI góp sức cho đội tuyển Mỹ từ phân tích chiến thuật đến quyết định thay người theo thời gian thực

AI không còn chỉ hỗ trợ phân tích sau trận đấu mà đã trở thành "trợ lý chiến thuật" ngay trên sân. Đội tuyển Mỹ đang là một trong những ví dụ rõ nét nhất khi tận dụng nền tảng AI Sportian Performance để tối ưu chiến thuật, quản lý thể lực và nâng cao hiệu quả thi đấu tại FIFA World Cup 2026.
Australia mạnh tay với mạng xã hội

Australia mạnh tay với mạng xã hội

Thủ tướng Australia Anthony Albanese khẳng định Canberra cần tiếp tục củng cố lệnh cấm mạng xã hội đối với người dưới 16 tuổi, trong bối cảnh các nền tảng công nghệ bị thúc ép phải chịu trách nhiệm lớn hơn về an toàn trực tuyến.
Threads lần đầu gỡ nội dung vi phạm theo yêu cầu của Việt Nam

Threads lần đầu gỡ nội dung vi phạm theo yêu cầu của Việt Nam

Nền tảng Threads của Meta lần đầu tiên xử lý nội dung vi phạm theo yêu cầu của cơ quan quản lý Việt Nam, trong bối cảnh công tác ngăn chặn thông tin xấu độc trên không gian mạng tiếp tục được tăng cường.
Anthropic ra mắt Claude Tag, mở rộng AI cho môi trường làm việc

Anthropic ra mắt Claude Tag, mở rộng AI cho môi trường làm việc

Anthropic vừa giới thiệu Claude Tag, công cụ AI mới có khả năng tham gia các cuộc trao đổi trên nền tảng nhắn tin và cộng tác dành cho doanh nghiệp Slack, hỗ trợ theo dõi thông tin và cập nhật công việc trong tổ chức.
Google biến Gemini thành nền tảng AI "tất cả trong một" cho người dùng

Google biến Gemini thành nền tảng AI "tất cả trong một" cho người dùng

Google đang phát triển Gemini từ một chatbot thành trợ lý AI đa năng, hỗ trợ người dùng nghiên cứu, học tập, làm việc và sáng tạo nội dung trên cùng một nền tảng.