Thứ năm 21/05/2026 14:28
Hotline: 024.355.63.010
Kinh tế số

Gemini Omni và tham vọng tạo ra AI “hiểu thế giới” của Google

Không chỉ dừng ở việc tạo video bằng AI, Gemini Omni cho thấy Google đang theo đuổi mục tiêu xây dựng một hệ thống có khả năng hiểu và mô phỏng thế giới thực theo cách gần giống con người hơn.

Tại sự kiện Google I/O 2026, Google giới thiệu Gemini Omni như một bước tiến mới trong cuộc đua AI đa phương thức. Điều khiến giới công nghệ chú ý không nằm ở khả năng tạo video, mà ở tham vọng phía sau mô hình này: phát triển AI có thể hiểu cách thế giới vận hành, thay vì chỉ xử lý ngôn ngữ hay tạo phản hồi theo xác suất.

Trong nhiều năm qua, phần lớn mô hình AI hiện đại hoạt động dựa trên dữ liệu văn bản khổng lồ để dự đoán câu trả lời hợp lý tiếp theo. Chúng có thể viết nội dung, dịch thuật, lập trình hay trả lời câu hỏi với độ chính xác ngày càng cao, nhưng vẫn chủ yếu xử lý thông tin theo mô hình xác suất.

Gemini Omni và tham vọng tạo ra AI “hiểu thế giới” của Google
Gemini Omni và tham vọng tạo ra AI “hiểu thế giới” của Google

Theo các tài liệu được Google DeepMind công bố, Gemini Omni được phát triển theo hướng “omni-modal”, tức có thể xử lý đồng thời văn bản, hình ảnh, âm thanh và video trong cùng một hệ thống AI thống nhất.

Tuy nhiên, điều Google nhấn mạnh không chỉ là khả năng tạo nội dung đa phương thức. Hãng liên tục đề cập tới các khái niệm như “simulation”, “physics” và “multimodal reasoning”, cho thấy mục tiêu lớn hơn là giúp AI hiểu được các quy luật vận hành của thế giới thực.

Điểm đáng chú ý của Gemini Omni nằm ở khả năng mô phỏng các yếu tố vật lý như trọng lực, chuyển động, ánh sáng hay tính liên tục giữa các cảnh quay. Theo Google, người dùng chỉ cần cung cấp hình ảnh, âm thanh hoặc mô tả văn bản, hệ thống có thể tạo ra video hoàn chỉnh với chuyển động và lời thoại phù hợp với ngữ cảnh.

Các đoạn demo ban đầu cũng cho thấy AI có thể duy trì sự nhất quán của nhân vật và bối cảnh khi người dùng chỉnh sửa video bằng hội thoại tự nhiên. Người dùng có thể yêu cầu thay đổi thời tiết, góc máy hay phong cách hình ảnh mà không làm đứt gãy logic của cảnh quay.

Đây được xem là hướng phát triển mới của ngành AI, thường được gọi là “world model” - mô hình có khả năng mô phỏng và suy luận về thế giới thực.

Khác với chatbot truyền thống chỉ học từ dữ liệu văn bản, world model được kỳ vọng có thể hiểu sâu hơn mối liên hệ giữa các hiện tượng vật lý, chẳng hạn ánh sáng thay đổi theo góc quay, vật thể chịu tác động của trọng lực hay chuyển động phải diễn ra liên tục theo thời gian.

Theo TechCrunch, Google đang định vị Gemini Omni như một nền tảng có thể tạo nội dung từ gần như mọi loại dữ liệu đầu vào. Hướng đi này tương đồng với tham vọng mà OpenAI từng mô tả với Sora - mô hình video AI được xem như công cụ mô phỏng thế giới.

Đằng sau Gemini Omni cũng là sự thay đổi trong chiến lược AI của Google. Thay vì phát triển riêng lẻ chatbot, AI hình ảnh hay AI video, công ty đang hướng tới một hệ thống thống nhất có khả năng nhìn, nghe, suy luận và tạo nội dung trong cùng môi trường.

Dù vậy, khoảng cách giữa tham vọng và thực tế vẫn còn khá lớn. Các bản thử nghiệm hiện tại vẫn xuất hiện lỗi chuyển động, nhân vật thiếu nhất quán hoặc một số chi tiết vật lý chưa hoàn toàn tự nhiên. Google cũng chưa công bố đầy đủ các benchmark kỹ thuật để giới nghiên cứu đánh giá chính xác năng lực của Gemini Omni.

Dẫu còn trong giai đoạn đầu, Gemini Omni cho thấy AI đang bước sang một hướng phát triển mới, nơi mục tiêu không chỉ là tạo chatbot thông minh hơn mà còn là xây dựng các hệ thống có khả năng quan sát, suy luận và tương tác với thế giới thực theo cách ngày càng gần với trí tuệ con người.

Tin bài khác
Nvidia lập đỉnh doanh thu nhờ làn sóng AI agent

Nvidia lập đỉnh doanh thu nhờ làn sóng AI agent

Sự bùng nổ của các tác nhân AI (AI agent) cùng nhu cầu điện toán trung tâm dữ liệu tăng mạnh đã giúp Nvidia ghi nhận quý kinh doanh cao nhất lịch sử, với doanh thu vượt 81 tỷ USD và lợi nhuận tăng vọt ngoài kỳ vọng của Phố Wall.
TP. Hồ Chí Minh lần đầu lọt Top 100 hệ sinh thái khởi nghiệp toàn cầu, vượt mục tiêu trước 4 năm

TP. Hồ Chí Minh lần đầu lọt Top 100 hệ sinh thái khởi nghiệp toàn cầu, vượt mục tiêu trước 4 năm

TP. Hồ Chí Minh lần đầu tiên góp mặt trong Top 100 hệ sinh thái khởi nghiệp sáng tạo năng động nhất thế giới, đánh dấu cột mốc quan trọng trong hành trình xây dựng đô thị đổi mới sáng tạo và khẳng định vị thế đầu tàu công nghệ, khởi nghiệp của Việt Nam trên bản đồ toàn cầu.
Google và Blackstone hợp tác: Doanh nghiệp toàn cầu sẽ vận hành ra sao?

Google và Blackstone hợp tác: Doanh nghiệp toàn cầu sẽ vận hành ra sao?

Có một câu hỏi rất đáng suy nghĩ đang xuất hiện trong giới công nghệ và quản trị toàn cầu, nếu một ngày nào đó doanh nghiệp không còn phải mua phần mềm, không cần xây trung tâm dữ liệu, không cần đầu tư đội ngũ kỹ thuật khổng lồ mà chỉ cần bật một “công tắc” để sử dụng trí tuệ nhân tạo như sử dụng điện, điều gì sẽ xảy ra?
Apple tăng tốc AI trên iOS 27, bổ sung loạt công cụ viết thông minh cho Siri

Apple tăng tốc AI trên iOS 27, bổ sung loạt công cụ viết thông minh cho Siri

Theo Bloomberg, Apple đang chuẩn bị nâng cấp mạnh mẽ Siri và bộ Writing Tools trên iOS 27, với nhiều tính năng AI hỗ trợ viết, chỉnh sửa và kiểm tra ngữ pháp ngay trên thiết bị.
Meta lên kế hoạch tái cấu trúc quy mô lớn, cắt giảm 10% nhân sự toàn cầu

Meta lên kế hoạch tái cấu trúc quy mô lớn, cắt giảm 10% nhân sự toàn cầu

Meta dự kiến sa thải khoảng 10% nhân sự toàn cầu, đồng thời điều chuyển 7.000 nhân viên sang các dự án AI trong kế hoạch tái cấu trúc quy mô lớn đang gây nhiều tranh cãi nội bộ.
Cuộc đua toàn cầu mới bắt đầu khi quyền lực thế kỷ 21 không còn nằm ở dầu mỏ

Cuộc đua toàn cầu mới bắt đầu khi quyền lực thế kỷ 21 không còn nằm ở dầu mỏ

Trong nhiều năm, khi nhắc tới cạnh tranh Mỹ – Trung, thế giới thường nghĩ tới chiến tranh thương mại, thuế quan hay căng thẳng địa chính trị. Nhưng hiện nay, một nỗi lo lớn hơn nhiều đang âm thầm xuất hiện trong giới công nghệ, tài chính và hoạch định chiến lược toàn cầu. Quyền lực thế kỷ 21 không còn nằm ở dầu mỏ mà nằm ở đâu?
Google và Blackstone thành lập liên doanh điện toán đám mây AI

Google và Blackstone thành lập liên doanh điện toán đám mây AI

Google và Blackstone đã thành lập liên doanh điện toán đám mây AI tại Mỹ, với vốn chủ sở hữu ban đầu 5 tỷ USD từ Blackstone và mục tiêu đưa 500 MW công suất trung tâm dữ liệu vào hoạt động từ năm 2027.
Bảo vệ dữ liệu cá nhân trước làn sóng lừa đảo công nghệ AI

Bảo vệ dữ liệu cá nhân trước làn sóng lừa đảo công nghệ AI

Trong kỷ nguyên số, dữ liệu đang trở thành loại “tài sản mới” có giá trị không thua kém vốn, tài nguyên hay nhân lực. Với lĩnh vực ngân hàng – tài chính.
Techmart AI 2026: Doanh nghiệp tăng tốc ứng dụng trí tuệ nhân tạo vào sản xuất và quản trị

Techmart AI 2026: Doanh nghiệp tăng tốc ứng dụng trí tuệ nhân tạo vào sản xuất và quản trị

Trong bối cảnh AI được xác định là công nghệ chiến lược quốc gia, Techmart chuyên ngành “Sản phẩm ứng dụng trí tuệ nhân tạo” đang trở thành điểm kết nối giữa doanh nghiệp, viện nghiên cứu và nhà đầu tư nhằm thúc đẩy thương mại hóa các giải pháp AI tại Việt Nam.
Lần đầu tiên cuộc thi phim ngắn bằng AI có giá trị giải thưởng lên đến 2,5tỷ đồng

Lần đầu tiên cuộc thi phim ngắn bằng AI có giá trị giải thưởng lên đến 2,5tỷ đồng

Cuộc thi nằm trong khuôn khổ chương trình “Cùng kể câu chuyện Việt Nam”, hướng đến việc khuyến khích cộng đồng sáng tạo, đặc biệt là giới trẻ, ứng dụng công nghệ AI để kể lại lịch sử, huyền sử, văn hóa và vẻ đẹp Việt Nam bằng ngôn ngữ điện ảnh hiện đại.
BizTech và AI đang tái định nghĩa năng lực cạnh tranh doanh nghiệp

BizTech và AI đang tái định nghĩa năng lực cạnh tranh doanh nghiệp

BizTech và AI đang tái định nghĩa năng lực cạnh tranh doanh nghiệp, trong làn sóng chuyển đổi số toàn cầu, công nghệ không còn đứng phía sau để “hỗ trợ” vận hành doanh nghiệp mà đang dần trở thành lõi trung tâm quyết định năng lực cạnh tranh, tốc độ tăng trưởng và khả năng thích ứng của doanh nghiệp trong nền kinh tế số.
Phỏng vấn 4.400 CEO toàn cầu nhưng kết quả thật bất ngờ về ứng dụng AI hiệu quả

Phỏng vấn 4.400 CEO toàn cầu nhưng kết quả thật bất ngờ về ứng dụng AI hiệu quả

Trong khi phần lớn thế giới vẫn nói về AI như động lực của một cuộc cách mạng công nghệ, thì phía sau cánh cửa phòng họp của các tập đoàn lớn toàn cầu, một tâm lý hoàn toàn khác đang xuất hiện: các CEO buộc phải tăng tốc đầu tư AI vì sợ bị bỏ lại phía sau, nhưng đồng thời ngày càng lo ngại rằng thị trường đang tiến tới giai đoạn “AI phải tạo lợi nhuận thật” thay vì chỉ tạo hiệu ứng truyền thông.
Máy bay A380 của Emirates được trang bị wi-fi Starlink

Máy bay A380 của Emirates được trang bị wi-fi Starlink

Tính đến thời điểm hiện tại, 25 chiếc Boeing 777-300ER đã được trang bị Starlink, và chiếc A380 đầu tiên cũng đã chính thức đi vào vận hành, đã có hơn 650.000 hành khách của Emirates được trải nghiệm dịch vụ kết nối hiện đại này trên các chuyến bay có trang bị Starlink.
Đà Nẵng số hóa di sản bằng VR360

Đà Nẵng số hóa di sản bằng VR360

Phường Hải Vân và Bàn Thạch (Đà Nẵng) đồng loạt triển khai nền tảng thực tế ảo VR360 để số hóa di tích lịch sử, văn hóa, mở hướng phát triển du lịch thông minh và đưa di sản đến gần hơn với cộng đồng, đặc biệt là giới trẻ.
YouTube ghi nhận hơn 2 tỉ giờ xem Shorts mỗi tháng trên TV

YouTube ghi nhận hơn 2 tỉ giờ xem Shorts mỗi tháng trên TV

Xu hướng xem video ngắn trên màn hình TV đang tăng mạnh khi YouTube ghi nhận hơn 2 tỉ giờ xem Shorts mỗi tháng, cho thấy nội dung dọc ngày càng mở rộng khỏi nền tảng điện thoại.