Gemini Omni và tham vọng tạo ra AI “hiểu thế giới” của Google

21/05/2026 13:58

Công nghệ

Không chỉ dừng ở việc tạo video bằng AI, Gemini Omni cho thấy Google đang theo đuổi mục tiêu xây dựng một hệ thống có khả năng hiểu và mô phỏng thế giới thực theo cách gần giống con người hơn.

Tại sự kiện Google I/O 2026, Google giới thiệu Gemini Omni như một bước tiến mới trong cuộc đua AI đa phương thức. Điều khiến giới công nghệ chú ý không nằm ở khả năng tạo video, mà ở tham vọng phía sau mô hình này: phát triển AI có thể hiểu cách thế giới vận hành, thay vì chỉ xử lý ngôn ngữ hay tạo phản hồi theo xác suất.

Trong nhiều năm qua, phần lớn mô hình AI hiện đại hoạt động dựa trên dữ liệu văn bản khổng lồ để dự đoán câu trả lời hợp lý tiếp theo. Chúng có thể viết nội dung, dịch thuật, lập trình hay trả lời câu hỏi với độ chính xác ngày càng cao, nhưng vẫn chủ yếu xử lý thông tin theo mô hình xác suất.

Gemini Omni và tham vọng tạo ra AI “hiểu thế giới” của Google

Theo các tài liệu được Google DeepMind công bố, Gemini Omni được phát triển theo hướng “omni-modal”, tức có thể xử lý đồng thời văn bản, hình ảnh, âm thanh và video trong cùng một hệ thống AI thống nhất.

Tuy nhiên, điều Google nhấn mạnh không chỉ là khả năng tạo nội dung đa phương thức. Hãng liên tục đề cập tới các khái niệm như “simulation”, “physics” và “multimodal reasoning”, cho thấy mục tiêu lớn hơn là giúp AI hiểu được các quy luật vận hành của thế giới thực.

Điểm đáng chú ý của Gemini Omni nằm ở khả năng mô phỏng các yếu tố vật lý như trọng lực, chuyển động, ánh sáng hay tính liên tục giữa các cảnh quay. Theo Google, người dùng chỉ cần cung cấp hình ảnh, âm thanh hoặc mô tả văn bản, hệ thống có thể tạo ra video hoàn chỉnh với chuyển động và lời thoại phù hợp với ngữ cảnh.

Các đoạn demo ban đầu cũng cho thấy AI có thể duy trì sự nhất quán của nhân vật và bối cảnh khi người dùng chỉnh sửa video bằng hội thoại tự nhiên. Người dùng có thể yêu cầu thay đổi thời tiết, góc máy hay phong cách hình ảnh mà không làm đứt gãy logic của cảnh quay.

Đây được xem là hướng phát triển mới của ngành AI, thường được gọi là “world model” - mô hình có khả năng mô phỏng và suy luận về thế giới thực.

Khác với chatbot truyền thống chỉ học từ dữ liệu văn bản, world model được kỳ vọng có thể hiểu sâu hơn mối liên hệ giữa các hiện tượng vật lý, chẳng hạn ánh sáng thay đổi theo góc quay, vật thể chịu tác động của trọng lực hay chuyển động phải diễn ra liên tục theo thời gian.

Theo TechCrunch, Google đang định vị Gemini Omni như một nền tảng có thể tạo nội dung từ gần như mọi loại dữ liệu đầu vào. Hướng đi này tương đồng với tham vọng mà OpenAI từng mô tả với Sora - mô hình video AI được xem như công cụ mô phỏng thế giới.

Đằng sau Gemini Omni cũng là sự thay đổi trong chiến lược AI của Google. Thay vì phát triển riêng lẻ chatbot, AI hình ảnh hay AI video, công ty đang hướng tới một hệ thống thống nhất có khả năng nhìn, nghe, suy luận và tạo nội dung trong cùng môi trường.

Dù vậy, khoảng cách giữa tham vọng và thực tế vẫn còn khá lớn. Các bản thử nghiệm hiện tại vẫn xuất hiện lỗi chuyển động, nhân vật thiếu nhất quán hoặc một số chi tiết vật lý chưa hoàn toàn tự nhiên. Google cũng chưa công bố đầy đủ các benchmark kỹ thuật để giới nghiên cứu đánh giá chính xác năng lực của Gemini Omni.

Dẫu còn trong giai đoạn đầu, Gemini Omni cho thấy AI đang bước sang một hướng phát triển mới, nơi mục tiêu không chỉ là tạo chatbot thông minh hơn mà còn là xây dựng các hệ thống có khả năng quan sát, suy luận và tương tác với thế giới thực theo cách ngày càng gần với trí tuệ con người.

TAGS:

Gemini Omni Google AI AI đa phương thức AI tạo video Google Gemini world model AI Gemini DeepMind AI hiểu thế giới AI video Google I/O 2026

Bài liên quan

Người Việt dẫn đầu Đông Nam Á về sử dụng Gemini cho học tập

Việt Nam dẫn đầu Đông Nam Á về tần suất sử dụng Gemini trong hỗ trợ học thuật

Tối ưu hóa trải nghiệm mua sắm cùng Gemini

Tin bài khác

Australia thúc đẩy khuôn khổ quốc gia về trí tuệ nhân tạo

15/07/2026 15:39

Thủ tướng Australia Anthony Albanese dự kiến công bố khuôn khổ quốc gia về trí tuệ nhân tạo, trong bối cảnh Canberra muốn khai thác tiềm năng của công nghệ này đồng thời ứng phó các nguy cơ về an ninh, dân chủ và xã hội.

Anh dự kiến áp "giờ giới nghiêm" mạng xã hội với người dưới 18 tuổi

15/07/2026 11:14

Chính phủ Anh đang đề xuất dự thảo về việc áp "giờ giới nghiêm" đối với việc sử dụng mạng xã hội của thanh thiếu niên nước này, nhằm bảo vệ sức khoẻ tinh thần của nhóm đối tượng nêu trên trong bối cảnh các nền tảng xã hội đang trở nên thiếu an toàn đối với giới trẻ.

AI thúc đẩy làn sóng doanh nghiệp một người trên toàn cầu

15/07/2026 10:47

Sự phát triển của AI tạo sinh, mạng xã hội và các nền tảng thương mại điện tử đang làm thay đổi cách doanh nghiệp được hình thành. Chỉ với một người cùng các công cụ số, nhiều mô hình kinh doanh có thể vận hành hiệu quả, tạo nên làn sóng "doanh nghiệp một người" trên phạm vi toàn cầu.

AI giúp đánh giá chất lượng nông sản, giảm thất thoát sau thu hoạch

15/07/2026 09:24

Trí tuệ nhân tạo đang mở ra hướng tiếp cận mới trong kiểm định chất lượng nông sản khi có thể đánh giá nhanh, không phá hủy mẫu và hỗ trợ truy xuất nguồn gốc. Công nghệ này được kỳ vọng giúp giảm tổn thất sau thu hoạch, nâng cao chất lượng nông sản và đáp ứng yêu cầu ngày càng khắt khe của thị trường xuất khẩu.

CEO Google DeepMind: AI sắp vượt tầm kiểm soát?

14/07/2026 17:04

Trong bối cảnh các mô hình AI ngày càng mạnh và khó kiểm soát, CEO Google DeepMind Demis Hassabis cho rằng Mỹ cần sớm lập một cơ quan chuyên trách để kiểm tra những hệ thống tiên tiến nhất trước khi chúng được tung ra thị trường.

Nvidia siết “danh sách trắng” khách mua chip AI tại châu Á, hơn một nửa khách hàng bị loại sau vòng rà soát mới

14/07/2026 17:03

Động thái mới của Nvidia cho thấy áp lực kiểm soát xuất khẩu chip AI của Mỹ đang lan sâu vào chuỗi cung ứng châu Á, trong bối cảnh Washington tìm cách ngăn các bộ xử lý tiên tiến đi vòng qua nước thứ ba để tới Trung Quốc.

Google mua điện từ siêu dự án mặt trời tại Mỹ giữa áp lực năng lượng sạch

14/07/2026 15:49

Thỏa thuận mua toàn bộ sản lượng điện giai đoạn đầu của dự án Steel River cho thấy các tập đoàn công nghệ Mỹ đang gia tăng tìm kiếm nguồn năng lượng sạch quy mô lớn, trong khi nhu cầu điện cho trung tâm dữ liệu tăng nhanh và chính sách hỗ trợ năng lượng tái tạo tại Mỹ có xu hướng thu hẹp.

EU xem xét siết quản lý mạng xã hội đối với trẻ em

14/07/2026 15:42

Liên minh châu Âu (EU) đang xây dựng các quy định mới nhằm tăng cường bảo vệ trẻ em trên môi trường số, trong đó có thể bao gồm giới hạn độ tuổi sử dụng mạng xã hội và các biện pháp xác minh người dùng nghiêm ngặt hơn.

Apple phát hành iOS 27 Public Beta, Siri AI lần đầu đến tay người dùng

14/07/2026 15:26

Apple đã phát hành iOS 27 Public Beta, lần đầu cho phép người dùng phổ thông trải nghiệm Siri AI - trợ lý ảo thế hệ mới được xây dựng lại với nhiều tính năng trí tuệ nhân tạo.

Xiaomi Redmi A7 có phù hợp với tài xế công nghệ và người di chuyển nhiều không?

13/07/2026 15:54

Nhóm người dùng di chuyển liên tục như tài xế công nghệ, shipper hay nhân viên giao nhận thường nhìn điện thoại theo cách rất khác. Điều họ cần không phải một thiết bị đẹp để phô diễn thông số, mà là chiếc máy dễ nhìn ngoài trời, pin đủ lâu, mở ứng dụng bản đồ và liên lạc ổn định. Xiaomi Redmi A7 là cái tên đang được quan tâm vì nhiều đặc điểm của máy bám khá sát nhu cầu sử dụng thực địa này.

Đại gia bán dẫn Hàn Quốc rót 133 triệu USD xây nhà máy thứ hai tại Bắc Ninh

12/07/2026 10:17

Trước làn sóng bùng nổ của hạ tầng dữ liệu và công nghệ thông minh, các tập đoàn chuỗi cung ứng công nghệ cao liên tục dịch chuyển cứ điểm sản xuất. Mới đây, hà sản xuất bảng mạch in hàng đầu Hàn Quốc TLB đã công bố kế hoạch đầu tư mạnh mẽ vào thủ phủ công nghiệp Bắc Ninh, mở đường cho việc đón đầu các dòng chíp nhớ và thiết bị AI thế hệ mới.

Road to AI 2026: "Trợ lý Pháp lý AI" giải được bài toán từ nỗi đau doanh nghiệp

12/07/2026 07:21

Có những khoảnh khắc trong giáo dục mà ranh giới giữa trường học và thị trường thực sự bắt đầu mờ đi. Vòng Demoday Top 10 của Road to AI 2026 là một trong những khoảnh khắc như vậy. Sau hơn ba tháng triển khai, cuộc thi không còn là một sân chơi công nghệ dành riêng cho sinh viên nữa, mà đã trở thành không gian kết nối thật sự giữa trường đại học, doanh nghiệp và các chuyên gia AI đang cùng nhau tìm kiếm lời giải cho bài toán chuyển đổi số mà hàng trăm nghìn doanh nghiệp Việt Nam đang đối mặt mỗi ngày.

Đà Nẵng định vị trung tâm vi mạch bán dẫn miền Trung, sẵn sàng đón làn sóng đầu tư công nghệ cao

11/07/2026 21:59

Đà Nẵng đang từng bước hiện thực hóa mục tiêu trở thành trung tâm công nghiệp vi mạch bán dẫn và công nghệ cao của khu vực miền Trung khi đồng thời xây dựng hệ sinh thái đầu tư, hoàn thiện cơ chế ưu đãi và phát triển nguồn nhân lực chất lượng cao nhằm tham gia sâu hơn vào chuỗi giá trị bán dẫn toàn cầu.

Điện Biên mở cơ chế mới để phát triển hệ sinh thái du lịch số

11/07/2026 16:39

Lần đầu tiên ban hành nghị quyết riêng hỗ trợ phát triển sản phẩm du lịch, Điện Biên tạo cơ chế đồng bộ từ hạ tầng, doanh nghiệp đến truyền thông số, mở hướng đi mới cho ngành du lịch.

Meta rút ứng dụng AI tạo ảnh: Cú vấp vì dữ liệu người dùng

11/07/2026 09:22

Tính năng AI tạo ảnh mới của Meta vừa xuất hiện đã phải dừng lại, phơi bày nghịch lý của các ông lớn công nghệ: càng muốn tận dụng kho dữ liệu người dùng để tăng tốc trong cuộc đua AI, họ càng đối mặt áp lực lớn hơn về quyền riêng tư và sự đồng thuận.

Xem thêm

Đọc nhiều

Gemini Omni và tham vọng tạo ra AI “hiểu thế giới” của Google

Người Việt dẫn đầu Đông Nam Á về sử dụng Gemini cho học tập

Việt Nam dẫn đầu Đông Nam Á về tần suất sử dụng Gemini trong hỗ trợ học thuật

Tối ưu hóa trải nghiệm mua sắm cùng Gemini

Australia thúc đẩy khuôn khổ quốc gia về trí tuệ nhân tạo

Anh dự kiến áp "giờ giới nghiêm" mạng xã hội với người dưới 18 tuổi

AI thúc đẩy làn sóng doanh nghiệp một người trên toàn cầu

AI giúp đánh giá chất lượng nông sản, giảm thất thoát sau thu hoạch

CEO Google DeepMind: AI sắp vượt tầm kiểm soát?

Nvidia siết “danh sách trắng” khách mua chip AI tại châu Á, hơn một nửa khách hàng bị loại sau vòng rà soát mới

Google mua điện từ siêu dự án mặt trời tại Mỹ giữa áp lực năng lượng sạch

EU xem xét siết quản lý mạng xã hội đối với trẻ em

Apple phát hành iOS 27 Public Beta, Siri AI lần đầu đến tay người dùng

Xiaomi Redmi A7 có phù hợp với tài xế công nghệ và người di chuyển nhiều không?

Đại gia bán dẫn Hàn Quốc rót 133 triệu USD xây nhà máy thứ hai tại Bắc Ninh

Road to AI 2026: "Trợ lý Pháp lý AI" giải được bài toán từ nỗi đau doanh nghiệp

Đà Nẵng định vị trung tâm vi mạch bán dẫn miền Trung, sẵn sàng đón làn sóng đầu tư công nghệ cao

Điện Biên mở cơ chế mới để phát triển hệ sinh thái du lịch số

Meta rút ứng dụng AI tạo ảnh: Cú vấp vì dữ liệu người dùng

Road to AI 2026: "Trợ lý Pháp lý AI" giải được bài toán từ nỗi đau doanh nghiệp

Đại gia bán dẫn Hàn Quốc rót 133 triệu USD xây nhà máy thứ hai tại Bắc Ninh

NuraLogix: Khi chiếc gương trong phòng tắm biết nhiều hơn về sức khỏe của bạn

Apple phát hành iOS 27 Public Beta, Siri AI lần đầu đến tay người dùng

Meta đối mặt án phạt “khủng” 1.400 tỷ USD vì cáo buộc khiến Facebook, Instagram gây nghiện với trẻ em

Điện Biên mở cơ chế mới để phát triển hệ sinh thái du lịch số