Gemini mở rộng vai trò trong học tập và công việc
Google cho biết nhu cầu sử dụng AI đang thay đổi nhanh chóng khi người dùng không chỉ cần những câu trả lời tức thời mà còn mong muốn được hỗ trợ trong toàn bộ quá trình làm việc, từ tìm kiếm thông tin, phân tích dữ liệu đến hoàn thiện sản phẩm cuối cùng.
Hiện Gemini được cung cấp trên nền tảng web và ứng dụng di động, tích hợp nhiều tính năng phục vụ học tập và công việc như Deep Research dành cho nghiên cứu chuyên sâu, Canvas hỗ trợ soạn thảo và biên tập tài liệu dài, cùng Gemini Live cho phép tương tác bằng giọng nói và hình ảnh theo thời gian thực.
![]() |
| Google biến Gemini thành nền tảng AI "tất cả trong một" cho người dùng |
Theo Google, ứng dụng Gemini hiện có hơn 900 triệu người dùng hoạt động hằng tháng trên toàn cầu, tăng gấp đôi so với cùng kỳ năm trước. Khối lượng yêu cầu xử lý mỗi ngày cũng tăng gấp 7 lần.
Tại sự kiện Google I/O 2026, hãng giới thiệu Gemini 3.5 Flash - mô hình AI đầu tiên thuộc thế hệ Gemini mới, được thiết kế nhằm cân bằng giữa khả năng suy luận và tốc độ phản hồi.
Với Deep Research, người dùng có thể xây dựng kế hoạch nghiên cứu, tìm kiếm và tổng hợp thông tin từ nhiều nguồn trên internet để tạo báo cáo có cấu trúc. Khi được cấp quyền truy cập, công cụ này còn có thể khai thác dữ liệu từ Gmail, Google Drive và Google Chat nhằm đưa ra kết quả phù hợp hơn với bối cảnh công việc.
Sau khi hoàn tất quá trình nghiên cứu, người dùng có thể tiếp tục chỉnh sửa nội dung ngay trong Canvas. Không gian làm việc này hỗ trợ biên tập báo cáo, kế hoạch kinh doanh, bài thuyết trình, đồng thời có thể tạo infographic, bộ câu hỏi hoặc thẻ ghi nhớ phục vụ học tập.
Trong khi đó, Gemini Live giúp việc tương tác với AI trở nên linh hoạt hơn thông qua giọng nói và hình ảnh. Trên thiết bị di động, người dùng có thể chia sẻ hình ảnh trực tiếp từ camera để Gemini phân tích hoặc hỗ trợ tạo nội dung dựa trên những gì đang hiển thị.
Mở rộng sang tạo hình ảnh, âm nhạc và video bằng AI
Bên cạnh các tác vụ học tập và công việc, Google cũng đang mở rộng Gemini sang lĩnh vực sáng tạo nội dung đa phương thức. Người dùng có thể tạo và chỉnh sửa hình ảnh bằng Nano Banana, sáng tác âm nhạc với mô hình Lyria của Google DeepMind hoặc tạo video bằng Gemini Omni - mô hình mới được giới thiệu tại Google I/O 2026.
Theo Google, Nano Banana đã được sử dụng để tạo hơn 50 tỷ hình ảnh trên toàn cầu. Tại Việt Nam, công cụ này từng xuất hiện trong nhiều xu hướng trên mạng xã hội như tạo ảnh chân dung dưới tuyết, phục chế ảnh cũ hay tạo ảnh theo phong cách mô hình đồ chơi.
Ở lĩnh vực âm thanh, Lyria cho phép tạo nhạc nền, giai điệu hoặc lời bài hát thông qua các mô tả bằng ngôn ngữ tự nhiên. Trong khi đó, Gemini Omni hướng tới khả năng tạo video kết hợp văn bản, hình ảnh, âm thanh và chuyển động trong cùng một quy trình, đồng thời cho phép người dùng chỉnh sửa nội dung thông qua hội thoại.
Google cho biết toàn bộ nội dung do Gemini tạo ra đều được gắn dấu mờ kỹ thuật số bằng công nghệ SynthID của Google DeepMind nhằm tăng tính minh bạch và khả năng nhận diện nội dung AI. Hãng cho biết công nghệ này đã được sử dụng để đánh dấu hơn 100 tỷ hình ảnh, video cùng lượng dữ liệu âm thanh tương đương 60.000 năm phát liên tục.
Hiện các tính năng như Deep Research, Canvas, Gemini Live cùng các công cụ tạo hình ảnh, âm nhạc và video đã được tích hợp trong ứng dụng Gemini, cho phép người dùng thực hiện nhiều tác vụ trên cùng một nền tảng thay vì phải sử dụng nhiều công cụ riêng lẻ.