Khả năng tương tác bằng video mới gia tăng sức hút của ChatGPT

16:44 13/03/2023

Có thể nói tính năng mới này chính là bước tiến lớn của Chat GPT và nó có thể sẽ mang đến nhiều lợi ích cho Microsoft trong thời gian sắp tới.

Khả năng tương tác bằng video, âm thanh, hình ảnh... sẽ giúp những công cụ AI
như ChatGPT trở nên lợi hại hơn bao giờ hết.
Khả năng tương tác bằng video, âm thanh, hình ảnh... sẽ giúp những công cụ AI như ChatGPT trở nên thu hút hơn trong mắt người dùng. 

ChatGPT và GPT-3.5 là những nền tảng công nghệ đằng sau, cấu thành Microsoft Bing. Dù vậy, lúc này, nhiều ý kiến cho rằng, công cụ tìm kiếm thông minh của hãng công nghệ Mỹ vẫn rất chậm chạp trong việc tìm kiếm và hiển thị kết quả. Tuy nhiên, ngay trong tuần tới, Bing sẽ có những bước tiến dài nhờ công nghệ trí tuệ nhân tạo GPT-4 thế hệ mới.

Thực tế, đây không phải là lần đầu tiên thông tin về GPT-4 được tiết lộ. Hồi tháng trước, nhiều kênh truyền thông từng tiết lộ việc OpenAI đang phát triển một ứng dụng di động ChatGPT sử dụng nền tảng mới.

Công cụ ChatGPT, ra mắt vào tháng 11 năm 2022, được cung cấp bởi mô hình GPT-3.5. Phiên bản chính tiếp theo của Mô hình ngôn ngữ lớn (LLM), GPT-4, sẽ mạnh hơn đáng kể.

Hiện tại, ChatGPT và công nghệ khác do GPT-3.5 cung cấp chỉ giới hạn ở các câu trả lời dựa trên văn bản.

Phát biểu tại sự kiện "Tiêu điểm Trí tuệ nhân tạo (AI) - Khởi động kỹ thuật số”, Giám đốc công nghệ thông tin đồng thời là cũng là Trưởng nhóm dữ liệu và trí tuệ nhân tạo của Microsoft Đức - Andreas Braun giải thích rằng GPT-4 sẽ là “đa phương thức”, cho phép AI của công ty dịch văn bản của người dùng thành hình ảnh, nhạc và video. Microsoft đã đưa ra một ví dụ về cách một tổng dài có thể sử dụng GPT-4 để tự động chuyển đổi các cuộc trò chuyện qua điện thoại giữa nhân viên và khách hàng thành văn bản, điều này sẽ tiết kiệm rất nhiều thời gian và công sức mà trước đây phải dùng để tóm tắt các cuộc gọi đó sau khi chúng kết thúc.

GPT-4 còn có khả năng đưa ra các câu trả lời nhanh hơn GPT-3.5 hiện nay. Các câu trả lời cũng sẽ giống với sản phẩm của con người hơn. 

Chưa dừng ở đó, nền tảng mới còn mở ra khả năng tương tác đa ngôn ngữ, ví dụ như cho phép người dùng đưa ra câu hỏi bằng tiếng Đức, để nhận về câu trả lời bằng tiếng Italia. Tính năng này gần giống với mô hình đa phương thức MUM của Google, hiện cho phép người dùng có được câu trả lời với những dữ liệu chỉ tồn tại ở ngôn ngữ khác. 

GPT-4 còn có khả năng đưa ra các câu trả lời nhanh hơn GPT-3.5 hiện nay
GPT-4 còn có khả năng đưa ra các câu trả lời nhanh hơn GPT-3.5 hiện nay.

Và đặt biệt nhất đó chính là ứng dụng sẽ giúp người dùng tạo ra video. Trên thực tế thì đây không phải là công cụ AI đầu tiên có khả năng tạo ra video được gợi ý từ một văn bản. Trước Chat GPT đã có một ứng dụng khác có tên là Make-A-Video cũng có khả năng tạo video từ văn bản mô tả. Tuy nhiên có thể nói tính năng mới này chính là bước tiến lớn của Chat GPT và nó có thể sẽ mang đến nhiều lợi ích cho Microsoft trong thời gian sắp tới.