Google phát triển công cụ dịch trực tiếp giọng nói

00:00 12/10/2020

Công cụ của Google có khả năng chuyển trực tiếp giọng nói ra giọng nói theo ngôn ngữ khác nhau, không cần bước trung gian chuyển sang văn bản.

Google Translatotron cho phép dịch giọng nói mà không cần bước trung gian là chuyển thành văn bản.

Google Translatotron cho phép dịch giọng nói mà không cần bước trung gian là chuyển thành văn bản.

Các công cụ dịch hiện nay thường chuyển giọng nói thành văn bản, sau đó dịch văn bản sang ngôn ngữ mới rồi tiếp tục chuyển văn bản thành giọng nói. Tuy nhiên, mô hình dịch thuật mới của Google mang tên Translatotron, sẽ bỏ qua bước trung gian để dịch trực tiếp từ giọng nói ra giọng nói.

Công ty công nghệ Mỹ cho biết Translatotron sử dụng công nghệ AI với một mạng lưới thần kinh cho phép dịch nhanh, loại bỏ lỗi, xác định các từ không cần dịch như tên riêng, địa danh. Bên cạnh đó, công cụ còn giữ lại giọng điệu của người nói, cho giọng dịch gần gũi với âm thanh tự nhiên.

Theo Google, Translatotron là mô hình đầu tiên cho phép dịch trực tiếp giọng nói từ một ngôn ngữ sang giọng nói bằng ngôn ngữ khác. Công ty coi đây là điểm khởi đầu cho việc xây dựng các hệ thống dịch đầu - cuối giọng nói trong tương lai.

Bảo Anh (theo Gizmodo)