Mới đây, công ty khởi nghiệp về công nghệ âm thanh ElevenLabs được cho là đã ký nhiều thỏa thuận với các diễn viên nổi tiếng ở Hollywood như Burt Reynolds, Judy Garland, James Dean và Sir Laurence Olivier trong việc sử dụng công cụ Iconic Voices để nhân bản giọng nói. Từ đó, phát triển giọng đọc AI của người nổi tiếng trên ứng dụng sách nói.
Được biết, ElevenLabs mới thành lập năm 2022, đã được các công ty đầu tư mạo hiểm là Andreessen Horowitz và Sequoia tài trợ. Công ty này đã tạo ra âm thanh cho sách và các bài báo, nhân vật trò chơi điện tử, phương tiện truyền thông xã hội và quảng cáo. Đầu năm 2024, công ty đã làm việc với các nhà xuất bản như New York Times và Washington Post và được Disney lựa chọn tham gia chương trình của hãng này.
Đại diện ElevenLabs cho biết: Cần khoảng 30 phút âm thanh chất lượng cao để tạo bản sao giọng nói chuyên nghiệp. Giọng nói AI có thể được chọn để đọc văn bản nhưng không thể trích xuất giọng nói và nội dung trong một ứng dụng đọc. Chẳng hạn như người dùng có thể có các bài báo đọc bằng giọng của James Dean trong ứng dụng nhưng không thể tiếp cận giọng nói này cho bất cứ nội dung nào mà chưa có trong ứng dụng.
Các thỏa thuận trên giúp thiết lập ranh giới cho tương lai, cho phép kiểm soát, quản lý tốt hơn các nội dung giọng nói do AI tạo ra. Động thái trên rất quan trọng trong bối cảnh có nhiều lo ngại AI sử dụng trái phép giọng nói của người nổi tiếng, nhất là sau vụ nữ diễn viên Scarlett Johansson cáo buộc OpenAI ăn cắp giọng nói của cô.
Hiện tại nhiều diễn viên, nhất là diễn viên lồng tiếng, vẫn lo ngại về việc sử dụng AI để tạo nội dung giọng nói. Một số người từ chối xem xét bất kỳ thỏa thuận nào trong lĩnh vực này. Tuy nhiên, một số người khác cho rằng, không nên bỏ qua cơ hội sao chép giọng nói của họ để sản xuất nhanh hơn, rẻ hơn trên một số dạng sách nói.
Các mô hình tạo giọng gần đây đã cho thấy những tiến bộ đáng kể so với các phiên bản trước đó, khiến việc phân biệt giọng nói giả và giọng thật trở nên ngày càng khó khăn. Cấp phép giọng nói AI có thể giảm bớt khối lượng công việc cho diễn viên lồng tiếng mà không thay thế họ, vì họ can thiệp vào quá trình này bằng cách tập trung vào việc cung cấp bản sửa lỗi hoặc cải thiện các khía cạnh không thể diễn tả được như ngữ điệu, độ ấm và sự nhấn mạnh - những yếu tố vẫn còn nhiều thách thức.
Nhiều nghiên cứu đã chỉ ra rằng, AI chỉ tốt khi các mô hình được đào tạo tốt. Và, bộ dữ liệu giọng nói của diễn viên trở thành một phần của quá trình này.
Ông Nauman Dawalatabad đang công tác tại Phòng thí nghiệm Khoa học máy tính và Trí tuệ nhân tạo MIT, cũng là người có nhiều nghiên cứu sâu rộng về tạo giọng nói AI tiết lộ: Việc truyền tải giọng nói của các ngôi sao điện ảnh góp phần bổ sung cho khả năng học của AI thông qua việc cung cấp các bộ dữ liệu giọng nói chất lượng cao. Từ đó có cơ sở để đào tạo và tinh chỉnh các mô hình lớn.
Trong một diễn biến khác, Liên đoàn diễn viên Hollywood (SAG-AFTRA) vào thứ Tư (15/8) đã công bố thỏa thuận với Narrativ, một nền tảng kết nối tài năng trực tuyến, cho phép diễn viên bán quyền sao chép giọng nói của họ cho các nhà quảng cáo thông qua trí tuệ nhân tạo (AI).
Trong bối cảnh các diễn viên lo ngại rằng AI có thể khiến việc đánh cắp hình ảnh và giọng nói trở nên phổ biến, thỏa thuận này đảm bảo rằng diễn viên có thể kiếm thu nhập từ công nghệ này và kiểm soát cách thức, thời gian mà giọng nói của họ được sử dụng.
Theo thỏa thuận, diễn viên có thể tự định giá cho việc sao chép giọng nói kỹ thuật số của họ, với điều kiện mức giá ít nhất phải bằng mức lương tối thiểu mà SAG-AFTRA quy định cho quảng cáo âm thanh. Các thương hiệu phải có sự đồng ý từ diễn viên cho mỗi quảng cáo sử dụng giọng nói kỹ thuật số.
SAG-AFTRA đã ca ngợi thỏa thuận này là một tiêu chuẩn cho việc sử dụng AI một cách có đạo đức trong ngành quảng cáo.
Phương Hà (T/h)