Open AI cho phép người dùng biến văn bản thành hình ảnh bằng trí tuệ nhân tạo

14:50 21/09/2023

OpenAI vừa ra mắt phiên bản thứ ba của nền tảng AI tạo sinh Dall-E, phiên bản mới nhất của công cụ cho phép người dùng biến văn bản thành hình ảnh bằng trí tuệ nhân tạo mạnh mẽ của mình.

Ảnh minh họa
Ảnh minh họa.

Công ty Mỹ cho biết, Dall-E 3 sẽ được cung cấp cho các khách hàng sử dụng ChatGPT Plus và Enterprise từ tháng 10 thông qua giao diện lập trình ứng dụng (API). Người dùng có thể đưa ra yêu cầu hình ảnh và điều chỉnh lời nhắc thông qua cuộc trò chuyện với ChatGPT. Chưa rõ khi nào phiên bản miễn phí cho mọi người được công bố.

"DALL-E 3 có khả năng biến các yêu cầu sắc thái thành hình ảnh cực kỳ chi tiết và chính xác”, công ty nói trong một tuyên bố.

OpenAI cũng cam kết rằng, phiên bản mới này sẽ có nhiều biện pháp bảo vệ mạnh mẽ hơn, giới hạn khả năng tạo ra nội dung bạo lực, không phù hợp. Công cụ này cũng được cung cấp với các biện pháp từ chối các yêu cầu tạo hình ảnh của các nhân vật nổi tiếng hoặc theo phong cách của các nghệ sĩ đương thời.

Sandhini Agarwal, nhà nghiên cứu chính sách của OpenAI, tự tin vào các biện pháp an toàn nhưng nói thêm mô hình còn tiếp tục cải thiện và không hoàn hảo.

OpenAI cũng tôn trọng quyền từ chối sử dụng các tác phẩm của người sáng tạo trong việc đào tạo các công cụ biến văn bản thành hình ảnh trong tương lai.

Trong phần demo với The Verge, Aditya Ramesh – nhà nghiên cứu chính và giám đốc nhóm Dall-E, nhắc ChatGPT giúp ông làm logo một nhà hàng ramen ở vùng núi. ChatGPT đã viết một lời nhắc dài và Dall-E 3 đưa ra bốn lựa chọn. Việc kết nối Dall-E với chatbot giúp nhiều người sáng tạo tác phẩm AI hơn vì họ không cần phải giỏi viết lời nhắc.

Dall-E ra mắt lần đầu vào tháng 1/2021, trước các nền tảng khác như Midjourney. Với phiên bản hai vào năm 2022, OpenAI mở danh sách chờ để kiểm soát những ai được sử dụng công cụ sau khi nhận chỉ trích Dall-E tạo ra hình ảnh có định kiến. Tháng 9 cùng năm, công ty bỏ danh sách chờ và mở Dall-E 2 cho công chúng.

Sự ra đời của DALL-E 3 cho thấy công nghệ AI tạo hình ảnh tiếp tục phát triển với tốc độ chóng mặt. Với khả năng hiểu ngữ cảnh và kết hợp chữ tốt hơn, DALL-E 3 hứa hẹn mở ra nhiều cơ hội sáng tạo cho các nhà thiết kế, quảng cáo, tiểu thuyết gia và nhiều lĩnh vực khác.

Tuy nhiên, cùng với sức mạnh đó là những thách thức mới về đạo đức, bản quyền và bảo mật mà cả công ty công nghệ và toàn xã hội cần cùng nhau giải quyết. Các nhà nghiên cứu kỳ vọng OpenAI và các công ty khác sẽ tiếp tục cải thiện các biện pháp bảo vệ và minh bạch hóa quá trình phát triển công nghệ để định hướng nó phục vụ lợi ích chung.

DALL-E 3 đánh dấu một bước tiến lớn của công nghệ AI tạo hình ảnh. Với nhiều cải tiến về khả năng hiểu ngữ cảnh, tích hợp ChatGPT, kết hợp văn bản và các biện pháp bảo mật, DALL-E 3 hứa hẹn mở ra nhiều cơ hội mới cho các ứng dụng sáng tạo trong tương lai.

Hà Thu (T/h)