Trung Quốc chỉ còn chậm hơn Mỹ khoảng 1 năm về phát triển mô hình ngôn ngữ lớn. |
Khi nói đến mô hình ngôn ngữ lớn có khả năng tạo văn bản, Trung Quốc chậm hơn Mỹ khoảng một năm, theo Roey Tzezana, nghiên cứu viên tại Hội thảo Yuval Ne’eman về Khoa học, Công nghệ & An ninh thuộc Đại học Tel Aviv (Israel). Dù khoảng cách có vẻ không lớn nhưng không dễ thu hẹp với tốc độ phát triển của trí tuệ nhân tạo (AI), nhà nghiên cứu nhận định.
Ông cho biết: "Mỗi năm trong khoảng hai năm rưỡi trở lại đây, đều có sự thay đổi lớn về khả năng của AI. Vì vậy, một năm nghe có vẻ không nhiều và cũng không đến nỗi tệ, nhưng đó là khoảng cách đáng kể”.
Mô hình ngôn ngữ lớn (LLM) được biết đến là các mô hình máy học được huấn luyện trên dữ liệu ngôn ngữ lớn với hàng triệu hoặc thậm chí là hàng tỷ dữ liệu văn bản. Những mô hình này sử dụng các kiến trúc học sâu để hiểu và tạo ra văn bản tự nhiên. Đó cũng là lý do LLM có khả năng xử lý, tạo ra ngôn ngữ tự nhiên một cách ấn tượng, tương tự như con người. Trong đó, Chat GPT (Chat Generative Pre-training Transformer) của OpenAI là một trong những ví dụ về LLM hiệu suất cao đã đạt được những đỉnh cao mới trong xử lý ngôn ngữ tự nhiên. Chúng có khả năng thực hiện nhiều nhiệm vụ xử lý ngôn ngữ tự nhiên khác nhau như dịch ngôn ngữ, phát hiện cảm xúc, phân loại văn bản và tạo ra các văn bản mới. |
Li Dahai, đồng sáng lập kiêm Giám đốc điều hành tại Công ty khởi nghiệp AI ModelBest của Trung Quốc, cũng có chung nhận định như trên. Theo đó, con số khoảng cách đo bằng năm chỉ là dựa trên nhận thức của mọi người và “không có nhiều ý nghĩa”. Minh chứng rõ nhất là không có mô hình ngôn ngữ lớn trực tuyến nào tại Trung Quốc đạt hoặc vượt qua mô hình GPT-4, chứ đừng nói là mô hình o1 mới nhất của OpenAI.
Mô hình o1 mới nhất của startup trụ sở San Francisco được giới thiệu có sức mạnh vượt trội các mô hình ngôn ngữ lớn trực tuyến khác trong các nhiệm vụ suy luận nặng về lý luận trong các lĩnh vực bao gồm khoa học, mã hóa và toán học. Công ty cho biết, nó biết "cách suy nghĩ hiệu quả bằng cách sử dụng chuỗi suy nghĩ của mình" nhờ một kỹ thuật được gọi là học tăng cường.
Kỹ thuật mới có thể được coi là sự thay đổi đáng kể đối với AI, khi nó giúp các mô hình có khả năng tái tạo suy nghĩ và tạo ra dữ liệu, thay vì chỉ dựa vào dữ liệu dạng hữu cơ đang khan hiếm.
Theo Tzezana, các kỹ thuật chuỗi suy nghĩ như vậy, khi được thực hiện đúng cách, có thể tạo ra kết quả tốt mà không cần phải tăng đáng kể sức mạnh tính toán. Điều đó có thể hữu ích cho các công ty Trung Quốc không có quyền truy cập vào chip tiên tiến trong bối cảnh bị hạn chế xuất khẩu do Washington áp đặt.
"Nó sẽ giảm bớt một số khó khăn mà tình trạng thiếu chip tiên tiến gây ra cho Trung Quốc", ông nói. “Vì vậy, sẽ rất thú vị khi xem liệu sự khan hiếm điện toán ở Trung Quốc có dẫn đến sự đổi mới tốt hơn trong lĩnh vực này hay không”.
Yang Zhilin, nhà sáng lập Moonshot AI - công ty khởi nghiệp AI hàng đầu Trung Quốc, ca ngợi o1 có một “cải tiến quan trọng” là hoàn thành các nhiệm vụ mà con người sẽ mất nhiều thời gian để suy nghĩ và thực hiện.
Yang Zhilin cho biết, o1 đại diện cho sự thay đổi quan trọng vì các nhà phát triển mô hình ngôn ngữ lớn, khi đã hết dữ liệu tự nhiên để đào tạo mô hình, đang chuyển sang kỹ thuật học tăng cường để tái tạo quá trình suy nghĩ và từ đó tạo ra nhiều dữ liệu hơn.
“o1 dành nhiều thời gian hơn để suy nghĩ kỹ trước khi phản hồi, giống như cách một người sẽ làm”, OpenAI viết trong bài đăng trên blog.
"Thay vì trả lời một câu hỏi đơn giản, nó có thể dành 20 giây để suy nghĩ", Yang Zhilin nói về o1.
"Trong tương lai, bạn có thể thấy AI có khả năng thực hiện các nhiệm vụ kéo dài vài phút hoặc thậm chí vài giờ, chuyển đổi giữa các chế độ khác nhau với khả năng lý luận ngày càng mạnh mẽ. Tôi tin rằng, đây là những xu hướng rất quan trọng trong sự phát triển của AI vào tương lai", nhà sáng lập Moonshot AI cho biết thêm.
Mặc dù tụt hậu trong các mô hình văn bản, Trung Quốc dường như phát triển hơn trong các lĩnh vực khác của AI tạo sinh, theo các chuyên gia.
Theo Li Dahai, xét về các mô hình AI biên, thực hiện các tác vụ tạo sinh cục bộ trên thiết bị của người dùng thay vì trên đám mây giống ChatGPT, không có khoảng cách đáng kể nào giữa Trung Quốc và Mỹ.
Roey Tzezana cho rằng, chuyển văn bản thành video AI có vẻ là một lĩnh vực mà các công ty Trung Quốc đang tiến bộ nhanh chóng và đang dẫn đầu.
Vài tháng qua, các công ty công nghệ lớn và công ty khởi nghiệp của Trung Quốc đã gấp rút công bố các công cụ AI tạo văn bản thành video sau khi OpenAI giới thiệu Sora vào tháng 2. “Họ đang khiến OpenAI phải xấu hổ khi đã hứa từ rất lâu mà vẫn chưa thể phát hành Sora”.
Ngoài ra, theo nghiên cứu mới đây của Tổ chức Sở hữu Trí tuệ Thế giới (WIPO), trong thập kỷ qua, trên toàn thế giới có hơn 50.000 đơn xin cấp bằng sáng chế về công nghệ AI tạo sinh, như khả năng tạo văn bản, hình ảnh, mã máy tính, âm nhạc. Trong đó, 25% số bằng được nộp năm 2023. Đáng chú ý, Trung Quốc là quốc gia dẫn đầu với hơn 38.000 hồ sơ phát minh về AI tạo sinh trong giai đoạn từ 2014 đến 2023, gấp sáu lần so với 6.276 phát minh được Mỹ nộp cùng kỳ.
Christopher Harrison, Giám đốc Phân tích Bằng sáng chế của WIPO, nói: "Đây là lĩnh vực đang bùng nổ và phát triển với tốc độ ngày càng tăng. Các đơn xin cấp bằng sáng chế của Trung Quốc bao gồm nhiều lĩnh vực từ xe tự hành, xuất bản đến quản lý tài liệu.
Xét về doanh nghiệp, ByteDance, công ty sở hữu TikTok, có nhiều đơn xin cấp bằng sáng chế nhất, tiếp theo là gã khổng lồ thương mại điện tử Trung Quốc Alibaba Group và Microsoft, công ty hậu thuẫn cho OpenAI.