Thứ tư 04/03/2026 12:12
Hotline: 024.355.63.010
Email: banbientap.dnhn@gmail.com
Kinh tế số

NIC và Meta bắt tay phát triển dữ liệu mã nguồn mở cho AI Việt Nam

Ngày 5/8/2025, tại Trung tâm Đổi mới sáng tạo Quốc gia (NIC), cuộc họp tham vấn chuyên gia quan trọng đã được tổ chức nhằm thu thập ý kiến chuyên sâu về việc xây dựng bộ dữ liệu tiếng Việt mã nguồn mở phục vụ nghiên cứu, ứng dụng và phát triển Trí tuệ Nhân tạo (Dự án ViGen).

Dự án ViGen nằm trong khuôn khổ Chương trình Thách thức Đổi mới sáng tạo Việt Nam 2025 (Vietnam Innovation Challenge - VIC) do NIC phối hợp với Tập đoàn Meta, Tổ chức AI for Vietnam và các đối tác liên quan triển khai.

Trong bối cảnh cách mạng công nghiệp 4.0 đang diễn ra mạnh mẽ, Trí tuệ Nhân tạo (AI) không chỉ là một xu hướng công nghệ mà đã trở thành một trụ cột, một động lực then chốt cho sự phát triển kinh tế - xã hội, nâng cao năng lực cạnh tranh quốc gia. Đảng và Nhà nước đã xác định AI là một trong những công nghệ ưu tiên, có vai trò quyết định đến sự thịnh vượng của đất nước.

Thực hiện Nghị quyết 57-NQ/TW ngày 22/12/2024 của Bộ Chính trị về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số, Bộ Tài chính đã có công văn số 8343/BTC-KHTC ngày 13/6/2025 về việc công bố danh mục các bài toán lớn về khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số của Bộ Tài chính năm 2025. Theo đó, NIC được giao chủ trì, giải quyết bài toán lớn về Xây dựng bộ dữ liệu tiếng Việt mã nguồn mở phục vụ nghiên cứu, phát triển và ứng dụng AI (ViGen). Dự án ViGen được triển khai nhằm hỗ trợ việc phát triển Mô hình ngôn ngữ lớn tiếng Việt trong Danh mục công nghệ chiến lược và sản phẩm công nghệ chiến lược quốc gia đến năm 2030 theo Quyết định số 1131/QĐ-TTg ngày 12/6/2025 của Thủ tướng Chính phủ.

NIC và Meta bắt tay phát triển dữ liệu mã nguồn mở cho AI Việt Nam
Toàn cảnh cuộc họp tham vấn chuyên gia về việc xây dựng bộ dữ liệu tiếng Việt mã nguồn mở ViGen phục vụ nghiên cứu, ứng dụng và phát triển AI (Dự án ViGen) - Ảnh: Hà Hương

Để hiện thực hóa tầm nhìn này, việc xây dựng một hệ sinh thái AI vững mạnh là điều tối cần thiết. Và trong hệ sinh thái đó, dữ liệu chính là "nguồn dầu mỏ" quý giá nhất. Đặc biệt, đối với một quốc gia có ngôn ngữ và văn hóa độc đáo như Việt Nam, việc sở hữu một bộ dữ liệu tiếng Việt chất lượng cao, đa dạng và dễ tiếp cận là yếu tố then chốt để các mô hình AI có thể "hiểu" và "phục vụ" tốt nhất cho người Việt. Do vậy, sáng kiến này được kỳ vọng sẽ đóng vai trò then chốt trong việc thúc đẩy nghiên cứu, phát triển và ứng dụng AI tại Việt Nam. Cuộc họp thu hút sự tham gia của đại diện các bộ, ngành trung ương, các viện nghiên cứu, trường đại học hàng đầu, các doanh nghiệp công nghệ tiên phong, tổ chức quốc tế cùng đông đảo các chuyên gia, nhà khoa học đầu ngành trong lĩnh vực AI.

Mục tiêu cốt lõi của buổi tham vấn là xây dựng một nền tảng dữ liệu tiếng Việt chất lượng cao, toàn diện và có thể truy cập rộng rãi, nhằm cung cấp tài nguyên thiết yếu cho cộng đồng AI Việt Nam. Bộ dữ liệu mã nguồn mở ViGen hứa hẹn sẽ là xương sống để các nhà nghiên cứu, phát triển và doanh nghiệp Việt Nam có thể tạo ra các giải pháp AI vượt trội, đặc biệt là các ứng dụng hiểu và xử lý tiếng Việt sâu sắc hơn, từ đó góp phần vào công cuộc chuyển đổi số quốc gia và nâng cao năng lực cạnh tranh của Việt Nam trên bản đồ AI thế giới.

Phát biểu khai mạc, ông Vũ Quốc Huy, Giám đốc NIC cho biết: “Với vai trò là cầu nối giữa chính phủ, cộng đồng nghiên cứu và doanh nghiệp, NIC là đơn vị chủ trì, phối hợp với đa dạng các thành tố trong hệ sinh thái để tập hợp và xây dựng Dự án ViGen. Chúng tôi tin tưởng rằng, với trí tuệ tập thể, sự đóng góp đa chiều từ quý vị đại diện các Bộ Khoa học và Công nghệ, Bộ Công an, các viện nghiên cứu uy tín như Viện Hàn lâm Khoa học và Công nghệ Việt Nam, các trường đại học hàng đầu như Đại học Bách khoa Hà Nội, Đại học Quốc gia TP. HCM, Đại học Quốc gia Hà Nội, cùng các tập đoàn công nghệ hàng đầu thế giới và Việt Nam như Meta, NVIDIA, Viettel, VNPT, MISA, SotaTek, DopikAI, DeepTensor, HyraTek, Gotit và tổ chức AI for Vietnam – chúng ta sẽ cùng nhau xây dựng một lộ trình rõ ràng, một kế hoạch hành động hiệu quả để hiện thực hóa dự án ViGen một cách nhanh chóng và bền vững nhất. Chúng tôi kỳ vọng buổi tham vấn hôm nay sẽ là diễn đàn cởi mở để cùng nhau thảo luận về mọi góc nhìn từ chính sách, công nghệ, học thuật đến ứng dụng thực tiễn sẽ góp phần hoàn thiện đề án ViGen, đảm bảo tính khả thi và hiệu quả cao nhất.”

Là một tập đoàn công nghệ hàng đầu thế giới, Meta có bề dày kinh nghiệm trong việc nghiên cứu và phát triển AI, cũng như trong việc xây dựng và đóng góp vào các sáng kiến mã nguồn mở toàn cầu. Đại diện Tập đoàn Meta bà Thảo Griffiths, Giám đốc Chính sách công Việt Nam, Lào, Campuchia chia sẻ: “Chúng tôi nhận thấy rằng, để AI thực sự phát triển bền vững và mang lại lợi ích rộng rãi, việc xây dựng một hệ sinh thái dữ liệu đa dạng, phong phú và đặc biệt là mã nguồn mở như LLAMA là vô cùng cần thiết. Meta luôn coi Việt Nam là một thị trường chiến lược với nguồn nhân lực trẻ, năng động và khát khao học hỏi. Việc đồng hành cùng Dự án ViGen là một phần trong cam kết dài hạn của chúng tôi nhằm góp phần vào sự phát triển chung của hệ sinh thái AI mã nguồn mở tại Việt Nam. Tập đoàn Meta sẵn sàng chia sẻ kinh nghiệm, kiến thức chuyên môn, và có thể là cả công nghệ để hỗ trợ quá trình thu thập, xử lý và chuẩn hóa dữ liệu, đảm bảo ViGen đạt được chất lượng tốt nhất, đáp ứng được các tiêu chuẩn quốc tế.”

Ông Hùng Trần, nhà sáng lập và CEO tổ chức AI for Vietnam, trình bày tiến độ triển khai của Dự án và định hướng phát triển dự án ViGen. Hiện nay, Dự án đang hoàn thiện cơ sở hạ tầng thu thập dữ liệu, bao gồm việc định hình các tiêu chuẩn dữ liệu và xây dựng các nền tảng kỹ thuật nhằm đảm bảo chất lượng, an toàn thông tin và quy mô của bộ dữ liệu tiếng Việt, và dự kiến sẽ ra mắt bản thử nghiệm vào tháng 10/2025.

Tại cuộc họp, các đối tác như Viện Công nghệ Thông tin thuộc Viện Hàn lâm Khoa học và Công nghệ Việt Nam, Tập Viettel và các chuyên gia người Việt trong lĩnh vực AI đang làm việc tại các tập đoàn công nghệ hàng đầu thế giới như Google, Sotatek, ByteDance,... cũng có phần chia sẻ và cam kết đồng hành cùng Dự án. Các bên đều chia sẻ chủ trương ủng hộ sự cần thiết của Dự án để tạo lập một mô hình ngôn ngữ thuần Việt, cho người Việt và khẳng định sẵn sàng chia sẻ kinh nghiệm, kiến thức chuyên môn và đóng góp dữ liệu vào Dự án.

Phiên thảo luận mở đã diễn ra sôi nổi, thu hút sự tham gia tích cực từ đại diện các bộ, ngành, viện nghiên cứu và trường đại học lớn như Đài Tiếng nói Việt Nam, Đại học Quốc gia TP. HCM, Đại học Quốc gia Hà Nội; Viện Công nghệ và Trí tuệ mới tạo sinh; cùng các doanh nghiệp công nghệ như Tập đoàn FPT và startup AI như Fossasia, Meticworks… Các ý kiến tập trung vào các khía cạnh như tiêu chuẩn kỹ thuật, tiêu chuẩn hóa dữ liệu, cơ chế thu thập, quản lý và duy trì bộ dữ liệu, cách thức huy động cộng đồng tham gia đóng góp dữ liệu, nguồn lực và các chính sách hỗ trợ phát triển AI dựa trên dữ liệu mở.

Dự án ViGen không chỉ là một kho dữ liệu đơn thuần. Đó là biểu tượng của tinh thần hợp tác, của tư duy mở và khát vọng vươn lên. Một bộ dữ liệu mã nguồn mở sẽ là chất xúc tác mạnh mẽ, loại bỏ rào cản về chi phí và quyền truy cập, giúp hàng ngàn lập trình viên, nhà nghiên cứu, startup và doanh nghiệp nhỏ có thể tiếp cận nguồn tài nguyên quý giá này để đổi mới sáng tạo. Điều này không chỉ thúc đẩy nghiên cứu khoa học cơ bản mà còn đẩy nhanh quá trình thương mại hóa các sản phẩm AI “Make in Vietnam”, giải quyết các bài toán thực tiễn của đất nước.

Ngôn ngữ là chìa khóa để AI thực sự tương tác và phục vụ con người một cách hiệu quả. Với tiếng Việt, một ngôn ngữ có cấu trúc và ngữ điệu độc đáo, việc xây dựng một bộ dữ liệu chất lượng cao không chỉ là nhiệm vụ kỹ thuật mà còn là bảo tồn và phát huy giá trị văn hóa. Bộ dữ liệu ViGen không chỉ hỗ trợ các ứng dụng dịch thuật, xử lý ngôn ngữ tự nhiên, mà còn mở ra cánh cửa cho việc phát triển các mô hình AI sáng tạo khác, phục vụ đa dạng các ngành nghề, từ giáo dục, y tế đến tài chính, thương mại điện tử, phù hợp với đặc thù của thị trường Việt Nam.

Việc xây dựng bộ dữ liệu tiếng Việt mã nguồn mở ViGen không chỉ là một dự án công nghệ, mà còn là một minh chứng cho tinh thần hợp tác, đổi mới sáng tạo của Việt Nam trong kỷ nguyên số, mở ra cánh cửa cho hàng triệu cơ hội mới và khẳng định vị thế của Việt Nam trên bản đồ AI toàn cầu.

Tin bài khác
Samsung Galaxy S27: Cảm biến 200MP có thể sẽ được nâng cấp vào năm tới?

Samsung Galaxy S27: Cảm biến 200MP có thể sẽ được nâng cấp vào năm tới?

Khi Galaxy S26 còn chưa kịp “hạ nhiệt”, các tin rò rỉ đầu tiên về Galaxy S27 đã xuất hiện, tập trung vào một điểm quen mà vẫn gây tò mò: camera chính 200MP. Theo các nguồn rò rỉ trên Weibo được các trang công nghệ quốc tế tổng hợp, Samsung có thể giữ nguyên độ phân giải 200MP nhưng đổi cách “làm HDR” bằng công nghệ LOFIC để cải thiện ảnh trong môi trường tương phản mạnh.
Elon Musk quảng bá Grok là AI “không thức tỉnh”

Elon Musk quảng bá Grok là AI “không thức tỉnh”

Tỷ phú công nghệ Elon Musk gần đây tiếp tục quảng bá phiên bản mới nhất của chatbot trí tuệ nhân tạo Grok 4.20, đồng thời chỉ trích nhiều nền tảng AI lớn hiện nay là “yếu kém” và quá thận trọng trong cách trả lời.
Apple tung iPhone 17e: Tăng sức mạnh, thêm màu mới, giá từ 15,6 triệu đồng

Apple tung iPhone 17e: Tăng sức mạnh, thêm màu mới, giá từ 15,6 triệu đồng

Apple chính thức giới thiệu iPhone 17e với chip A19 thế hệ mới, camera 48MP, bộ nhớ tiêu chuẩn 256GB và hỗ trợ MagSafe. Dù được nâng cấp mạnh về cấu hình và tính năng, mẫu máy này vẫn giữ mức giá khởi điểm từ 15,6 triệu đồng, hướng đến phân khúc người dùng phổ thông cao cấp.
TP.Hồ Chí Minh: Sẽ tiên phong phát triển mô hình xúc tiến đầu tư số

TP.Hồ Chí Minh: Sẽ tiên phong phát triển mô hình xúc tiến đầu tư số

Công nghệ số sẽ được UBND TP.Hồ Chí Minh đưa vào ứng dụng trong lĩnh vực xúc tiến đầu tư nhằm giảm bớt các thủ tục và tăng cường các tiện ích cho cộng đồng doanh nghiệp.
Samsung đặt cược agentic AI với Galaxy S26, hợp tác Google phát triển “hệ điều hành AI”

Samsung đặt cược agentic AI với Galaxy S26, hợp tác Google phát triển “hệ điều hành AI”

Samsung ra mắt Galaxy S26 với trọng tâm agentic AI, tích hợp Perplexity, Gemini và phát triển “hệ điều hành AI” cùng Google, mở ra cuộc đua smartphone cao cấp 2026.
Galaxy S26 Ultra lộ diện trước giờ G

Galaxy S26 Ultra lộ diện trước giờ G

Chỉ vài ngày trước khi Samsung chính thức ra mắt dòng Galaxy S26 vào ngày 25/2, một cửa hàng tại Dubai đã bất ngờ đưa mẫu Galaxy S26 Ultra lên kệ. Sự cố “mở bán sớm” này khiến toàn bộ thiết kế và một số tính năng quan trọng của thiết bị bị lộ, thu hút sự quan tâm của cộng đồng công nghệ và giới kinh doanh thiết bị di động toàn cầu.
Apple thử nghiệm sản xuất iPhone 18 Pro, sẵn sàng cho “mùa thu công nghệ” 2026

Apple thử nghiệm sản xuất iPhone 18 Pro, sẵn sàng cho “mùa thu công nghệ” 2026

Apple Inc. đang đưa bộ đôi iPhone 18 Pro và iPhone 18 Pro Max vào giai đoạn thử nghiệm sản xuất hàng loạt (mass-production testing), bước đi quan trọng trước khi ra mắt chính thức vào tháng 9/2026. Thông tin này xuất phát từ nguồn rò rỉ Fixed Focus Digital trên Weibo, cho thấy “Táo khuyết” đã chuyển từ giai đoạn kiểm định thiết kế sang kiểm định sản xuất – tín hiệu cho thấy tiến độ phát triển đang đi đúng lộ trình.
Trung Quốc tăng tốc đường đua 6G, công nghệ quang – không dây tích hợp lập kỷ lục 512 Gbps

Trung Quốc tăng tốc đường đua 6G, công nghệ quang – không dây tích hợp lập kỷ lục 512 Gbps

Hệ thống truyền thông tích hợp cáp quang – không dây đạt tốc độ kỷ lục 512 Gbps, mở đường cho hạ tầng 6G và trung tâm dữ liệu AI siêu băng thông trong tương lai.
Apple Music trên iOS 26.4: Loạt tính năng AI và trải nghiệm mới cho người dùng iPhone

Apple Music trên iOS 26.4: Loạt tính năng AI và trải nghiệm mới cho người dùng iPhone

Apple Music trên iOS 26.4 bổ sung 5 tính năng mới như playlist bằng AI, widget âm nhạc theo tâm trạng, thông tin concert và giao diện toàn màn hình, nâng trải nghiệm nghe nhạc trên iPhone.
YouTube gián đoạn toàn cầu sáng 18/2, hàng trăm nghìn người dùng báo lỗi

YouTube gián đoạn toàn cầu sáng 18/2, hàng trăm nghìn người dùng báo lỗi

Sáng 18/2, nền tảng video trực tuyến YouTube bất ngờ gặp sự cố diện rộng, khiến hàng triệu người dùng trên toàn cầu không thể truy cập đầy đủ dịch vụ. Lỗi xảy ra đồng thời với một số nền tảng trực tuyến lớn khác, gây xáo trộn đáng kể trong bối cảnh nhu cầu giải trí trực tuyến tăng cao dịp Tết.
Ấn Độ "đặt cược" 200 tỷ USD vào AI

Ấn Độ "đặt cược" 200 tỷ USD vào AI

Ấn Độ đặt mục tiêu thu hút hơn 200 tỷ USD đầu tư vào trí tuệ nhân tạo trong hai năm tới, với các tập đoàn lớn như Adani, Infosys và nhiều “ông lớn” công nghệ toàn cầu tham gia xây dựng hệ sinh thái AI quy mô hàng trăm tỷ USD.
iPhone chiếm 25% smartphone toàn cầu

iPhone chiếm 25% smartphone toàn cầu

Báo cáo mới từ Counterpoint Research cho thấy 25% điện thoại thông minh đang hoạt động trên toàn cầu là iPhone. Trong bối cảnh thị trường chỉ tăng trưởng 2% năm 2025, Apple và Samsung tiếp tục thống trị nhờ khả năng giữ chân người dùng và hệ sinh thái bền vững.
Smartphone tầm giá 10 triệu đồng 2026: Loạt máy mới pin “khủng”, camera 200 MP, chống nước IP69

Smartphone tầm giá 10 triệu đồng 2026: Loạt máy mới pin “khủng”, camera 200 MP, chống nước IP69

Phân khúc smartphone khoảng 10 triệu đồng tại Việt Nam đang sôi động với nhiều mẫu máy mới nổi bật về độ bền, pin dung lượng lớn và cấu hình vượt tầm giá.
Smartphone cao cấp đồng loạt giảm giá, thị trường sôi động dịp cuối năm

Smartphone cao cấp đồng loạt giảm giá, thị trường sôi động dịp cuối năm

Bước vào giai đoạn mua sắm cao điểm cuối năm, thị trường smartphone ghi nhận làn sóng điều chỉnh giá mạnh ở phân khúc cao cấp. Nhiều mẫu flagship sau vài tháng mở bán đã được các hệ thống bán lẻ giảm giá đáng kể nhằm kích cầu tiêu dùng, đồng thời chuẩn bị cho chu kỳ sản phẩm mới.
MacBook Pro thế hệ mới có thể ra mắt đầu tháng 3: Chip M5 Pro, M5 Max tăng tốc cuộc đua hiệu năng

MacBook Pro thế hệ mới có thể ra mắt đầu tháng 3: Chip M5 Pro, M5 Max tăng tốc cuộc đua hiệu năng

Apple được cho là sẽ trình làng MacBook Pro dùng chip M5 Pro và M5 Max ngay trong tuần đầu tháng 3, sớm nhất từ ngày 2/3, đánh dấu bước nâng cấp đáng kể về hiệu năng cho dòng laptop cao cấp.