Vietnam.vn - Nền tảng quảng bá Việt Nam

Nâng cao sự hiện diện của tiếng Việt trong hệ sinh thái AI toàn cầu

Với chủ đề: "Xây dựng nền tảng cho AI tại Việt Nam với dữ liệu tiếng Việt mã nguồn mở", Chương trình Thách thức Đổi mới sáng tạo Việt Nam 2025 đã chính thức được khởi động vào ngày 14/3 tại Trung tâm Đổi mới sáng tạo quốc gia (NIC).

Thời ĐạiThời Đại15/03/2025

Chương trình năm nay tập trung vào Dự án ViGen, một sáng kiến hợp tác giữa NIC, Meta và tổ chức AI for Vietnam, hướng tới việc tạo lập bộ dữ liệu tiếng Việt quy mô lớn, phục vụ đào tạo và đánh giá các mô hình ngôn ngữ lớn (LLMs). Trong đó, NIC đóng vai trò là đơn vị chủ quản, điều phối, bảo đảm dự án phù hợp với các mục tiêu quốc gia của Việt Nam.

Với sự tham gia của các đối tác chiến lược như NVIDIA, Viettel và Viện Hàn lâm Khoa học & Công nghệ Việt Nam, ViGen đặt mục tiêu không chỉ mở rộng phạm vi sử dụng tiếng Việt trong AI mà còn đảm bảo tính chính xác, phản ánh đúng ngữ cảnh, văn hóa và cách diễn đạt của người Việt. Dự án ViGen được kỳ vọng sẽ nâng cao sự hiện diện của tiếng Việt trong hệ sinh thái AI toàn cầu, góp phần thúc đẩy nền kinh tế số phát triển bền vững.

Nâng cao sự hiện diện của tiếng Việt trong hệ sinh thái AI toàn cầu
Lễ khởi động Chương trình Thách thức Đổi mới sáng tạo 2025.

Theo ông Trần Việt Hùng, Nhà sáng lập & CEO của AI for Vietnam, dự án này phù hợp với Sáng kiến Dữ liệu Mở và Tin cậy (OTDI) của Liên minh AI toàn cầu, góp phần khắc phục tình trạng tiếng Việt chưa được đại diện mạnh mẽ trong lĩnh vực AI quốc tế. ViGen sẽ xây dựng các bộ dữ liệu tiếng Việt nguồn mở với quy mô lớn và chất lượng cao để đào tạo và đánh giá khả năng của các mô hình AI, đảm bảo AI có thể xử lý và hiểu ngôn ngữ tiếng Việt một cách tự nhiên và toàn diện. Dự án ViGen cũng đóng góp vào việc đảm bảo sự phát triển của AI phù hợp với giá trị văn hoá và tiêu chuẩn đạo đức ở Việt Nam.

Ông Võ Xuân Hoài, Phó Giám đốc NIC, nhấn mạnh rằng AI đang thay đổi thế giới, và nếu Việt Nam muốn tận dụng tối đa tiềm năng của AI, thì việc có một nguồn dữ liệu chính xác, quy mô lớn và phản ánh đúng văn hóa Việt Nam là điều kiện tiên quyết. Việc xây dựng bộ dữ liệu tiếng Việt mã nguồn mở đóng vai trò cốt lõi trong sự phát triển của AI tại Việt Nam. Dữ liệu này không chỉ giúp nâng cao chất lượng mô hình AI mà còn đảm bảo chúng có thể ứng dụng hiệu quả trong các lĩnh vực quan trọng như hành chính công, giáo dục, y tế và pháp luật.

"Dự án ViGen phù hợp với Nghị quyết 57/NQ-TW của Bộ Chính trị nhằm thúc đẩy đột phá trong khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia. Dự án ViGen đòi hỏi nỗ lực chung từ các nhà hoạch định chính sách, nhóm nghiên cứu, nhà nghiên cứu, nhà phát triển, chuyên gia và người dùng. Cùng nhau, chúng ta sẽ biến AI thành một công cụ mạnh mẽ cho mọi người Việt Nam và đưa Việt Nam trở thành cường quốc AI toàn cầu…", ông Võ Xuân Hoài nói.

Tuy nhiên, một thách thức lớn hiện nay là làm thế nào để đảm bảo tính chính xác, bảo mật và tránh sai lệch thông tin trong quá trình xây dựng dữ liệu. Nhằm hỗ trợ dự án, Meta đã cam kết đóng góp các bộ dữ liệu mã nguồn mở từ chương trình AI và Dữ liệu vì Lợi ích Cộng đồng, bao gồm những thông tin chi tiết về di chuyển, kết nối xã hội và dữ liệu đào tạo từ bản đồ dân số có sự hỗ trợ của AI. Đây sẽ là nguồn tài nguyên quan trọng giúp phát triển AI Việt Nam theo hướng hiệu quả và bền vững.

GS. Yann LeCun, Phó chủ tịch, Kiến trúc sư trưởng về Trí tuệ nhân tạo của Tập đoàn Meta cho biết: "Dự án ViGen và Chương trình Thách thức Đổi mới Sáng tạo Việt Nam không chỉ nhằm thúc đẩy công nghệ, mà còn hướng tới xây dựng một tương lai AI toàn diện, tôn vinh và tích hợp di sản văn hóa và ngôn ngữ độc đáo của Việt Nam."

Cũng tại chương trình, với trọng tâm nâng cao sự hiện diện của tiếng Việt trong phát triển AI thông qua các bộ dữ liệu mã nguồn mở, Meta và Deloitte cũng công bố cuốn cẩm nang dành cho khu vực công mang tên "Đổi mới sáng tạo trong khu vực công ở Châu Á - Thái Bình Dương với AI mã nguồn mở: Khai phá tiềm năng đột phá cùng Llama".

Cẩm nang này cung cấp các phương pháp tối ưu trong việc ứng dụng AI mã nguồn mở và đánh giá các ứng dụng thực tiễn của mô hình Llama trong các lĩnh vực quan trọng của khu vực công, bao gồm: tương tác với người dân, quản lý hành chính công, tuân thủ chính sách, giáo dục, y tế, và an ninh công cộng.

Đặc biệt, cẩm nang giới thiệu 2 ứng dụng thực tiễn của mô hình Llama tại Việt Nam: Bộ Khoa học và Công nghệ đã hợp tác cùng MISA để thử nghiệm một trợ lý ảo, giúp giảm 98% thời gian tra cứu thông tin cho cán bộ, qua đó tăng hiệu suất làm việc và tiết kiệm thời gian. Trong dự án với Bộ Tư pháp, Viettel đã tận dụng Llama để triển khai trợ lý pháp lý ảo, giúp rút ngắn thời gian nghiên cứu văn bản pháp luật khoảng 30%.

Chương trình Thách thức Đổi mới sáng tạo 2025 đánh dấu năm triển khai thứ 3 của chương trình với mục tiêu thúc đẩy phát triển lĩnh vực trí tuệ nhân tạo (AI) tại Việt Nam. Từ năm 2022, mỗi năm chương trình thu hút hơn 750 giải pháp từ trên 20 quốc gia, vùng lãnh thổ tham gia.

Nhân chuyến thăm của Tổng thống Biden tới Việt Nam năm 2023, Thách thức Đổi mới sáng tạo Việt Nam được Cổng thông tin Nhà Trắng, Hoa Kỳ đánh giá là điểm nhấn về hợp tác công nghệ và đổi mới sáng tạo giữa Việt Nam và Hoa Kỳ.

Nguồn: https://thoidai.com.vn/nang-cao-su-hien-dien-cua-tieng-viet-trong-he-sinh-thai-ai-toan-cau-211308.html


Bình luận (0)

Simple Empty
No data

Cùng chuyên mục

Cú 'quay xe' của nữ sinh duy nhất được tuyển thẳng vào Trường ĐH Y dược TP.HCM
Trí tuệ nhân tạo hoạt động như thế nào?
Tp. Hồ Chí Minh - vóc dáng của một 'siêu đô thị' hiện đại
Loạt sự kiện hứa hẹn sẽ đưa hình ảnh Bình Định vươn xa

Cùng tác giả

Di sản

Figure

Enterprise

No videos available