Le partage ci-dessus a été donné par le professeur Vu Ha Van, directeur scientifique de VinBigdata, lors d'une discussion avec des journalistes en marge du récent événement de lancement de ViGPT.

anhvuhavan.jpg
Professeur Vu Ha Van, directeur scientifique de VinBigdata.

ViGPT a besoin des contributions des techniciens et de la communauté

Le professeur Vu Ha Van a déclaré que pour les grandes entreprises comme Google, lors du développement de langues majeures, elles choisiront l'anglais ou le français comme langue principale. Bien qu'il existe également le vietnamien, les résultats de recherche ou les recherches seront relativement lents par rapport à d'autres langues. Dans une certaine mesure, les réponses de ces grands modèles linguistiques aux questions du vietnamien ne seront pas complètes et précises.

C'est pourquoi VinBigdata espère qu'avec le temps, ViGPT les surpassera en précision sur des questions directement liées à la culture, à l'histoire, à la géographie... des informations présentant des caractéristiques et des propriétés propres au peuple vietnamien. C'est ce que veulent et visent les créateurs du modèle de langue vietnamienne à l'avenir lorsqu'ils poseront des questions aux Vietnamiens, ce sera une meilleure source de comparaison que les sources étrangères.

En allant plus loin, le directeur scientifique de VinBigdata a analysé, par exemple, une question dans une période politique « sensible » sur l'histoire de Truong Sa et Hoang Sa, il nous est très difficile de garantir que la réponse de Google ou d'OpenAI ne porte pas le parti pris politique des fondateurs ou des personnes derrière ces entreprises. Ici, nous avons d’autres options au Vietnam, il serait préférable que nous y réfléchissions.

« Notre objectif en construisant un grand modèle linguistique pour le peuple vietnamien est d'apporter les meilleures réponses au peuple vietnamien, nous ne pouvons pas connaître leur objectif », a partagé le professeur Vu Ha Van.

Certes, il y a beaucoup de choses que ViGPT ne peut actuellement pas faire aussi bien que ChatGPT ou Google Bard, car le taux d’investissement de ces entreprises et le temps qu’elles prennent à mettre en œuvre sont des milliers de fois plus élevés. Mais le professeur Vu Ha Van a déclaré que pour certaines questions qui sont biaisées en faveur du Vietnam, comme « Quel drapeau est brodé avec six mots d'or ? », ViGPT répondra qu'il s'agit de Tran Quoc Toan, tandis que les autres versions peuvent être erronées. À l’avenir, avec des questions approfondies comme celle-ci, ViGPT fera mieux s’il y a des retours des utilisateurs nationaux.

« Si les utilisateurs se contentent de critiquer ou pensent que ce modèle de langage complexe est encore stupide, alors que mon enfant de 10 ans connaît les questions qu'il ne connaît pas, ou posent des questions pièges pour prouver que nous sommes plus intelligents que l'IA, nous sommes plus intelligents que l'IA, mais ce n'est pas pour rien. Ici, nous n'améliorons pas le produit, mais nous déprimons ceux qui le développent. C'est pourquoi VinBigdata a besoin de la contribution commune des techniciens et de la communauté, et nous avons besoin de la collaboration des Vietnamiens pour perfectionner le produit afin qu'il ne soit pas un simple outil de service, mais qu'il fasse la fierté du peuple vietnamien », a souligné le professeur Vu Ha Van.

Prêt à soutenir et accompagner le modèle linguistique vietnamien

S'adressant à VietNamNet , des représentants de startups travaillant sur l'IA au Vietnam ont déclaré qu'ils étaient prêts à soutenir et à accompagner le modèle linguistique vietnamien de VinBigdata.

ViGPT.jpg
Soutenir et accompagner ViGPT est essentiel pour développer un grand modèle linguistique vietnamien.

M. Dinh Tran Tuan Linh, directeur technologique de la société par actions Unikon, propriétaire de la plateforme Aicontent.vn, a déclaré qu'actuellement, peu de pays d'Asie ont fait des efforts pour former avec succès leurs propres grands modèles linguistiques, la Chine, la Corée et le Japon étant les leaders. Par conséquent, ViGPT est un signal important pour les efforts du peuple vietnamien visant à investir dans les technologies de base. Selon M. Dinh Tran Tuan Linh, tout voyage de mille kilomètres doit commencer par les premiers pas. En tant que pionnier dans l'application de l'IA, Unikon est prêt à contribuer, tester, donner son avis et même utiliser ViGPT de manière expérimentale dans certains projets d'échelle appropriée.

Pendant ce temps, M. Dang Huu Son, cofondateur de Lovinbot, a déclaré que l'écoute de la communauté et des commentaires des experts par VinBigdata est une très bonne chose pour développer un grand modèle linguistique spécifiquement pour le peuple vietnamien. En tant que technicien, M. Dang Huu Son a également donné son avis à l'équipe technique de VinBigdata après avoir utilisé le produit.

Selon M. Dang Huu Son, un produit nouvellement lancé ne peut pas être achevé immédiatement, mais il ne peut pas non plus recevoir immédiatement le soutien total de la communauté, car les Vietnamiens pensent depuis longtemps que le Vietnam ne peut pas faire cette technologie, il faut donc encore du temps. Dans le même temps, VinBigdata doit disposer d’instructions spécifiques sur la manière dont la communauté peut mieux se soutenir et s’accompagner.

M. Dang Huu Loc, fondateur de la plateforme Mindmaid, a également indiqué qu'il existe actuellement très peu de pays dans le monde qui ont construit un modèle de langue maternelle. Même les pays riches dotés de technologies de l’information performantes comme l’Inde, ou les pays avec un PIB plus élevé que le Vietnam comme l’Indonésie, le Moyen-Orient… ne peuvent pas le faire simplement parce qu’ils le veulent, car cela dépend aussi des caractéristiques linguistiques. Par conséquent, d’un point de vue plus large, le Vietnam dispose d’un avantage stratégique dans la construction d’un grand modèle de langue autochtone, et cela constituera un avantage stratégique pour le peuple vietnamien pour être compétitif à l’échelle mondiale.

Selon M. Dang Huu Loc, tout effort visant à construire un grand modèle de langue vietnamienne est précieux et doit être commenté de manière spécifique pour rendre le modèle plus complet chaque jour, au lieu d'utiliser certaines lacunes actuelles pour nier tous les efforts des unités technologiques nationales. Les Vietnamiens devraient également diffuser plus largement l’importance de la technologie du grand langage à l’ère de l’IA et discuter davantage de la manière de l’appliquer pour créer de la valeur pour eux-mêmes et les entreprises vietnamiennes, au lieu de comparer les modèles de grand langage vietnamiens avec les meilleurs modèles de grand langage au monde aujourd’hui. Parce que les grands langages sont de l’IA générale, ils peuvent ne pas être bons pour un problème, mais peuvent convenir à un autre problème spécifique. En particulier, le modèle de langue vietnamienne à grande échelle aura un meilleur avantage dans les problèmes liés à la compréhension et à la génération du vietnamien.

La version communautaire de ViGPT sera fournie gratuitement aux organisations à but non lucratif . La version communautaire de ViGPT sera fournie gratuitement par VinBigdata aux organisations à but non lucratif. Cependant, les unités utilisant cette version devront payer des coûts d’infrastructure tels que le cloud et d’autres ressources lors du déploiement.