この製品はベトナムの科学技術分野ですぐに話題を呼びました。
ベトナムの問題を解決するために困難な道を選ぶ
2022年末には、ChatGPTが「ビッグバン」を起こし、技術分野の国々や大企業の間で人工AIを征服するための競争が始まります。当時、ベトナムの技術コミュニティも、技術的に自立し、海外製品への依存を減らすために、ベトナム製品の開発に熱心でした。しかし、VinBigdata のようにその願いを実現する能力と決意をすべてのユニットが持っているわけではありません。
生成AIは難しい問題です。OpenAIやGoogleのような大企業も、私たちが目にするような製品を開発するために、多大なリソースと時間を研究に費やしています。これらの製品は非常に優れていますが、実際には、科学者たちはまだその動作メカニズムを完全に理解していません。いつエラーが発生するのか、そしてどのようなエラーが発生するのかを予測できる人はほとんどいません。1年足らずという短期間で、ベトナム人向けにChatGPTに似た製品を開発するには、多くの課題があります。しかし、私たちは「リスク」を負うことを選びました。なぜなら、ベトナム語版のChatGPTをベトナム人が作らなければ、誰が作るのでしょうか? - VinBigdataの科学ディレクターであるVu Ha Van教授は次のように語りました。
実際、独自の大規模言語モデルをゼロから構築することを選択する企業はほとんどありません。 OpenAI の GPT 3 には 1,750 億のパラメータがあり、45 テラバイトのデータセットでトレーニングされ、460 万ドルのコストがかかりました。計算によると、GPT 4 の開発にかかる金額は最大 1 億ドルに達する可能性があります。 「これほど膨大な数になると、この技術に投資できる企業を見つけるのは難しい」と、VinBigdataのプロダクトディレクター、グエン・キム・アン博士は語った。
ベトナムの企業が最適なコストとインフラストラクチャで新世代の AI テクノロジーにアクセスできるようにするために、VinBigdata はまったく異なる方向性を選択しました。それは、わずか 16 億のパラメータを持つ言語モデルを作成しながら、数十億のパラメータを持つ大規模言語モデルと同等の機能を実現するというものです。 「結果は、VinBigdata自身が開発したアーキテクチャにより、言語モデルのトレーニングプロセスを最適化および加速し、インフラストラクチャコスト(トレーニングコストと使用コストを含む)を削減しながらも、モデルの品質を確保することが完全に可能であることを示しています」とNguyen Kim Anh博士は付け加えました。
大規模な言語モデルのサイズの問題を解決した後、ViGPT を「考案」する過程で、外国のモデルを研究した後、VinBigdata チームは統計確率モデルの固有の性質から生じる「錯覚」という別の課題にも気づきました。
したがって、世界最大の言語モデルは、多くの場合、英語のデータ ソースを使用してトレーニングされます。したがって、このモデルはベトナム人の状況や文化を実際には理解し、適切に対応していません。これにより、大規模な言語モデルが誤った答えを「捏造」する幻覚が発生します。
最短時間で最適なソリューションを見つけるために、VinBigdata の自然言語処理 (NLP) チームは小グループに分かれ、さまざまなアイデアを分析および議論して、最も適切な最終方向性を見つけました。
「最終的に、私たちは現在の大規模言語モデルとは異なるアーキテクチャを開発し、600GBの微調整されたベトナム語のデータセットでトレーニングを実施し、ベトナム人の文脈を理解してそれに応じた回答を提供できる「インテリジェントな仮想アシスタント」を作成することにしました」とグエン・キム・アン博士は付け加えた。
ベトナムのテクノロジーエコシステムへの憧れ
ベトナム語能力評価基準(VMLU)の評価結果によると、ViGPT は平均スコア 42.24% を達成し、ChatGPT (48.54%) に次いで 2 位となりました。この結果により、ViGPT はベトナム特有の特定のトピックに関する情報をすばやく検索し、質問に答えることができます。
開発チームが望んでいるのは、仮想アシスタントの機能に加えて、ViGPT を日常的によく使われる製品に統合し、ベトナムの人々の生活に変化をもたらすことです。これが、VinBigdata チームが ViGPT を使用して言語および音声製品のエコシステム (ViChat、ViVoice、ViVi Virtual Assistant を含む「Vi」エコシステム) を構築する原動力です。これらの製品は、自動車産業、銀行金融、保険、運輸など、さまざまな業界で使用できます。
「テクノロジー、特にAIに取り組む際、私たちは単に目に見えない、興味深く複雑なシステムを征服したいだけではありません。AIが生活に変化をもたらす直接的な主体となる、具体的で応用性の高い製品を作りたいのです」と、VinBigdataのプロダクトディレクターは断言しました。
したがって、ViGPT の開発の成功は、「純粋にベトナムの」技術とデータを何百万人ものベトナム人の生活に役立てる旅の第一歩にすぎません。 VinBigdataの代表者は、この部門はViGPTをVinBase 2.0マルチ認知人工知能プラットフォームに統合し、さまざまな規模や業種の組織システムや企業に優れたソリューションを提供することを目指していると語った。
ViGPT 以前には、言語および音声処理テクノロジーの分野の専門家とエンジニアのチームである VinBigdata が、ベトナム初の総合的な仮想アシスタントである ViVi (VinFast 電気自動車、Vinhomes Resident アプリケーション、および Vinhomes Online 電子商取引プラットフォームに適用および展開) のリリースで名声を博し、同時に、音声生体認証や音声クローニングなどの世界最先端のテクノロジーを完全に習得しました。
これらのテクノロジーはすべて、主にベトナム固有のデータに焦点を当て、VinBigdata によって収集、分析、精製された 3,500 テラバイトのデータベースに基づいて開発されています。最終的な目標は、ベトナムのデータと知識システムを活用して、世界のテクノロジーをベトナムの生活に取り入れることです。
ViGPT は、VinBigdata が開発したベトナム語大規模言語モデル (LLM) に基づいて構築された、エンド ユーザー向けの最初の「ベトナム語版 ChatGPT」です。 ViGPT は優れた機能を備えており、コンテンツの作成、情報の検索、ベトナム特有のよくある質問への回答など、ベトナム人のニーズに最適になるように設計されています。 ViGPT に登録して体験してください: vigpt.vinbigdata.com |
タン・ハ
[広告2]
ソース
コメント (0)