上記のメッセージは、9月22日にホーチミン市で開催されたベトナム人工知能デー(AI4VN)2023で、ネイバー社(韓国)のクラウドイノベーション部門責任者であるハ・ジョンウ氏が共有したものです。
生成 AI は、テキスト、画像、ビデオ、音楽など、さまざまな形式で新しいコンテンツやアイデアを生成できる人工知能の一種です。そこから、AI は大規模言語モデル (LLM) を使用して、新しい歌、薬、映画、ゲームなどを作成できます。
最近のマッキンゼーの推定によると、生成 AI は世界経済に 4.4 兆ドルの貢献をする可能性があります。この研究は、さまざまな業界向けに生成された 60,000 件の AI アプリケーションに基づいて評価されました。
ハ・ジョンウ氏によると、生成AIを開発するための主要な言語モデルは現在英語を使用しているため、モデルを他の言語で実行すると不完全になりエラーが発生し、英語であるため使用すると不要なバイアス、特に文化的なバイアスが生じてしまうとのこと。
だからこそ、データとテクノロジーの習得は、他国への依存リスクを克服するために多くの国が今後考慮すべき重要な要素であると彼は考えています。例えば、韓国では、ネイバーもAIアプリケーションを展開する際に政府や国内企業に役立つ大規模な韓国語モデルを作成しました。
VinBigdataのゼネラルディレクターであるDao Duc Minh博士も同じ見解で、ベトナム人も安全性と情報の正確性を確保し、政府と社会に最大限貢献できる国産AI製品を開発できると考えています...
ダオ・ドゥック・ミン氏によると、2022年末にchatGPTが立ち上げられたとき、生成AIモデルと大規模言語モデルの研究と立ち上げにおいて、国家間および大企業間の競争の地下波が生まれたという。
特に米国では、OpenAI の chatGPT ツールに加えて、Google の Bard や Amazon の Titan などの他の生成 AI モデルが存在します。中国には、百度のEarnie Bot、Sense TimeのSenseChat、TencentのHunyanがある。韓国にはNaverのHyperClova Xがあります…
ダオ・ドゥック・ミン氏は、生成AIに適用する大規模な言語モデルの開発は簡単な作業ではなく、多額の費用がかかると述べた。世界中で利用可能な大規模な言語モデルプラットフォームに基づいて生成AIを適用すると、ベトナムは多くのリスクに直面する恐れがあります。たとえば、大規模な外国語モデルの場合、ベトナム語のデータはごくわずかで、主に英語であるため、正確性、データのセキュリティ、ビジネス ニーズへの適合性を確保することが困難です...
たとえば、大規模な外国語モデルには数千億のパラメータがあります。現実世界のモデルを実行するには巨大なコンピューティング インフラストラクチャが必要ですが、特に歴史的知識、文化、各国固有の問題などでは AI モデルが間違った答えを出す可能性があるため、品質が釣り合いません。
このため、VinBigdata は、データのセキュリティを確保し、精度を向上させ、コストを削減し、国内の状況に適合することを目的として、ベトナム語で大規模な言語モデルを構築することを決定しました。専門家チームは、chatGPT よりも数百倍少ないパラメータを持つモデルを構築しましたが、そのモデルは大量のベトナムのデータに基づいて構築されました。
このモデルは、地域特有の質問に高い精度で答えることができます。具体的には、2 つの異なる違反に関する法律について質問されたときに、chatGPT モデルは同じ回答と一般的な内容を返しました。一方、ベトナムのデータを使用する AI モデルは、非常に具体的な法律、法令、罰金、情報源などに基づいて正確に回答できます。
この正確さを証明するために、ダオ・ドゥック・ミン博士は、ベトナム文学の作品『乞食の妻』についてchatGPTとVinBigdataが開発したベトナム語モデルに質問した際、VinBigdataのモデルの結果は完全に正確であったのに対し、ChatGPTの答えは不明瞭だったという例を挙げました。
VinBigdataの代表者はまた、国内で生成されたAIを習得することは、政府がコンテンツを習得し、誤情報を回避し、国家のデータセキュリティを確保し、ベトナムの技術を世界に広めるのに役立つため重要であると述べた。
[広告2]
ソース
コメント (0)