Vietnam.vn - Nền tảng quảng bá Việt Nam

「ベトナムのデータを習得することは、ベトナムの技術を開発し習得するための第一歩です」

Báo Thanh niênBáo Thanh niên27/05/2024

[広告_1]
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 1.

米国の大規模な人工知能組織で働いた後、なぜ母国に戻って VinBigdata に入社することにしたのですか?

米国で働いていた間、私は多くの大規模な政府プロジェクトに参加しましたが、私が達成した成果は、大規模な処理手順のほんの数ステップに過ぎないことがよくありました。実際、プロジェクトの非常に厳格な機密保持手順により、私が開発したソリューションがどのように使用されているかさえわからないことがよくあります。

2017年にベトナムに戻ったとき、ベトナムは発展段階にあり、ビッグデータや人工知能に関して解決すべき問題がたくさんありました。私は、ベトナムの人々の生活に役立つベトナムの技術ソリューションを開発するという目標を共同で実現するために、Vu Ha Van教授の招待を受け入れました。より大きな影響力のある問題に取り組めるので、ベトナムに戻ることはさらに意義深いと感じています。

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

ワークショップに参加したダオ・ドゥック・ミン博士

人工知能開発戦略において、ビッグデータはどのような役割と影響力を発揮するのでしょうか?

データは人工知能のトレーニングにおいて非常に重要な役割を果たします。高品質の人工知能モデルのトレーニングは、通常、大規模なデータセットのトレーニングから始まります。したがって、質の高い人工知能を実現するには、まず良質なデータが必要です。

優れたデータは、量と規模、品質、多様性、普遍性の点で適切な品質である必要があります。生データのクリーニングから人工知能モデルに入力する最高品質のデータの作成まで、数千時間分のデータを収集して処理するプロセスは、コストがかかり複雑です。対照的に、ビッグデータを分析するには、人工知能を使用して、大規模にデータを正確に処理する能力を確保し、より優れた決定的または予測的な結果を生み出す必要があります。

例えば、ベトナム人向けのバーチャルアシスタント製品(ViVi)を開発する過程では、さまざまな地域、年齢、性別、数百分野にわたる内容の数十万の音声から、数万時間分の高品質オーディオデータを収集し、処理する必要がありました...

また、最近では、VinBigdata が完全に所有する大規模言語モデルから開発された「エンドユーザー向けの ChatGPT の最初のベトナム語バージョン」である ViGPT がリリースされました。このモデルは、さまざまな分野からの 600 GB の微調整されたベトナム語データでトレーニングされています。私たちはベトナム語とデータに関する知識を活かし、ChatGPT 誕生後わずか 9 か月以内に ViGPT のリリース時間を短縮する新しいアプローチを見つけました。

これがビッグデータと人工知能の共鳴です。

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.

研究と実用的価値を結び付けてコミュニティに貢献することについて、どのような見解をお持ちですか?

- 技術研究は、実際に生活の中に取り入れられ、社会問題を解決し、人々の生活を向上させたときにのみ、真に成功すると私は信じています。

ビジネスや社会の問題を解決する実用的な商用製品を作成するには、常に注意を払い、「データはどのような価値をもたらすのか」という質問をする必要があります。

当社はこれまで、ViGPT、医療画像診断におけるAIソリューションを提供するVinDr、バイオ人工知能プラットフォームのVinBase、スマート画像分析ソリューションセットのVizoneなど、さまざまな業界や分野向けにさまざまな製品とソリューションを研究開発してきました。

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

Vingroup CorporationのイベントでVinBigdataの主要メンバーと

第4次産業革命が世界規模で勢いを増しています。ベトナムにはどんな利点があると思いますか?

これまでの革命と比べて、ベトナムは現在、この第4次産業革命を突破する上で多くの利点を持っており、世界地図上での同国の地位向上に貢献していると思います。この目標を達成するための 2 つの鍵は、データと人材です。

ベトナムの人口は現在約1億人で、そのうち若者の多くが携帯電話やパソコンを利用しています。さらに、当社には人工知能分野の評判の高い専門家、情報技術分野の若く優秀な人材、そして数学の優れた基礎を持つ人材がいます。

それで、制限は何でしょうか?

最初の明らかな制約は、人口が多いにもかかわらず、データの習得、具体的には施設、事業部門、管理部門でのデータの標準化と同期化が依然として困難であることです。

さらに、投資リソース、特に高性能コンピューティング インフラストラクチャへの投資が限られているなどの制約にも直面しています。

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.

あなたの意見では、ベトナム人の生活に役立つテクノロジーを創造し習得する過程において、ベトナムのデータ習得の役割はどれほど重要ですか?

現在、世界には数多くの優れた人工知能製品があり、典型的には、OpenAI の ChatGPT や Google の Bard など、大規模な言語モデルに基づいて生成する AI アプリケーション製品です。しかし、ベトナム語はこれらの製品の開発における主な言語グループではありません。

そのため、ユーザーに返されるベトナム語特有のコンテンツの品質は多かれ少なかれ影響を受け、エラーが発生する可能性が高く、より危険なのは、基本的な知識のエラーです。

ベトナム人として、私たちは独自のデータソースにアクセスできるという利点を持っています。ベトナムのデータの特性、ベトナム人のニーズや特性を理解できるのは私たちだけです。したがって、ベトナムのデータを習得することが、ベトナムの人々に役立つコアテクノロジーを習得するための鍵となります。

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

VinBigdataメンバー向けの社内研修

特に、現在ベトナム人のほとんどが海外からソーシャル ネットワーキング サイトを使用している場合、特定のデータ ソースにアクセスするにはどうすればよいでしょうか。

事実、現在(ベトナム人に限らず)人間のデータの最大の情報源はインターネットとソーシャル ネットワークにあります。ただし、各プロジェクトで設定された特性に応じて、ベトナムのデータ特性を理解した上で、さまざまなソースからデータにアクセスして収集することは可能です。

たとえば、OpenAI の GPT モデルには数百、あるいは数兆ものパラメータがあり、膨大な量のデータでトレーニングされており、数十億ドルのコストがかかります。彼らと比較して、私たちは研究、能力、リソースに基づいてまったく異なる方向を選択しました。つまり、わずか数十億のパラメータのアーキテクチャを持ち、独自に収集して改良した 600 GB のベトナム語データセットでトレーニングしたベトナム語モデルを作成し、ベトナム語の処理能力という点では同等の機能を持たせるというものです。結果は、当社が独自に開発したアーキテクチャが自己最適化し、言語モデルのトレーニング時間を短縮し、モデルの品質を確保しながらコストを削減できることを示しています。

人工知能製品の研究開発の過程で、あなたとあなたのチームが直面した課題は何ですか?

最初の課題は確かに時間です。人工知能技術の波は非常に速いスピードで到来しており、好況期にあります。世界中で、大手テクノロジー企業が、継続的に更新・改良された完成度の高い製品を次々と発表しています。我々の対応が遅く、製品を時間通りに納品できない場合は、間違いなく遅れをとることになります。

一方、実際に応用でき、社会課題を解決できる製品を作りたいのであれば、製品の優れた、特別な、ユニークな特徴を見つけて開発することも考慮しなければなりません。

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

ベトナム人工知能デー(AI4VN 2023)でのプレゼンテーション

実際、ベトナムや世界中で多くの個人や組織がデータ漏洩によって大きな損失を被っています。データセキュリティの問題をどのように見ていますか?

今日のあらゆるアプリケーションはデータから生まれていると言えます。データを扱う際には、一方ではデータを適用して生活に最適なテクノロジーを生み出すという目標を確実に達成する必要があり、他方では個人と組織のデータ セキュリティを確保する必要があります。

人的要素は、データ セキュリティ プロセスにおいて非常に重要な要素です。開発者、製品ユーザー、ユーザーが含まれます。開発者は、データの収集と処理の最初からデータ セキュリティを意識しておく必要があります。

何も起こらないときは、データ セキュリティの重要性を認識していないことがよくあります。しかし、データ侵害が実際に発生すれば、損害は甚大になる可能性があります。データ侵害は、技術的な問題や意図的なデータ盗難攻撃によって発生する可能性があります。データが漏洩すると、個人や組織の情報が悪意のある人物によって違法な目的で使用される可能性があり、企業は関連する問題を解決するための経済的損失を被り、ブランドにダメージを与えることさえあります。

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

イベントでのDao Duc Minh博士とVinBigdataチーム

ベトナム国民のために技術を習得したいという志の後には、世界へ進出するステップがあるのでしょうか?

製品を国際市場に投入したい組織や企業は、国際基準に準拠する必要があります。 VinBigdata はソリューションとテクノロジーに強みを持っているため、世界を征服するというビジョンを設定するのは自然なことです。

もちろん、さまざまな製品やアプリケーションに展開するには、長年の経験と世界中のユーザーを理解している国際部門のサポートが必要です。

ありがとう!


[広告2]
出典: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

コメント (0)

Simple Empty
No data

同じトピック

同じカテゴリー

祖国統一50周年を祝って花火が空を埋め尽くした
祖国統一50周年:南朝鮮の人々の不滅のシンボル、チェック柄スカーフ
ヘリコプター部隊が離陸した瞬間
ホーチミン市は「国家統一記念日」の準備で活気に満ちている

同じ著者

遺産

仕事

No videos available

ニュース

政治体制

地元

製品