この新しいモデルは、アメリカの巨大企業の優位性に挑戦するだけでなく、オープンソースによってゲーム全体を再構築します (図: DS)。
このモデルは6,850億個のパラメータを持ち、オープンソースライセンスの下で公開されています。初期テストの結果では、そのパフォーマンスはOpenAIやAnthropicの独自システムと同等であることが示されており、高度なAIモデルの開発と配布への新たなアプローチを切り開きます。
パフォーマンスとコスト
Hugging Faceプラットフォームへのリリース直後、DeepSeek V3.1はAiderプログラミングテストで71.6%のスコアを獲得しました。技術的には、このモデルは最大128,000トークン(約400ページの書籍に相当)のコンテキストを処理できます。このアーキテクチャは「ハイブリッド」と表現され、会話、推論、プログラミング機能を統合しています。
「DeepSeek V3.1はAiderで71.6%を達成した。これはClaude Opus 4より約1%高い数値だが、コストは大幅に低い」とAI研究者のアンドリュー・クリスチャンソン氏はソーシャルネットワークXで述べた。
V3.1 を使用してプログラミング タスクを完了するための平均コストは約 1.01 ドルと推定されますが、同等のシステムでは 70 ドル近くかかる場合があります。
一部のコミュニティ開発者は、アーキテクチャに4つの「特別なトークン」が存在することにも注目しました。これにより、モデルはリアルタイムのウェブ検索を統合し、複雑な推論プロセスを処理できるようになります。
この違いは、毎日何千もの AI 対話を処理する企業にとっては数百万ドルの節約につながります。
ゲームを変える優位性
バージョン3.1のリリースは、OpenAIとAnthropicが新しいモデルを発表してからわずか数週間後に行われました。DeepSeekはオープンソースアプローチを選択することで、有料APIを通じてAIモデルを商用化する多くの米国企業とは異なる戦略を採用しています。
高度な機能を広く利用できるようにすることで、組織や企業はより迅速に展開できるようになると同時に、技術の独占に基づくビジネス モデルに挑戦できるようになると主張する人もいます。
DeepSeek V3.1 の登場は、高度な AI が大企業だけでなく、小規模な研究グループにも受け入れられていることを示しています。
この分野における競争は、もはや最も強力なシステムを構築することに限定されず、テクノロジーをアクセスしやすく手頃な価格にすることにも重点が置かれています。
このような状況において、テクノロジー企業にとっての課題は、競争力のあるパフォーマンスとコストを備えたオープンソース モデルがますます増える中で、どのようにして商業的価値を維持するかということです。
出典: https://dantri.com.vn/cong-nghe/deepseek-am-tham-ra-phien-ban-ai-moi-20250820121017977.htm
コメント (0)