ニューラル:DeepSeekの説明、NVIDIAの巨額損失、AIのプライバシー主張の誤りc

ニューラル:DeepSeekの説明、NVIDIAの巨額損失、AIのプライバシー主張の誤りc
ニューラル:DeepSeekの説明、NVIDIAの巨額損失、AIのプライバシー主張の誤りc

Neural Networkへようこそ 。AI は急速に進化しています。私たちは、その進化に追いつくお手伝いをいたします。 先週、アメリカのAI企業が中国発のDeepSeek R1との激しい競争に直面していることをお伝えしました。本日、DeepSeekの影響はウォール街にも及び、NVIDIAの株価は17%下落しました。DeepSeek、NVIDIAの対応、そしてAI開発の全体像について詳しく見ていきましょう。

DeepSeekとは何ですか?

DeepSeekは、High-Flyerというヘッジファンドから生まれた中国のAI企業です。梁文興氏が2023年に設立し、中国浙江省杭州に拠点を置いています。文興氏は7年前にHigh-Flyerの共同創業者となり、AI投資に注力していました。

DeepSeekは、米国政府が中国による米国製AIチップへのアクセスを制限する前からモデルの学習を開始していた。そのため、同社は制限が課される前からNVIDIA GPUを豊富に供給していると予想される。

それでも、DeepSeekはNVIDIAの追加ハードウェアへのアクセスが制限されるという制約の中で事業を展開する必要がありました。この制約により、DeepSeekはV3モデルで謳うイノベーションに注力せざるを得なかったのかもしれません。

DeepSeekが示したのは、OpenAIの最新のo3モデルに匹敵する能力です。ChatGPT o3はo1の後継であり、これはおそらくO2が英国の定評ある電話会社であることに起因しています。

いずれにせよ、DeepSeek は、OpenAI のチャットボットと比べて、必要なリソースが大幅に少なく、実行コストもわずかな割合で済む、実質的に同等の競争力を持つモデルを作成しました。

DeepSeekは、モデル蒸留(モデル蒸留)に注力することで、この状況に至りました。これは、より小規模なモデルを用いて、より大規模で複雑なモデルの挙動を再現する手法です。多くのアメリカのAI企業のように、モデルをどんどん大規模化していくのではなく、DeepSeekは、パフォーマンスを維持しながらコストを大幅に削減するコンパクトなシステムの構築に注力してきました。このアプローチは、おそらく高度なGPUへのアクセスが限られていることの影響を受けているのでしょうが、よりスリムで運用コストが低く、それでいて高い競争力を備えたモデルを生み出しています。

DeepSeekのトレーニング方法

これはまだ先の話です。今後どうなるかはまだ分かりませんが、OpenAIをはじめとするアメリカのAI企業が、運用コストを削減し競争力を維持するために、モデルの蒸留を優先するだろうことは間違いないでしょう。言い換えれば、DeepSeekはアメリカのAI企業が真似できない成果を上げていないということです。競争が激化した今、モデルの効率性を優先することが重要になるのです。

しかし、モデルの蒸留を優先したことだけが、DeepSeekがAI競争に参入できた理由ではありません。DeepSeekは、AI生成データを活用し、より自動化されたトレーニング手法を採用することで、人間によるラベル付けデータセットの必要性を減らしています。

対照的に、多くの米国企業は依然として、人間によるフィードバックに基づいてモデルの改善を進める「ヒューマン・イン・ザ・ループ」システムを重視しています。この変化により、DeepSeekはより迅速にスケールアップできますが、品質管理とアライメントに関するリスクが高まる可能性があります。

AI-トレーニング-AI方式の利点は、人間の入力が少なくなるため、トレーニングのスケーラビリティが大幅に向上することです。しかし、課題はエラーが増幅される可能性があることです。また、AIのアライメントチェックも困難になります。

アライメントとは、複雑でオープンエンドなシナリオにおいても、AIシステムが人間の価値観や意図と一致するように動作することを保証するという課題を指します。これが、人間のフィードバックによる強化学習(RLHF)のような手法が存在する理由であり、自動学習がモデルの安全性に対する新たなリスクを伴う理由でもあります。

教師あり学習による微調整と人間からのフィードバックに基づく強化学習により、当社のAIモデルは偏りのない応答を提供します。つまり、データの信頼性を確保しているのです。

アメリカのAI企業がデータ品質を確保する方法に劇的な変化が起こるとは予想していませんが、AIによるAIのトレーニングに向けて大きな動きが見られるようになると考えています。これはOpenAIや同様の企業が常に目指してきた目標であり、DeepSeekはより早くそこへ進むよう圧力をかけただけかもしれません。

600万ドルが6000億ドルを沈める

DeepSeekは、V3モデルの学習コストが600万ドル以下であると主張しており、その低さが注目を集めている。この数字は、おそらく微調整や最終段階の学習コストのみを反映しており、初期モデルの計算コストや研究開発費は考慮されていない。それでもなお、これはDeepSeekの戦略、すなわち、より少ないリソースで、確立されたアーキテクチャからより高いパフォーマンスを引き出すという戦略を強調している。

もう一つ分析すべき数字は6,000億ドル。これはNVIDIAが今日だけで失った時価総額の額です。これは、DeepSeekモデルの学習コストと運用コストが安価になったことで投資家が不安に陥った結果であり、NVIDIAの成長機会は予想よりも少ないことを意味します。

これは極めて近視眼的で過剰反応だと思います。私の考えはこうです。DeepSeekとNVIDIAが重視しているのは、テスト時のスケーリング、つまりエンドユーザーが実際に使用するデプロイメント段階でのモデルパフォーマンスの向上です。これは、モデルがリアルタイムで応答を生成する方法を最適化する、より広範な推論効率化の取り組みの一環です。重要なのは、より速くトレーニングすることではなく、よりスマートに実行することです。

言い換えれば、より多くのNVIDIA GPUを投入することが、AI技術を前進させる答えとなる可能性は依然として高いということです。AI技術は今よりさらに速く、より遠くまで到達できるかもしれません。AIの競争は前進であり、現状への到達ではないことを忘れないでください。

AIは解決された問題ではない

これがOpenAIの大規模なStargateプロジェクトにつながります。Stargateは、基本的にテキサス州にある、ぎっしりとコンピューティング能力が詰め込まれた建物のことです。将来のAIモデルは、より少ないコンピューティング能力でより多くの成果を達成できるとされています。これは、Stargateが目標とする既存のコンピューティング能力で、これらのAIモデルがより多くの成果を達成できることを意味します。

これらの企業がAIで目指す方向性と、現状の間には大きな隔たりがあります。DeepSeekの影響は、他のAI企業に今のところ異なる目標を優先せざるを得なくなったというだけかもしれません。DeepSeekがより革新的な企業であるかどうかを判断するには、今後どのような成果が出てくるかを見守る必要があります。


その他の注意事項をいくつか。

NVIDIA は本日発表した声明で、DeepSeek の取り組みに明るい兆しを見出しました。

DeepSeekは優れたAIの進歩であり、テスト時間スケーリングの完璧な例です。DeepSeekの成果は、広く利用可能なモデルと輸出規制に完全に準拠したコンピューティングを活用し、この技術を用いて新しいモデルを作成する方法を示しています。推論には、多数のNVIDIA GPUと高性能ネットワークが必要です。現在、私たちは3つのスケーリング則、すなわち継続する事前学習と事後学習、そして新しいテスト時間スケーリングを見出しています。

推論とは、学習済みのモデルを実行してリアルタイムの結果を生成する段階を指します。言い換えれば、飛行中に改良された飛行機を製造しているようなものですが、飛行にはジェット燃料が必要です。NVIDIAは前年比93%増、過去5年間では1,782%の成長を続けています。

OpenAI は、主に DeepSeek との競争により、ChatGPT o3-mini が登場したときには、それをより寛大に扱うでしょう。

月曜日に記事を公開した後、OpenAIの責任者サム・アルトマン氏は、DeepSeekが注目を集めていることについてXで次のように反応した。

deepseek の r1 は、特に価格に見合った機能を備えている点において、素晴らしいモデルです。私たちは、もちろん、さらに優れたモデルを提供していく予定ですし、新たな競合相手が現れるというのは本当に心強いことです。いくつかリリースする予定です。

しかし、私たちは主に、研究ロードマップを継続的に実行することに興奮しており、私たちの使命を成功させるには、これまで以上にコンピューティングが重要だと考えています。世界は AI を大量に使用したいと考えており、次世代のモデルには本当に驚かされるでしょう。

AGI とそれ以降のすべてをお届けできることを楽しみにしています。

これは DeepSeek の成果を的確に要約したものであり、この文には多くの取り組みが盛り込まれていることがはっきりと表れています。

ロイター通信によると、トランプ大統領は月曜日にディープシークの影響について言及した。

中国企業の AI「DeepSeek」のリリースは、我々の業界にとって、勝利を目指して競争に全力を注ぐ必要があるという警鐘となるはずだ。

中国と中国の企業について読んできました。特に、ある企業はより高速で、はるかに低コストなAI技術を開発しています。これは良いことです。それほど多くの費用をかけずに済むからです。私はそれをプラス面、つまり資産だと考えています。

私はそれを肯定的に捉えています。なぜなら、あなたも同じことをするでしょうから、それほどお金はかからず、うまくいけば同じ結果が得られるからです。

私たちは常にアイデアを持っています。常に先駆者です。ですから、これは非常に前向きな展開になる可能性を秘めていると言えるでしょう。何十億ドルも費やす代わりに、より少ない費用で、うまくいけば同じ解決策を生み出せるでしょう。

皆さん、AI 競争が始まっています。そして AI 業界は新たな NASA です。

DeepSeekは、大規模なサイバー攻撃によるサービスへの影響により、本日新規アカウントの作成を制限しました。現在、chat.deepseek.comの上部に以下のメッセージが表示されています。

DeepSeekのサービスに対する大規模な悪意のある攻撃により、登録が混雑している可能性があります。しばらくお待ちいただき、もう一度お試しください。登録済みのユーザーは通常通りログインできます。ご理解とご協力をお願いいたします。

しかし、月曜日に数時間試した後、新しいアカウントを作成することができました。

iOSにDeepSeekをインストールすると、中国のAI企業がiPhone上の個人情報(メールやメッセージを含む)に深くアクセスできるという、ソーシャルメディアで話題になった投稿を見たことがあるかもしれません。幸いなことに、iOSのアーキテクチャはそのような仕組みではありません。「Appleでサインイン」を使ってアカウントを作成し、セキュリティ強化のために使い捨てのメールアドレスを生成することもできます。しかし、DeepSeekはチャットボットに入力した情報にアクセスできます。

また、DeepSeekは、1989年の天安門事件について質問された場合、依然として数学、コーディング、論理問題について話すことを提案しています。しかし、Perplexityはこの問題を解決したようです。


AI開発の最新情報は、9to5Mac限定のNeural誌 次号でさらに詳しくお届けします !前回の記事はこちらでご覧いただけます。

人気のiPhoneアクセサリー

  • Anker 621 マグネット式ポータブル充電器
  • Ailun iPhone 16 スクリーンプロテクター
  • Beats Solo Buds
  • Apple MagSafe充電器(1m)
  • Anker USB-A/USB-C 充電器

havebin.com を Google ニュース フィードに追加します。 

FTC: 収益を生み出す自動アフィリエイトリンクを使用しています。詳細はこちら。