ChatGPTは、Webベースのタスクを閲覧および実行できるようになりましたc

ChatGPTは、Webベースのタスクを閲覧および実行できるようになりましたc
ChatGPTは、Webベースのタスクを閲覧および実行できるようになりましたc

OpenAIは本日、短いライブストリームでChatGPTエージェントを発表しました。これは、数ヶ月前に発表された有望ではあるものの限定的なOperator機能を改良したものです。その仕組みは以下のとおりです。

オペレーターとディープリサーチの融合

OpenAI が行ったのは、すでにエージェント ブラウジング機能を備えている Operator と、Web サイトのコンテンツを迅速に消費、理解、推論できる Deep Research を組み合わせることでした。

その結果、タスクを割り当てると仮想マシン上で起動するエージェントが作成され、その後はただ実行されるだけです。

ユーザーの意図を明確にするためにフォローアップの質問をしたり、トランザクションを完了するためにユーザーにサービスへのログインを求めたりすることができます。

ユーザーはいつでも引き継ぐことができ、途中で補足の指示を送ることもできます。

OpenAIがChatGPTエージェントを構築する方法は非常に興味深いものです。基本的には以下の要素を組み合わせています。

  • Deep Researchによるテキストベースのブラウジング
  • Operatorによるビジュアルブラウジング
  • コードを生成しデータを分析するための独自の端末
  • API (パブリックおよびプライベート) は、 Google ドライブ、Google カレンダー、GitHub、SharePoint などのサービスとプラットフォームを呼び出します。

ChatGPT エージェントのもう 1 つの興味深い点は、ユーザーに閲覧と推論のプロセスのタイムラインを提供することです。これにより、最終結果の各側面がどこから来たのかを理解しやすくなります。

新たな可能性、新たなセキュリティリスク

OpenAIは、エージェントやユーザーを騙して認証情報を渡させたり、偽のウェブサイトで商品を購入させたりしようとする疑わしいウェブサイトや悪意のあるウェブサイトを識別できるよう、モデルをトレーニングするのに多大な労力を費やしたと述べている。

それでも、これは関係者全員にとって新しい領域であるため、ユーザーは ChatGPT エージェントを使用する際に注意する必要があると繰り返し述べています。

可用性

OpenAI の CEO サム・アルトマン氏が詳しく説明したように、ChatGPT エージェントは本日 Pro ユーザー向けに展開され、Plus ユーザーと Team ユーザー向けには「近日中に」展開される予定です。

Pro ユーザーは 1 か月あたり 400 件のクエリを取得できますが、Plus および Teams ユーザーは 1 か月あたり 40 件のクエリを取得できます。

同社はまた、7月末までにChatGPTエージェントをEnterpriseおよびEduユーザー向けに提供することを計画している。

あなたもこれを使ってみたいと思いますか?ぜひコメント欄で教えてください。

AmazonでのAirPodsのセール

  • AirPods Pro 2、USB-C充電:  169ドル (249ドルから値下げ)
  • AirPods 4 USB-C充電:  89.99ドル (129ドルから値下げ)
  • AirPods 4、USB-C、ワイヤレス充電:  119ドル (179ドルから値下げ)
  • AirPods Max、USB-C充電、ミッドナイト:  529.99ドル

havebin.com を Google ニュース フィードに追加します。 

FTC: 収益を生み出す自動アフィリエイトリンクを使用しています。詳細はこちら。