Visual Intelligenceの第一印象は、将来への期待を高めてくれます

Visual Intelligenceの第一印象は、将来への期待を高めてくれます
Visual Intelligenceの第一印象は、将来への期待を高めてくれます
ビジュアルインテリジェンスの第一印象は、将来への期待を高めてくれます | ワインボトルを正しく識別する

開発者向けベータ版であることは承知しています。Appleの担当者に聞かれたら、Visual Intelligenceの第一印象はあくまで将来の可能性に関するものだと説明してください。しかし、実際に使ってみて、その将来性に期待が膨らみました。

Apple Intelligenceの実際の機能は現時点では比較的限られています。ほとんどの場合、ChatGPTに表示されているものの説明を求めるか、Google検索を使うかの選択肢しかありません…

実際のApple Intelligenceの部品

私たちの知る限り、Apple Intelligence はいくつかの機能を直接実行します。

  • シーンで見たテキストを要約する
  • Apple Mapsからビジネス情報を取得する
  • テキスト内の日付と時刻を認識し、そのスロットのカレンダーを開く

しかし、物体認識に関しては、現時点ではChatGPTとGoogleのみを使用しているようです。私の限られた経験では、Googleが圧倒的に優れています。

GoogleとChatGPTを使用した画像認識

些細な買い物以外は、たいていの場合、購入ボタンを押す前にかなり徹底的に調べる傾向があります。レビューを読んだり、友人にアドバイスを求めたり、Googleで徹底的に調べ上げたりします。

したがって、どこかで何かが使われているのを見て、それをチェックしたいと思ったら、具体的な情報が必要です。コンパクトな豆からカップまでコーヒーを淹れるマシンなどを見ていると言われるだけでは、十分ではありません。

では、Visual Intelligence v0.1 の性能はいかがでしょうか? 自宅にあるいくつかのものでテストしてみました。

まず最初に表示されたのは、電子レンジ、オーブン、エアフライヤーが一体になったSage Combi Wave 3-in-1です。米国ではBrevilleブランドで販売されています。Visual Intelligenceはすぐにこれを検出しました(最初の一致、右上)。競合製品も表示されましたが、その他の上位ヒットはすべて正確でした。

次は、Sage Barista Touchコーヒーメーカーです。VIはこの点について少し確信が持てず、Barista Touchか、同じブランドのずっと高価なOracle Touchモデルのいずれかではないかと示唆していましたが、どちらのモデルが正しいかはすぐに判断できます。(3つ目のモデルも候補に挙がっているようですが、これは写真のラベルが間違っているサイトの広告です。)

Aarke Carbonater II 炭酸水メーカー?問題ありません。

リーデルのOワインタンブラーでは少し苦戦しましたが、模倣品がたくさんあるので許容範囲です。ほとんどはオリジナルと直接コピーした商品だけでした。

リビングルームに移ると、これはイームズ ラウンジ チェアであると認識されました。ミリ単位の正確なレプリカなので、本物と区別がつかなくても許せます。

あまり知られていない(無名ではない)アーティストのオリジナルアートで試してみましたが、うまくいきませんでした。しかし、版画の場合は問題なく識別できました。

私の Naim Mu-so の場合、第 1 世代ではなく第 2 世代のデバイスであると想定されましたが、見た目は同じであり、Web 参照のほとんどすべてがそのモデルに関するものであることを考えると、それはまったく理解できます。

家の周りの他のテクノロジーでも試してみました。

  • オリジナルHomePod
  • エコードット
  • Philips Hueスイッチ
  • Netatmo スマートドアベル

これらすべてについては正しかったのです。

これは素晴らしいスタートであり、これからさらに多くのことが起こります

AI による画像認識技術を私が初めて体験したのは、Ray-Ban Meta メガネを試したときでした。ただし、その技術を最大限に活用するには、慎重な言い回しや追加の質問が必要でした。

ビジュアルインテリジェンスはすでにこれよりも優れているように見えます。そして、その開発のスピードこそが私を最も興奮させるのです。この分野では複数の企業が競争しており、非常に短期間で大きな進歩が見られるようになると思います。

もちろん、すべての AI 技術と同様に、恥ずかしい間違いもあるでしょう。しかし、この技術の本質は、あらゆるやり取りから学習することです。

お店や街で見かけた商品にiPhoneを向けるだけで、瞬時に星評価の平均とレビューのAIによる適切な要約が表示されるようになる日も、そう遠くないだろう。Appleはたいてい、新しい技術を使って私たちがどう反応するかを楽しみにしていると言っているのだが、今回は全く逆だ。

もしアクセスできたなら(私の場合は数週間かかりましたが)、Visual Intelligenceの第一印象はいかがでしたか?ぜひコメント欄でご意見をお聞かせください。また、以下のFernandoのビデオもご覧ください。

写真: 9to5Mac

havebin.com を Google ニュース フィードに追加します。 

FTC: 収益を生み出す自動アフィリエイトリンクを使用しています。詳細はこちら。