Siriの共同創設者:アシスタントのリリースは「世界を変える出来事」(インタビュー)c

Siriの共同創設者:アシスタントのリリースは「世界を変える出来事」(インタビュー)c
Siriの共同創設者:アシスタントのリリースは「世界を変える出来事」(インタビュー)c

火曜日、Appleは人間と電子機器の関わり方を一変させる。全く新しい。

火曜日に開催されるAppleのiPhoneイベントで最大の発表は、おそらくSiriパーソナルアシスタントソフトウェアの進化版であるアシスタントだろう。Siriは、昨年4月にAppleが噂されていた2億ドルで買収した企業だ。スティーブ・ジョブズの言葉を借りれば、検索や音声認識ではなく「人工知能」の買収だ。

[youtube=http://www.youtube.com/watch?v=MpjpVAB06O4]

Siri が単独で活動していたわずか 2 か月間、Siri は自らを「VPA」と表現していました。

バーチャルパーソナルアシスタント(VPA)は、インターネットにおける次世代のインタラクションパラダイムを体現しています。今日のパラダイムでは、私たちは検索結果のリンクをたどります。VPAでは、会話を通してインタラクションを行います。アシスタントに何をしたいかを伝えると、アシスタントは複数のサービスや情報源を活用してタスクの達成を支援します。実際のアシスタントと同様に、VPAはパーソナルであり、個人の好みやインタラクション履歴に関する情報を活用して特定のタスクの解決を支援し、経験を重ねるごとに進化していきます。

Appleは長年、人工知能(AI)ベースのパーソナルアシスタントを一般向けに提供したいと考えていました。1980年代後半、Appleはこの野心を示すために「Knowledge Navigator」シリーズのビデオ(下記参照)を制作しました。

[youtube=http://www.youtube.com/watch?v=3WdS4TscWH8&start=30]

動画の中で、教授は5年前にジルの研究を貶める記事を誰かが書いたと言及しています(1:25分以降をご覧ください。1:50分で教授はより詳しい内容に触れています)。コンピューターが博士の名前と2006年の論文を読み上げます。つまり、教授は2011年にいるということですね。はっ!PBHKさん、ありがとう!

それ以来、世界は大きく進歩したが、火曜日にご覧いただくように、Apple は 1987 年にはすでに驚くべき先見の明を持っていた。

私たちは、Siri の共同創設者であり取締役でもある Norman Winarsky 氏と話す機会を得ました。

まず、背景について。
私たちがこれまで使ってきたデバイスの入力方法は、最初はキーボード、次にマウス、そして最近ではタッチインターフェースです。これらの方法はすべてAppleが発明したわけではありませんが、過去35年間でスティーブ・ジョブズの会社によって「主流化」されました。

しかし、人間はキーボードやマウス、あるいはタッチスクリーンでコミュニケーションをとるために進化したわけではありません。コンピューターツールを扱うために体を歪めてきました(RSIなんてどうでしょう!)。しかし、実際には、話すことと聞くこと、つまり私たち人類が何万年も前から行ってきた機能のために、私たちは生まれながらに生まれてきたのです。

残念ながら、私たちが話していることを理解できるコンピューター、そしてさらに重要なことに、その情報を使って答えを探し出し、私たちにその情報を返すコンピューターはまだ発明されていません。そのためには、言語を認識するだけでなく、それを理解し、使い、価値のある何かを返す人工知能が必要です。

まあ、それは完全に真実というわけではありません。2003年、米国政府は「学習し、組織化する認知アシスタント」(CALOプログラム)と呼ばれる、史上最も野心的な人工知能プログラムを開始しました。この名称はラテン語で「兵士の召使い」を意味する「calonis」に由来しています。DARPAの「学習するパーソナルアシスタント」プロジェクトの一環として資金提供を受けたこのプログラムは、5年間にわたり実施され、25のトップ大学および民間研究機関から300人以上の研究者が参加しました。その目標は、「推論し、経験から学び、指示に従い、自分の行動を説明し、経験を振り返り、予期せぬ事態にも柔軟に対応できる新世代の認知アシスタントを構築する」ことでした。

このプログラムは、カリフォルニア州メンロパークのSRIインターナショナルによって運営されていました。2007年にプログラムが終了した後、SRIはCALOとその主要メンバーが得た知見を結集し、Siriを設立しました。CALOプロジェクトとそこからスピンオフしたSiriの岐路に立つ、SRIのノーマン・ウィナルスキー氏が、Appleが「アシスタント」を主流化することの意味について語りました。

9to5Mac: Siri の開発においてあなたの役割は何でしたか?

ノーム:CALOプロジェクトが終焉に近づいた頃、CALOプロジェクトの5年間で得た知見を活かし、スマートパーソナルアシスタントを開発する素晴らしい商業的チャンスがあることに気付きました。私の仕事は資金調達(VCはモーゲンターラーとメンロ・ベンチャーズ) と、元モトローラ幹部のダグ・キットラウス氏率いるチームを編成することでした。キットラウス氏には、セマンティックウェブの天才トム・グルーバー氏と、CALOのチーフアーキテクトであるアダム・チェイヤー氏も加わりました。Appleによる買収当時、チームは19名で成長を続けていました。共同創業者3名全員と、初期のチームメンバーの多くは現在もAppleで働いています。もちろん、私は買収後もSRIに残りました。

9to5Mac: Appleに買収された経緯について少し教えていただけますか?どのようなプロセスだったのでしょうか?Appleはどのように評価したのでしょうか?財務状況に関する資料はありますか?

ノーム:私は、売却価格(噂の2億ドル)を含め、売却に関する非公開情報はすべて秘密保持義務を負っています。注目すべきは、AppleがSiriの買収を完了したのは、私たちがアプリを公開してからわずか2ヶ月後だということです。そこから、あなた自身の結論を導き出せるかもしれません。

9to5Mac: Nuance の音声認識は Siri テクノロジーにとってどの程度重要ですか?

ノーム:皆さんが思っているほど重要ではありません。Siriを初めて開発した当時、音声認識にはVlingoを使用していました。そのため、購入時点では音声認識コンポーネントはモジュール化されていました。理論的には、より優れた音声認識技術が登場すれば(あるいはAppleが買収すれば)、Nuanceをそれほど苦労せずに置き換えることができるでしょう。とはいえ、Nuanceは音声合成技術において業界で圧倒的なIPを保有しています。SRIは1995年にNuanceをインキュベーション企業として立ち上げ、2000年にIPOを果たしたので、その点はよく分かっています。

9to5Mac:SiriのAIはどれくらいの電力を消費するのでしょうか?次期iPhoneの発売が遅れた原因でしょうか?

ノーム:Appleのロードマップや遅延については詳しくありませんが、AIには膨大なコンピューティングパワーが必要だということは言えます。Siriソフトウェアはデータをキャッシュし、広帯域で大規模なデータセットにアクセスする必要があり、すべての数値を処理するには大容量プロセッサが必要です。iPhone 3GS向けにSiriをリリースした当初は、効率的に動作させるためにあらゆる最適化とショートカットを実行する必要がありました。ただ言えるのは、より高速なスマートフォンであれば、Siriははるかにスムーズに動作する可能性が高いということです。

9to5Mac: この Siri「アシスタント」は大したことあるの?

Norm:まず最初に言っておきますが、AppleがSiri買収で何を計画しているのか、私には全く分かりません。皆さんと同じように噂は読んでいましたが、どうやらAppleは過去1年半のSiriに関する取り組みを発表する準備を進めているようです(実はWWDCで発表されると期待していました)。誤解しないでください。Appleが仮想パーソナルアシスタントという形で人工知能を「主流化」しようとしていることは、画期的な出来事です。世界を変える出来事と言っても過言ではありません。今のところ、Google Voice Actions、Vlingo、Nuance Goといった部分的なAI対応アプリを使っている人は少数です。Siriはこれらの技術よりもずっと先を行っていました。少なくとも2年前まではそうでした。これは真のAIであり、実際に市場で利用されています。噂が本当なら、Appleは何百万もの人々が自然言語で機械と対話できるようになるでしょう。PALは様々なことを実現するでしょうが、これは氷山の一角に過ぎません。これは新たな技術革命、新たなコンピューティングパラダイムシフトの始まりです。

これはSRIの別のプロジェクトを思い出させます。1960年代にマウスで人間の能力を拡張した発明者、ダグ・エンゲルバートです。スティーブ・ジョブズがその技術を採用し、世に送り出したように、AppleはSiriを使って新たな革命を起こすだろうと私たちは信じています。

9to5Mac: ノームさん、お時間をいただきありがとうございます。スティーブ・ジョブズの「コンピューターは心のための自転車だ」という言葉を思い出しました。

[youtube=http://www.youtube.com/watch?v=9Z795Pm9fqs]

創設者に関するその他の興味深いデータ:

3人の創業者は全員現在もAppleに在籍していますが、それぞれ別のプロジェクトに携わっています。ダグ・キットラウス氏が「次の大きなものを、本当に大きなものにしようとしている」と発言したのが興味深いです(下記)。

アダム・チェイヤー氏は、Siriのリリース直前の2007年にCALO Expressアプリケーションのデモ(PDF)を行いました。このアプリケーションは政府機関での利用を想定していたため、Windows CE上で動作しました。

おそらく、Siri が一般公開される直前の 2008 年にセマンティック ウェブで Tom Gruber が行った講演が最も興味深いものだった。

[vodpod id=Video.15499711&w=651&h=488&fv=]

すべての発表については、火曜日の午前 10 時 (太平洋標準時) に 9to5mac.com に戻ってご確認ください。

havebin.com を Google ニュース フィードに追加します。 

FTC: 収益を生み出す自動アフィリエイトリンクを使用しています。詳細はこちら。