
ノーマン・ウィナルスキーの6つの物語 2011年10月 - 2014年6月
すべてのストーリーを見る

- アプリ
- アップルニュース
- シリ
- 仕事
- 企業
Siriの開発者が企業向け次世代パーソナルアシスタント技術「Kasisto」を発表
2014年6月27日午前10時46分(太平洋標準時)
後にAppleのiOSに搭載されたSiri音声アシスタント機能の基盤となった技術を開発したSRI Internationalは本日、 「インテリジェントな会話を通じてモバイルデバイスにおけるユーザーエクスペリエンスの向上を目指す」と謳う新製品を発表しました。Kasistoも同様のインテリジェント音声アシスタントですが、同社はこれを企業顧客向けに公開し、自社アプリへの統合を可能にします。
「バーチャルパーソナルアシスタント技術は、モバイルデバイスと消費者のインタラクションに革命をもたらしました」と、SRIベンチャーズの副社長であるノーマン・ウィナルスキー博士は述べています。「今や消費者は、オンラインでのインタラクションにおいて、より人間的な体験を期待しています。Kasistoは、コンテキストを認識し、パーソナライズされ、より効果的な、新たなユーザーエクスペリエンスを実現します。」
同社によると、Kasistoを利用することで、企業は数日、数週間、場合によっては数ヶ月で仮想パーソナルアシスタント機能をモバイルアプリに統合でき、現在類似の技術にかかるコストを大幅に削減できるという。「Kasistoはコンテキスト認識機能を備え、テキスト、タッチ、音声によるモダリティ、そして自然言語理解と推論機能を提供します。また、このプラットフォームには強力なソフトウェア開発キット(SDK)が含まれており、カスタマイズや既存のモバイルアプリケーションへの統合を容易に行うことができます。」
Kasisto の詳細については、同社の Web サイトをご覧ください。
- AAPL社
- iPhone
- アップルニュース
- シリ
- アンドロイド
Nuanceが音声認識の競合Vlingoを買収、Appleの音声エンジンの選択肢が減少

[youtube=http://www.youtube.com/watch?feature=player_embedded&v=4amvRLG4un8]
最近、音声認識の選択肢は少なくなっていますが、NuanceがVlingoを買収したと発表したことで、さらに選択肢は少なくなっています。買収額は非公開です。特許侵害をめぐる複数の訴訟を経て、両社はVlingoのCEOであるデイブ・グラナン氏が「良い結果」と呼ぶ結果に至ったようです。グラナン氏は、AllThingsD経由の声明で、以下のように述べています。
VlingoとNuanceは、モバイル音声と言語理解の力と世界的な普及という共通のビジョンを長年共有してきました。両社の研究開発における相互補完的な取り組みの結果、両社は単独で取り組むよりも連携することでより強固な基盤を築くことができます。両社のリソースを組み合わせることで、競争力を高め、お客様、パートナー、そして開発者の皆様に強力な提案を提供できるようになります。
Vlingoは様々な音声制御Androidアプリで使用されていることで知られており、iPhone 4Sに搭載されたAppleのSiriの競合と目されています。しかし、SiriもAppleがVlingoを採用する以前からVlingoを使用しており、その後Nuanceに切り替えました…
9to5Macとのインタビューで、Siriの共同創設者であるノーマン・ウィナルスキー氏は、Nuance社に切り替えられる前は、Siriの音声認識コンポーネントとしてVlingoが使用されていたと述べています。彼は次のように述べています。「理論的には、より優れた音声認識技術が登場すれば(あるいはApple社が買収すれば)、Nuance社をそれほど苦労せずに置き換えることができるでしょう。」 引用全文は以下の通りです。
9to5Mac: Nuanceの音声認識はSiri技術にとってどれほど重要ですか?拡大拡大閉じる
- AAPL社
- iPhone
- アップルニュース
- シリ
- マイクロソフト
マイクロソフト幹部「Siriは特別なものではない、1年以上前からある」

[youtube=http://www.youtube.com/watch?v=8akOCfqe-v0]
MicrosoftとAppleは、タッチインターフェースへの取り組みにおいて正反対のアプローチをとってきました。Appleが2007年に初代iPhoneを発売し、モバイルデバイスにマルチタッチ機能を一般向けに提供しようとしたのに対し、MicrosoftはSurfaceマルチタッチテーブルでその進化版を作り上げました(Surfaceは今なら8,400ドルで購入可能、2012年初頭発売予定)。
Microsoft 社も Xbox 360 コンソール用の Kinect モーション コントローラで自然なユーザー インターフェイスを進化させ、Apple 社は Siri と呼ばれる人工知能駆動型パーソナル アシスタントで未来への道を切り開きました。
そこで、マイクロソフトの最高戦略・調査責任者であるクレイグ・マンディー氏がフォーブスのエリック・サヴィッツ氏と同席し、 同社の新ユーザーインターフェースの拡張計画について話し合ったとき、同氏は、Windows メーカーの研究所外で開発された画期的な技術に異議を唱えられたときにマイクロソフトの幹部が通常行うような発言をした。つまり、iPhone 4S 専用の Apple の画期的なデジタル秘書機能に関して失言したのだ。
上記のクリップで彼はこう言っています(マーク 1:45)。
Appleの発表に人々は夢中になっている。確かに良いマーケティングではあるが、少なくとも技術的な能力という点では、MicrosoftはWindows Phone 7の導入以来、1年以上前からWindows Phoneで同様の機能を実現していると言えるだろう。
Windows Phone、マジで?マンディー氏はSiriがAppleの切り札だとは認めず、Microsoftが技術の「製品化」について一つや二つ学ぶべき点があることをほとんど認めなかった。そして彼は、Windows Phone上でのMicrosoft版Siriの動作について説明し続けた。展開展開閉じる
- アプリ
- iPhone
- アップルニュース
- シリ
- Mac App Store
Nuanceの音声認識機能がDragon ExpressとともにMac App Storeに登場

Nuanceは、Mac App StoreでDragonディクテーションの新製品「Dragon Express」(導入価格49ドル)をリリースしました。これは、同社のDragon Dictateソフトウェアの機能を縮小した廉価版です。この新バージョンはLionのメニューバーに常駐し、キーボードショートカットまたはマウスクリックでディクテーションウィンドウを起動して、音声をすぐにテキストに変換できます。そこから、すぐにメールで送信したり、テキストでWeb検索したり、コピーしたり、いつものSNSで共有したりできます。
「Dragon Expressは、音声認識を初めて使う方や、タイピングではなく音声で簡単に入力できるディクテーションツールをお探しの方に最適なアプリです」と、NuanceのDragon担当シニアバイスプレジデント兼ゼネラルマネージャー、ピーター・マホニー氏は述べています。「より高度な音声認識プログラムをお探しの方には、高度な音声認識技術のフル機能を備えたDragon Dictateをお勧めします。」
Nuanceの音声認識技術は現在、Appleの音声アシスタントSiriに組み込まれていますが、Siriの共同創設者であるノーマン・ウィナルスキー氏は9to5Macの最近のインタビューで、「より優れた音声認識機能が登場すれば」置き換えられる可能性が高いと述べています。Dragon ExpressとNuanceの本格的な音声入力ソフトウェアを比較したい方は、Nuanceが以下の表を公開しており、2つのアプリの機能を比較しています。
(MacStories経由) ExpressとDictateの機能比較
プレスリリース全文は休憩後に(MarketWatch経由)。拡大拡大閉じる
- AAPL社
- iPhone
- アップルニュース
- シリ
- 人工知能
Siriのデモが話題になっています。これは「世界を変える」ことになるのでしょうか?

http://www.youtube.com/watch?v=rNsrl86inpo
Siri発表の1週間前、Siriの共同創設者ノーマン・ウィナルスキー氏にインタビューした際、彼はAppleの「バーチャル・パーソナル・アシスタントの主流化」への取り組みが、ヒューマンインターフェースの次なるステップになるだろうと語っていました。キーボード、マウス、タッチスクリーン、そして今や音声。まさに世界を変える出来事です。
誤解しないでください。Appleが仮想パーソナルアシスタントという形で人工知能を「主流化」させたことは、まさに画期的な出来事です。世界を変える出来事と言っても過言ではありません。今のところ、Google Voice Actions、Vlingo、Nuance Goといった部分的なAI対応アプリを使っている人はごくわずかです。Siriはこれらの技術をはるかに先取りしていました。少なくとも2年前まではそうでした。これは真のAIであり、実際に市場で利用されています。噂が本当なら、Appleは何百万もの人々が自然言語で機械と対話できるようになるでしょう。PALは様々なことを実現するでしょうが、これは氷山の一角に過ぎません。これは新たな技術革命、コンピューティングにおける新たなパラダイムシフトと言えるでしょう。
一部の顧客が iPhone 4S を早めに手に入れたため、Siri の初期のチュートリアルが以下のようにネット上に公開されています。
拡大
拡大
閉じる
- AAPL社
- iPhone
- アップルニュース
- シリ
- 人工知能
Siriの共同創設者:アシスタントのリリースは「世界を変える出来事」だ(インタビュー)

火曜日、Appleは人間と電子機器の関わり方を一変させる。全く新しい。
火曜日に開催されるAppleのiPhoneイベントで最大の発表は、おそらくSiriパーソナルアシスタントソフトウェアの進化版であるアシスタントだろう。Siriは、昨年4月にAppleが噂されていた2億ドルで買収した企業だ。スティーブ・ジョブズの言葉を借りれば、検索や音声認識ではなく「人工知能」の買収だ。
[youtube=http://www.youtube.com/watch?v=MpjpVAB06O4]
Siri が単独で活動していたわずか 2 か月間、Siri は自らを「VPA」と表現していました。
バーチャルパーソナルアシスタント(VPA)は、インターネットにおける次世代のインタラクションパラダイムを体現しています。今日のパラダイムでは、私たちは検索結果のリンクをたどります。VPAでは、会話を通してインタラクションを行います。アシスタントに何をしたいかを伝えると、アシスタントは複数のサービスや情報源を活用してタスクの達成を支援します。実際のアシスタントと同様に、VPAはパーソナルであり、個人の好みやインタラクション履歴に関する情報を活用して特定のタスクの解決を支援し、経験を重ねるごとに進化していきます。
Appleは長年、人工知能(AI)ベースのパーソナルアシスタントを一般向けに提供したいと考えていました。1980年代後半、Appleはこの野心を示すために「Knowledge Navigator」シリーズのビデオ(下記参照)を制作しました。
[youtube=http://www.youtube.com/watch?v=3WdS4TscWH8&start=30]
動画の中で、教授は5年前にジルの研究を貶める記事を誰かが書いたと言及しています(1:25分以降をご覧ください。1:50分で教授はより詳しい内容に触れています)。コンピューターが博士の名前と2006年の論文を読み上げます。つまり、教授は2011年にいるということですね。はっ!PBHKさん、ありがとう!
それ以来、世界は大きく進歩したが、火曜日にご覧いただくように、Apple は 1987 年にはすでに驚くべき先見の明を持っていた。
私たちは、Siri の共同創設者であり取締役でもある Norman Winarsky 氏と話す機会を得ました。
拡大
拡大
閉じる