Appleの新しいSiriは、Googleの音声操作に追いつこうとしている。しかし、それは非常に人間的なやり方だ。
Mac

Appleの新しいSiriは、Googleの音声操作に追いつこうとしている。しかし、それは非常に人間的なやり方だ。

  • Oligur
  • 0
  • vyzf
Appleの新しいSiriは、Googleの音声操作に追いつこうとしている。しかし、それは非常に人間的なやり方だ。
シリ・ヒーロー

すでに多くの人が指摘しているように、今朝のAppleのイベントは、スペクタクルとしては少々期待外れだった。iPhone 4Sがまさにそうであるように、ハードウェアの漸進的な進化を16ヶ月も待つのは長すぎる。しかし、iOS 5とiCloudの機能に関する総括の中で、インタラクションの未来に関心を持つ人にとって非常に興奮するはずだった発表が一つあった。それは、iPhone 4S専用の音声アシスタント、Siriだ。

Appleが主要な技術(今回の場合はeコンシェルジュサービス)を発表するたびによくあることですが、批評家たちはAppleが遅れていると喜んで指摘します(Treoへの対応に5年以上もかかったなんて信じられますか?!)。具体的には、Androidで1年以上前から利用可能になっているGoogleの音声操作技術に追いつくための、Siriの追い上げだと彼らは言っています。音声操作をしばらく使ってきた経験から、これは半分真実だと断言できます。機能ごとに見ると、SiriはGoogleの音声操作に似ています。しかし、実際の使用感という点では、全く異なります。いつものように、Googleの実装はプロセス指向です。Appleの実装は、予想通り、人間的でフレンドリーです。そして、だからこそSiriは革命的な可能性を秘めているのです。

先に進む前に、両社がそれぞれの製品をどのように売り込んでいるかを少し見てみましょう。

グーグル

https://www.youtube.com/watch?v=gGbYVvU0Z5s

りんご

何か気づきましたか?表面的には、GoogleとSiriの最大の違いは、Googleが、話しかけている相手がテクノロジーの一部であることを強調していることです。あなたの指示には、従うべき統一された構造があります。例えば、「<アドレス帳に登録されているユーザー名>に<場所>で電話をかけて」と言えば、誰にでも電話をかけられます。相手があなたにとって誰であっても、それは安全なものです。一方、Siriは可能な限りパーソナルな対応をします。相手との関係性に応じて、「妻に電話して」など、より親しみやすい言葉遣いができます。まるで人間と話しているような感覚になり、会話がより自然で、より魔法のような体験になります。

あるいは、もっと分かりやすく機能的な例を挙げてみましょう。天気予報です。Google Voice Actionsでは、Google検索を音声入力するように話しかけます。「10月7日のサンフランシスコの天気」と。すると、ウェブページに表示されるGoogle検索結果が表示されます。それだけです。Siriでは、「サンフランシスコの天気はどう?ナパはどう?」と話しかけます。すると、アプリはかなり自然な形で応答し、話している情報を視覚的にも表示してくれます。

機能面では両者は全く同じです。しかし、体験面では雲泥の差です。Googleは音声をキーボードとマウスに変えようとしています。一方、Appleは携帯電話と人間との関係性に似た、全く異なる関係性を望んでいます。

これにはちゃんとした理由があります。Siriを使う可能性のある人なら誰でも、Apple Voice Controlをはじめとする(ひどい)音声認識ソフトウェアを使った経験があるはずです。iOS 3に搭載されていたApple Voice Controlは、基本的にGoogle Voice Actionsと同じような機能で、極めて不正確(特にインド人の名前の認識)で、電話をかけたり音楽を再生したりすることしかできませんでした。私たちの体験のほとんどは、これとよく似ていると言っても過言ではないでしょう。Appleは、Siriの応答を一般的な音声認識ではなく、親切な人間のアシスタントのようにすることを選択しました。これは、基盤となるテクノロジーに対する私たちのネガティブなイメージを避けるためでもあります。

良いアプローチですね。Flipboardや、Kinectの音声機能の少なくとも一部を担っていると思われるマイクロソフトの技術よりも前にマイク・マッキューが設立したスタートアップ、Tellmeは、間や文章を補完する人間のような音声インターフェースによって、カスタマーサービスでの問い合わせ対応を格段に改善しました。これほどの強力な技術が、今ではスマートフォン上でほぼリアルタイムに処理できるのです。

Siriに私がこれほど期待しているのは、まさにこの点です。Siriは、過去10年間私たち全員が経験してきた、質の低い消費者向け音声認識の改良版として設計されたものではありません。これまでは高性能なハードウェアを必要としていた技術とインテリジェンスを、私たちの手のひらに収めたのです。ついに、ナレッジナビゲーターが誕生したのです。