音声AIは検索の未来になりうるでしょうか?どのように機能し、何に使われ、図書館や高等教育分野にはどのような応用が考えられるのでしょうか。音声AIの専門家であるスワミ・セカール氏(Swami Sekar)が、ここでその見解をお伝えします。
高校生から社会人、家庭の主婦まで、自分の手元に情報があることは、深い誇りと満足感を与えてくれます。デジタル化のおかげで、ミレニアル世代はスワイプ、タップ、タッチなど、文字通り、指先で情報を集めることができるようになりました。そして、情報検索に新たな局面をもたらしたのが、音声技術です。タイピングもスワイプもタップも必要なく、話すだけであらゆる情報を得ることができるのです。
"あなた方の声は私への命令です" - これは、Siri、Cortana、Alexa、Google Homeなどのトップ音声アシスタントが、私たちの検索や情報へのアクセス方法を再定義しているやり方です。ほとんどの情報資源がデジタル化され、検索やアクセスの経路は刻々と高度化しています。
図書館のような従来の情報資源は、情報へのアクセス以上のものを提供する空間/サービスへと進化しています。ミレニアル世代のユーザー行動のダイナミックな傾向から、図書館は情報の検索と発見における最新のデジタルトレンドを取り入れることが求められています。
簡単に言えば、音声AIとは、ユーザーがアプリケーションやプログラムに「話しかける」ことで、情報を得たり、タスクを実行するための指示を出したりできるようにするものです。Voice AI技術の核となるのは、音声認識と自然言語処理です。
音声検索は、スマートフォンやスマートデバイス、パソコンなどで、自然な言葉で質問をすることで、口頭で検索を行うことができます。検索エンジンやデジタルアシスタントが質問に回答します。
(画像説明: 音声AIの仕組み)
音声技術の人工知能部分は、音声アシスタントに質問やコマンド(命令)を処理させる引き金となり、コマンドのキーワードに一致する情報をウェブ上で選別します。音声AI技術は、新しい言語や音声パターンを理解し、処理することで、音声検索時により正確な結果を取得するために、常時、急速に進化しています。
音声アシスタントの普及が進む。出典: Business Insider
音声アシスタントの機能も急速に進歩しており、スマートフォンやタブレットに搭載されたり、単体のビーコン(Amazon Echoなど)として使用されたりと、こうしたパーソナルAIアシスタントの登場は今後も続くと予想されます。週間天気予報、ピザの注文、リビングの照明の点灯など、音声AI技術の応用は無限大に広がっているようです。音声検索の普及率は年々飛躍的に伸びており、幅広い年齢層の方に利用されています。Android携帯の音声検索アプリでは、近くのレストランやサロン、ATMの情報、さまざまなトピックに関する事実や統計に素早くアクセスできます。
音声AI技術が、安全運転のキーポイントになりつつあります。ドライバーは、道路から目を離すことなく、音声コマンドでルートや天気、近くのレストランなどの情報を得ることができます。
音声検索は、人々が情報を検索し、アクセスする方法に革命をもたらしています。その人気は、主に使いやすさと反応の速さによって、何倍にも膨れ上がっています。2020年には、オンライン検索の50%がVoice AIを搭載したものになると予測されています。
音声AIの人気が高まっている理由としては、以下のようなものが挙げられます:
"まだ存在しないからといって、何かを作るだけではダメなのです。本当の意味での人間の洞察に答えなければならないのです。そして、人が特定のニーズを満たすために、なぜ、どのように音声技術に頼るのかを考えなければなりません。"- と360iニューヨーク社長のアビー・クラッセン氏(Abbey Klaassen)は言います。複数の企業が、業界を超えて音声検索技術でイノベーションを起こしています。Global Market Insightsによると、スマートスピーカー市場は2024年までに300億米ドルを超えると予想されています。
アップル、アマゾン、グーグル、マイクロソフトといった大手テック企業は、ヘルスケアからマーケティング、金融に至るまで、複数の業界にわたって音声ベースの会話型AIを発表しています。アメリカン・エキスプレスは、アマゾンのEchoを顧客サービスシステムに統合し、お客様が残高の確認や取引、最新のキャンペーンを発見できるようにしました。
また、ガランティ銀行では、音声による銀行サービスの提供を開始しました。
AI をリードするWinimy AI社は、多様な業界の企業向けに顧客中心型の AI ソリューションを開発してきました。Domino'sとの提携により、WinimyはAlexaを通じてピザを注文するためのダイナミックな音声スキルを作成しました。この音声AIイノベーションにより、Domino'sは自宅でくつろぎながら、何千人ものAlexaユーザーにアプローチすることができました。また、Winimyは、ホテルの推薦と予約を自動化する音声AIソリューションも開発しました。
ライアソン大学G.レイモンド・チャン・スクール・オブ・コンティニュエーションエジュケーション(G. Raymond Chang School of Continuing Education, Ryerson University)の著名な客員教授であるトニー・ベイツ博士(Dr. Tony Bates)の言葉では、 "高等教育レベルの講師は、非常に異なったやり方を要求されているのです。上級管理者は、高等教育レベルでのデジタル変革の必要性に気づき始めています。"とあります。
ガートナーが発行したマーケットインサイトレポート「Voice AI in higher education」は、仮想の個人秘書(Virtual Personal Assistant ‐ VPA)プロバイダーの市場機会を浮き彫りにしています。また、同レポートでは、高等教育機関がVoice AIを利用して学生を積極的に取り込んでいることにも触れています。多くの学術機関が、寮やキャンパスで学生用ツールとしてVoice AIデバイスの利用を開始しています。
Googleが最も求められている情報源となるにつれ、図書館のような従来の情報源は、ミレニアル世代のユーザーにとって適切で有益なサービスを維持するという課題に直面しています。ミレニアル世代は、正確で最新の情報を、瞬時に手に入れたいと考えています。
音声技術は、レファレンス図書館員が、専門的なレファレンスサービスを提供すること、または、主に読書資料、スタッフ、利用者を中心とした活動を支援することができます。このようなシステムは、図書館の生産性を劇的に向上させます。音声AIを使用することで、レファレンスや情報検索プロセスを大幅に向上させることが可能です。
ガートナー社は、2020年までにウェブ検索の30%が、画面なしで行われるようになると予測しています。音声AIは、もはや未来的な技術ではなく、日常生活に急速に浸透しつつある技術です。音声検索が提供する領域は、もはや、ナビゲーションや質問と回答だけにとどまらず、メール管理、ショッピング、カレンダー管理など、その範囲を広げています。Winimy AIは、音声AIが前進する道であると信じています。革新的な音声AIソリューションについてもっと知りたい方は、versa@winimy.com まで、問い合わせください。
スワミ・セカール氏は、数々の賞を受賞した会話型AIソリューションを提供するWinimy AIの創設者兼CEOです。根っからの技術者で、マサチューセッツ工科大学(MIT)で電気・コンピュータ工学の修士号とMBAを取得しています。3社のスタートアップで共同創業/勤務し、Intel CapitalとVMWare Enterprise SalesでVC投資家として活躍しました。セカール氏は、Winimy AIが誇る革新性のオーケストレーターです。