アメリカGoogleは2017年5月4日(現地時間)、小型ボードコンピュータ「Raspberry Pi」に、Googleが開発した音声認識機能を付加するキット「Voice Kit」を提供することを明らかにした。マイクやスピーカーなどの部品に加えて、ダンボールで作ったケースも付属する。Raspberry Pi本体は付属しない。GoogleはVoice Kitを「Raspberry Pi 3 Model B」向けに設計し、動作を確認しているという。また、OSなどのソフトウェアを書き込むmicroSDカードも、利用者が用意する必要がある。
Voice Kitは、Raspberry Pi公認の月刊誌「The MagPi Magazine」の5月4日号の付録として提供する。さらに、Barnes & Noble、WH Smith、Tesco、Sainsburys、Asdaといった小売店でも発売する。
図 Googleの「AIY Projects」が提供する「Voice Kit」
出所 Google
Voice Kitが提供する音声認識機能は、Google Cloud Platformが提供していいる「Google Assistant API」を利用したものだ。最近は性能が上がっているとはいえ、Raspberry Piだけのコンピュータリソースではまだ音声認識は難しいようだ。
組み立て方、使い方は簡単だ。組み立てに必要なものはVoice Kit、Raspberry Pi 3 Model B、microSDカード、HDMI接続のディスプレイ、USB接続のマウスとキーボードにサイズ00のフィリップス型プラスドライバーだ。それから、microSDカードにソフトウェアを書き込むために、microSDカードスロットを取付けたパソコンも用意しておいたほうが良い。さらに、Google Cloud Platformと通信するために、インターネットにつながった無線LAN環境も必要だ。
組み立て方法は、Google AIY ProjectsがWebページに写真付きで丁寧に手順を解説しているの。この手順に従えば、問題なく組み立てられるだろう。
組み上がったら、Googleが用意しているmicroSDカードのイメージをダウンロードし、カードに書き込む。パソコンでダウンロードして、無料で使えるイメージ書き込みツールを使えばよいだろう。イメージは、OSとしてRaspberry Pi向けLinuxである「Raspbian Linux」をインストールしてあある。さらにその上に、プログラミング言語「Python」の実行環境、Google Assistant APIを利用するためのSDK(ソフトウェア開発キット)、Pythonで記述したサンプルプログラムなどが入っている。
イメージをmicroSDカードに書きこんだら、組み立てた箱にHDMIでディスプレイを、USBでマウスとキーボードを接続し、イメージを書きこんだmicroSDカードをスロットに挿入する。ここまで完了したら電源を入れる。ディスプレイにLinuxのGUIが映るので、マウス操作で無線LAN接続設定を済ませ、Webブラウザを機動してGoogle Cloud Platformのコンソールを開く。後はGoogle Assistant APIを利用すると設定し、OAuth 2.0認証に必要なクライアントクレデンシャルの発行を受けるなどの設定を済ませる。
完成したら、microSDカードイメージに付属するメインプログラムを機動し、箱の上にあるボタンを押して話しかけてみる。Google Assistant APIの設定に失敗がなければ、音声で回答が返ってくるはずだ。
図 Raspberry Pi 3 Model BにVoice Kitを組みこんで、ソフトウェア設定を済ませた後で動かしているところ
出所 Raspberry Pi Foundation
GoogleはmicroSDカードイメージとして提供したソフトウェアのソースコードはすべて公開しており、利用者の好みに合わせて改造してほしいと願っている。そして、カードイメージではOSにRaspbian Linuxを使用したが、Googleが2016年12月に公開したIoT機器向けOS「Android Things」(参考記事)を使って音声認識機能を利用することも可能としており、AIY ProjectsのWebページでその方法を紹介してる。スマートフォン向けOSであるAndroidの派生OSであるAndroid Thingsを使えれば、Androidスマートフォンの開発者もプログラムを開発しやすくなるだろう。
Googleは、Raspberry PiとVoice Kitの組み合わせで、日常コンピュータ機器を使うときのちょっとした不便を解消できるとしている。例えば、家電製品が備えている小さい液晶ディスプレイや付随する複数のボタンはもはや1990年代のものとしている。そして、音声認識技術を簡単に利用できるようになれば、このディスプレイとボタン類を排除できるとしている。具体的には、話しかけるだけでコーヒーを入れてくれるコーヒーサーバーが実現する可能性も高そうだなどと予測している。
また、スマートフォンの専用アプリケーションで家電製品を操作するということがあるが、GoogleのAIY Projectsのメンバーはこのやり方を2000年台のやり方だと断じている。その上で、話しかけるだけで点灯する照明器具などが実現する可能性を指摘している。
また、現在開発が進んでいる多様なロボットのユーザーインタフェースとして音声でのコミュニケーションが現実的な選択肢になったともしている。ロボットにやってほしいことを話しかけるだけで、希望通りにロボットが動いてくれる。そんなロボットが実現可能としている。
GoogleのAIY Projectsのメンバーは、今回のVoice Kit提供はAIY Projectsとして始めての目立つ活動となったという。そして、今後このようにGoogle Cloud Platformが備える音声認識などの機能を簡単に利用できるようにするセットを企画していくとしている。
■リンク
Google