キハ58を声で運転する
「発車」と言えばディーゼルカー(キハ58・28の2両編成)が走り始める。「速く」と言えば速度を上げ、「ゆっくり」と言えば速度を下げる。「止まれ」と言えば停車する。なかなかいい具合だ。
マイコンで音声認識のプログラムを作った。それを使って、HOゲージの車両が声の指示で、運転できるようにした。
マイコンはラズベリーパイ、グーグルのクラウドサービス(Speech-to-Text API)を利用して言葉を認識している。応答のための発話(Text-to-Speech)にはAques Talk Piというシステムを使っている。後者は、ネットではなく独立で働く。かなり離れたところからでもマイクが音を拾うので、列車を見ながら声で運転できる(小さな話し声も認識するが、指示語以外は無視するので問題はない)。まだ少しバグがあるようだが、まあ一応うまく動く。
今のところアナログ方式の運転である。電圧をPWM(パルス幅変調)で変えスピードを調節する。モータードライバを使っているので声の指示で逆行もできる。
列車が走ったり止まったりするだけでは、退屈なので、将来はそれ以外のこと、汽笛が鳴ったり灯がついたりができるといいけれど。それならDCCという話になるが、・・・。また機関車でなくても建物に電気がつくのもいいかも知れない。
いつもは全てDCCで運転しているが、外周の線路は電気的に独立していて、ここだけDCを流すことができる。でも間違いが起こるといけないので、DCC用の機関車は線路から外しておいてある。
2年前に作った「声で列車を走らせる」のときはネットを使わない独立(ローカル)で働く日本語認識のJuliusシステムでした。それと比較すると、当然ですが今回の方が格段によく認識します。
(ラズパイ 今不要なものもある)
(実行中のモニター)
声で運転する 2020年6月29日