阿蘇ひぐらし通信

庭園鉄道「阿蘇ひぐらし鉄道」のこと、また懐かしい駅の写真も紹介します

キハ58を声で運転する

 「発車」と言えばディーゼルカー(キハ58・28の2両編成)が走り始める。「速く」と言えば速度を上げ、「ゆっくり」と言えば速度を下げる。「止まれ」と言えば停車する。なかなかいい具合だ。

 マイコン音声認識のプログラムを作った。それを使って、HOゲージの車両が声の指示で、運転できるようにした。

f:id:asohigurashi:20200629172503j:plain 

f:id:asohigurashi:20200629172533j:plain

 マイコンラズベリーパイ、グーグルのクラウドサービス(Speech-to-Text API)を利用して言葉を認識している。応答のための発話(Text-to-Speech)にはAques Talk Piというシステムを使っている。後者は、ネットではなく独立で働く。かなり離れたところからでもマイクが音を拾うので、列車を見ながら声で運転できる(小さな話し声も認識するが、指示語以外は無視するので問題はない)。まだ少しバグがあるようだが、まあ一応うまく動く。

 今のところアナログ方式の運転である。電圧をPWM(パルス幅変調)で変えスピードを調節する。モータードライバを使っているので声の指示で逆行もできる。

 列車が走ったり止まったりするだけでは、退屈なので、将来はそれ以外のこと、汽笛が鳴ったり灯がついたりができるといいけれど。それならDCCという話になるが、・・・。また機関車でなくても建物に電気がつくのもいいかも知れない。

 いつもは全てDCCで運転しているが、外周の線路は電気的に独立していて、ここだけDCを流すことができる。でも間違いが起こるといけないので、DCC用の機関車は線路から外しておいてある。

 2年前に作った「声で列車を走らせる」のときはネットを使わない独立(ローカル)で働く日本語認識のJuliusシステムでした。それと比較すると、当然ですが今回の方が格段によく認識します。

f:id:asohigurashi:20200629172616j:plain (ラズパイ 今不要なものもある)

f:id:asohigurashi:20200629172650j:plain(実行中のモニター)
声で運転する 2020年6月29日