クラウド型音声認識RTコンポーネントフレームワークの開発
クラウド型音声認識RTコンポーネントフレームワークの開発
Post date:
Mon, 2017-10-30 15:36
概要・特徴
- クラウド型音声認識エンジン搭載のSDKをOpenRTM上で動作させ,ユーザーと音声対話を行う
仕様
- 言語: C++
- OS: Linux (Ubuntu16.04)
- RTミドルウェア:OpenRTM-aist-1.1.2
ソースコードおよびマニュアル
- AVSdeviceSDKWrapperマニュアル
- ソースコード
- コンポーネント
ライセンス
注意
本コンポーネントはalexa様から提供されているライブラリを使用しています. ライセンスに関してはこちらの指示に従ってください.
問合先(メールアドレス):
140447047@ccalumni.meijo-u.ac.jp
Last modified:
Tue, 2017-12-12 21:19
Comments
このコンポーネントで何ができて、どう使うでしょうか?マニュアルを読んでもどのような音声対話ができるのかがわかりません。他の型のようにビデオの例やあるシナリオでの動作例などを示していただけないでしょうか。
マニュアルに書いてあるコマンドが途中で改行されているため読みづらいと思います。
あと、マニュアルからコマンドをコピーしようと思ったのですが、上手く文字列が選択できません。
宮本様 貴重なコメントありがとうございます. マニュアルの更新を行い,見やすく改善いたしましたので確認をお願いいたします.その他,お気づきの点ございましたらコメントいただければ幸いです.
マニュアルの更新ありがとうございます。結局このコンポーネントは、「AVSを起動する」という機能のみということでしょうか? AVS自体は、Alexaのインターフェースだと思いますが、このコンポーネントを使って他のRTCで構成されたシステムと連携させることはできないという理解でよいでしょうか? マニュアルを拝見すると、単にAVSのスイッチににしか見えないのですが。 もし、他のRTのシステムに対話の機能を付加したい場合には、ASK(Alexa Skills Kit)を使って別途システム開発が必要ということでしょうか?
原様 貴重なコメントありがとうございます. おっしゃるとおり,このRTCはAmazon Tapのようにスイッチを押して対話を開始することができることと同じように,外部からの要求(スイッチ)を受けて音声認識・発話をするRTCとして開発しました. AVSdeviceSDK自体は音声データのみのやり取りを行うためのSDKであり,これ単体では対話での制御(音声でその他のデバイス制御など)を行うことができません.よって,対話での制御をASK(Alexa Skills Kit)で開発を行う必要があります. ただ,ASK自体の開発はAmazonのクラウドサービスを用いて開発を行うため,独自のシステム開発は行うことができますが,今回のRTCでは,ASKの部分までを含めたパッケージ化という所まで手が届かなかったという所で,申し訳ございません. 今後こちらのものの改良を踏まえながら,トータルなフレームワークとして,原様のメンテナンスされているOpenHRIと相互運用できないか検討できればと思います