speech processing

Speech processing RTCs includeing speech and voice recognition, sound encoding, voice synthesis and so on.

投稿者: 
tbou30897

概要

オンライン会議の動画で内容の追跡が難しいという問題に対処するため、会議動画に自動でタイムスタンプを生成し、内容の効率的な参照を可能にするシステム,コンポーネント群を作成した。

システム概要

  • システムオーディオのキャプチャ
  • ウィンドウのキャプチャ
  • 文章要約(TF-IDF,Cos類似度分析をもちいた文書理解)
  • http通信を用いたdiscordbot,その他既存システムとの通信

    コンポーネント群

window_captcha(ウィンドウキャプチャコンポーネント)

投稿者: 
tnagai
移動ロボット知覚制御用RTC 群

概要

  • 移動ロボット知覚制御用RTC群 (電気通信大学知能機械工学科3年生の学生実験で実際に使用している)
    • RTMの導入も含めて全てがそろっている(1 つのHP を参照すればすべてが使える)
    • 雛形プログラムを修正するだけで知能ロボット(らしきもの)を実現できる(中央制御部の雛形)
    • C/C++の知識(プラスアルファ)で作ることができる
    • 必要に応じて複雑なこともできる
  • 実験のホームページ --> http://apple.ee.uec.ac.jp/ROBOTEXP/index.html
    • 既に約300名の学生がこのシステムを使って実験を行っている
投稿者: 
itoharu
音声認識モジュール

概要

  音声対話のための音声認識するモジュールです。
  認識エンジンには、Julius を使用しています。
  Windows の標準のマイク入力の音声を入力するモジュール
  (例えば、OpenHRIのportaudioinput等)と接続し、認識結果を
  TimedStringのデータポートから出力します。

ライセンス

  EPLライセンスを適用します。 

連絡先

  九州工業大学情報工学研究院生命情報工学研究系
    ohashi@bio.kyutech.ac.jp 
    TEL/FAX 0948-29-7821/7801  

Download

投稿者: 
itoharu
音声合成モジュール

概要

  テキストから音声合成を行い出力するモジュールです。
  音声合成のエンジンには、AquesTalk を使用しています。
  入力された発話用文字列を音声合成エンジンであるAquesTalkに
  渡して音声サウンドデータを合成し、OpenHRIのPortAudioOutput
  モジュール等を利用して出力しています。

ライセンス

  EPLライセンスを適用します。 

連絡先

  九州工業大学情報工学研究院生命情報工学研究系
    ohashi@bio.kyutech.ac.jp 
    TEL/FAX 0948-29-7821/7801  

Download

投稿者: 
k-iwane
音声認識による物体認識システムの開発

随時更新していきます.(Windowsに対応しました.)

概要

近年サービスロボットが発展してきており,サービスロボットが人間の日常環境で動作するためには人間とロボットのインタラクション方法は重要な課題である.この課題に対して,本システムでは,直接的なインタラクションとしての音声認識技術と,サービスロボットに必要な能力の1つの物体認識を組み合わせたシステムを構築した.本システムは,公開されているRTコンポーネントをベースに構築しており,音声認識コンポーネントの群のOpenHRI,さらにアピアランスベース物体認識コンポーネントや,共通カメラインタフェースに基づくカメラコンポーネントなどから構成されており,幅広いロボットシステムへの応用可能なシステムとなっている.

投稿者: 
itoharu
音声出力モジュール

概要

  音声出力コンポーネントは、入力された音素情報を含んだ音声波形データファイルより音声データを抽出し、
  出力します。

ライセンス

   修正BSDライセンスを適用しています。

連絡先

   株式会社イーガー 新規事業開発部
    kubota@mail.eager.co.jp
    〒530-0047 大阪府大阪市北区西天満4-14-3
             住友生命御堂筋ビル17F
    Tel: 06-6360-2050, Fax: 06-6360-2051

投稿者: 
openrtm

OpenHRIとは

OpenHRIは、音声認識・音声合成・対話制御など、ロボットのコミュニケーション機能の実現に必要な各要素を実現するコンポーネント群です。 フリーで利用できる各オープンソースソフトウェアを使い易いコンポーネントとしてまとめました。

http://openhri.net/

ライセンスについて

OpenHRIのライセンスは、Eclipse Public License (EPL)です。 http://www.eclipse.org/legal/epl-v10.html EPLは、コードの改変や再配布、営利利用を許可するオープンソースライセンスですが、場合によっては改変内容をライセンス元に開示する必要があります。 OpenHRIが内部で用いているJuliusやOpen JTalkなどのそれぞれのソフトウェアについては、各自のライセンスに従います。

ダウンロード

最新バージョン : 2.0.1-RELESE

統計

Webサイト統計
ユーザ数:2160
プロジェクト統計
RTコンポーネント307
RTミドルウエア35
ツール22
文書・仕様書2

Choreonoid

モーションエディタ/シミュレータ

OpenHRP3

動力学シミュレータ

OpenRTP

統合開発プラットフォーム

産総研RTC集

産総研が提供するRTC集

TORK

東京オープンソースロボティクス協会

DAQ-Middleware

ネットワーク分散環境でデータ収集用ソフトウェアを容易に構築するためのソフトウェア・フレームワーク