人の声がする雑音環境下でも、高精度の音声認識を可能にする音声と口唇情報を用いた「ハイブリッド発話検知SDK(開発用キット)」の提供を開始

この記事は約4分で読めます。
株式会社フュートレック(本社:大阪市淀川区、代表取締役社長:西田明弘 以下、フュートレック)は、“音声”と“口の動き(口唇情報)”を利用し、人が話し始めてから話し終えるまでの音声区間を求める「ハイブリッド発話検知SDK(開発用キット)」を2022年7月より提供開始いたします。本発話検知技術は、グローリー株式会社(本社:兵庫県姫路市、代表取締役社長:三和元純、以下、グローリー)と共同開発したものです。
精度の高い音声認識のためには、認識すべき音声の範囲(音声区間)を正確に区切ることも重要な要素の一つです。現在の一般的な音声認識技術では、マイクからの音声情報のみを使って発話検知を行うため、周囲で別の人が会話していたり、テレビ等から人の話し声が聞こえたりといった、人の声が雑音になる環境では、認識すべきユーザー以外の声まで音声認識してしまい、正確な認識結果を得られない場合がありました。

この度提供する「ハイブリッド発話検知SDK」は、従来の“音声”による発話検知で得られる情報に“口の動きの情報(口唇情報)”を加えることで、話しているユーザーの発声を特定し、より正確な音声認識を実現する組込み用SDKです。このSDKと当社の音声認識システム「vGate ASR」を組み合わせることにより、人の声を含む雑音環境下での音声認識性能を大幅に改善することができます。なお、“口唇情報”を得るために必要な高度な画像処理技術は、グローリーが持つ顔認証の技術が活用されています。

 「ハイブリッド発話検知SDK」は、家族が話していたりテレビがついていたりするリビングでコミュニケーションロボットを操作するときやWeb会議システムを利用するときなど、周囲の声に影響を受けやすい用途において音声認識の利便性を向上させるために有効であると考えておりますので、まずはこれらの市場をターゲットに販売活動をすすめてまいります。

■ 音声と口唇情報を用いた発話検知技術をグローリーと共同開発
https://ssl4.eir-parts.net/doc/2468/ir_material/149202/00.pdf

* vGate は株式会社フュートレックの登録商標です。
* その他、記載されている社名および製品名は各社の商標または登録商標の場合があります。

○営業関連のお問い合わせ先
株式会社フュートレック TEL:03-6206-4850
ホームページからのお問い合わせ https://www.fuetrek.co.jp/contact/index_product.cgi

○取材およびこのプレスリリースに関するお問い合わせ先
株式会社フュートレック 大阪本社(広報担当) TEL: 06-4806-3112
ホームページからのお問い合わせ https://www.fuetrek.co.jp/contact/index.cgi

〇会社概要
会 社 名:株式会社フュートレック
代 表 者:代表取締役社長 西田 明弘
設 立 日:2000年4月17日
資 本 金:100,000,000円
業務内容:・音声認識技術を利用したサービスの企画・提案、及びそれを実現するためのシステム設計
     ・CRMソリューションの提供、及びそれに伴うシステム設計等
U   R   L:https://www.fuetrek.co.jp/

タイトルとURLをコピーしました