Pages

Thursday, October 20, 2022

高雑音下でも音声認識率95%、工事現場でもクリアな会話を実現する新システム - ITpro

 エレクトロニクス商社の菱洋エレクトロは2022年10月5日、機械が稼働する工場や工事現場のような雑音が多い環境下でも95%と高い音声認識率を実現するシステムを開発した。会話が困難な環境下でも、ネットワークを介さずに音声をクリアに認識し、円滑なコミュニケーションを実現するという。製品化は2023年以降を予定している。発売価格は未定。

 建設工事やインフラ整備などの作業現場では、作業員の業務報告や機器制御において利便性向上の観点から、音声認識システムを活用するケースが増えている。しかし、そうした現場では多くの機械が稼働しており90dB程度の雑音や騒音が発生している。このため、通常の会話ですら困難な状況だ。こうした高雑音環境では、一般的な家庭環境(環境ノイズ音圧50dB前後)での使用を想定する従来の音声認識システムは使えない(図1)。

図1 従来の音声認識システムと新システムの比較

図1 従来の音声認識システムと新システムの比較

工場や、工事現場などの高雑音環境では通常の音声認識システムは使えない。新システムは高雑音下でも95%の認識率を実現している(出所:菱洋エレクトロ)

 また、多くの音声認識システムはクラウドサービスを利用しているが、作業現場はネットワーク環境が整っていないことが多いためクラウドシステムを利用できない可能性もある。

 そこで菱洋エレクトロは、雑音を含んだ発話音声に対してノイズリダクションを実施するデバイスと、高雑音下でもネットワークを介さずに使用できる音声認識システムを開発した(図2)。

図2 新システムの構成図

図2 新システムの構成図

ユーザーが装着するヘッドセット、音声に含まれるノイズを抑圧するデバイス、音声を認識するデバイスから構成される。デバイスの重さは280g、1人1台携帯することを想定している(出所:菱洋エレクトロ)

 具体的には、ユーザーが装着するヘッドセット、音声に含まれるノイズを抑圧するデバイス、音声を認識するデバイスで構成される。音声認識デバイスには、小型コンピューターが内蔵されており、ネットワークのない環境でも音声認識ができる。また、ノイズを除去するシステムを含む音声認識エンジンを搭載している。加えて、ノイズを抑制するデバイスで発話の音声から余分な音を排除して音声をクリアにしている。

 同システムによって、従来の音声認識システムでは認識率が著しく下がる高雑音環境(発話音圧70dB、環境ノイズ音圧90dB)でも音声認識率95%を達成した。

Adblock test (Why?)


からの記事と詳細 ( 高雑音下でも音声認識率95%、工事現場でもクリアな会話を実現する新システム - ITpro )
https://ift.tt/uFX8Bx0

No comments:

Post a Comment