NECは28日、「ガラスが割れた」、「悲鳴が上がった」などの事象を、音だけで認識できる「音状況認識技術」を開発したと発表した。公共施設や観光地における犯罪・事故の検知や、高齢者宅の生活音による緩やかな見守りなどに活用できるという。
NECの最先端AI技術群「NEC the WISE」の1つとして開発されたもの。
音は、障害物や人垣の向こう側など目に見えない状況を認識できる特性が
あるため、従来より認識対象の音(目的音)に注力した音認識技術の開発が
進められていたが、広い範囲を対象にすると、認識対象以外の音(環境雑音)の影響で、
目的音の検知感度、認識精度の低下が課題となっていた。
新たに開発された「音状況認識技術」は、マイクで収集した音を目的音と
環境雑音に分け、目的音から細かい構成音を抽出する構成音抽出技術と、
構成音の組み合わせパターンから事象の有無を判別する事象判別技術を
組み合わせている。
これにより、「判別したいくつかの事象から起きている状況までの認識が可能」という。
例えば、「ガラスが割れた」という事象の場合、「ガシャン」、「バリン」、「パリン」
など、環境によって音が変化する。
構成音抽出技術は、マイクで収集した音に対して、あらかじめ学習していた
音の成分については「ガ」や「シャ」、「バ」や「パ」など、環境の違いに
影響しない細かな構成音に分けて認識。
学習させていない未知の音の成分は環境雑音に分けることで、
環境雑音の影響を受けることなく、高精度な構成音の抽出を可能にしたという。
事象判別技術は、環境の違いに影響しない構成音「ガ」や「シャ」、「バ」や「パ」などの
組み合わせを事象パターンとしてあらかじめ学習。
前述の構成音抽出技術で得られた構成音と照合することで、事象の有無を判別する。
こうした技術により、環境雑音が多く存在する広い範囲でも利用でき、
目的音を設置環境ごとに学習させる必要もなく、導入しやすいシステムになるという。
検証の結果、NECでは従来比5倍の遠距離でも十分な検知ができることを確認。
音響検知の国際的なコンテスト「DCASE2016」で、雑音中の日常音検知部門で
第1位も獲得している。