音声区間検出技術

音声区間検出(Voice Acitivity Detection: VAD)とは、音声と雑音が含まれる信号から音声が存在する区間とそれ以外の区間を判別する技術です。

音声区間検出自体は単独で使用されることは少なく、他の音声信号処理技術と組み合わせて使われることが多いです。
通常音声区間検出は前処理として使用されるため、音声区間の検出精度が後に行われる音声信号処理技術の性能を大きく左右することになります。
研究室では、音声区間の検出精度を改善するために雑音環境に頑健な音声区間検出技術の開発を行っています。