Pythonで学ぶ音源分離

本日読了 

Pythonで学ぶ音源分離 機械学習実践シリーズ

Pythonで学ぶ音源分離 機械学習実践シリーズ

  • 作者:戸上真人
  • 発売日: 2020/08/24
  • メディア: 単行本(ソフトカバー)
 

超ニッチ。音源分離とは、空間の中にある複数音源やノイズ・残響などを分離することを呼ぶ。深層学習は使わずに統計処理の範疇。

音源分離のモデル=空間モデル(複数のマイクの音の大小や部屋の形などから音源を分離する)+音源モデル(音声らしさの特徴を維持して音源を分離する)

音声録音再生のライブラリsounddevice。

stftによる短時間フーリエ変換。音量を20log10(|x|)でデシベル化する。結果を図示したのがスペクトログラム。
雑音除去方法。スペクトルサブトラクション、ウィナーフィルタ。