Pythonで学ぶ音源分離 - nakorakeの日記

本日読了

超ニッチ。音源分離とは、空間の中にある複数音源やノイズ・残響などを分離することを呼ぶ。深層学習は使わずに統計処理の範疇。

音源分離のモデル=空間モデル（複数のマイクの音の大小や部屋の形などから音源を分離する）+音源モデル（音声らしさの特徴を維持して音源を分離する）

音声録音再生のライブラリsounddevice。

stftによる短時間フーリエ変換。音量を20log10(|x|)でデシベル化する。結果を図示したのがスペクトログラム。
雑音除去方法。スペクトルサブトラクション、ウィナーフィルタ。