><https://twitter.com/orange_in_spacehttps://pawoo.net/@orange_in_space
つまり、ケプストラムってFFTする→例えば500Hzの強い成分がありました→その500Hzの成分は40Hzでうねうねしてました→ケプストラムの縦軸はこの場合500Hzの成分の分(?)は40Hz成分(40Hzの所の数値が大きくなる)って事なのかも・・・?><
難しい・・・><
ケプストラム分析 - 人工知能に関する断創録 http://aidiary.hatenablog.com/entry/20120211/1328964624
単純にスペクトログラムで見るとピッチの倍音成分というだけの音も濃く出るので最初混乱したけども
フォルマント、音程に関わらず同じような周波数に山ができるのおもしろい
縦をピーク周波数に対する対数(?)にしたら、音程が変わっても同じようなパターンになるようになったけど、これがつまりフォルマント・・・?><
縦軸がリニアだったりするのがあれだけど、フォルマントの解説でよく見る音素(?)事に切り出して並べたスペクトログラムとやってることは基本的に同じかも?><
ピーク周波数にあわせて描いたスペクトログラム>< 黄緑の線がピーク周波数><(これなんていうんだろう?><)
ていうかピーク周波数を真ん中にすれば面白いのでは!?><って思ってやってみたけど既にありそうだけどそれなんていうんだろう?><
スースコード・・・・・><;
(スースコードもスクリーンショットも貼らないと「何も作ってないんじゃないの?」って思われるかも><;的被害妄想><;)
窓関数は7項ブラックマンハリス窓でfftの要素数(?)は8192>< スクリーンショットでは声に関係ありそうな低周波数領域だけ><
開発中でモノクロで解像度低すぎるけどこんな感じ・・・><(昔なつかしのスキャットマンの最初イントロ(?)部分><;)
書き忘れたけど、リニアスケールでね><(対数スケールだとノイズ多すぎて何がなんだかわからない><;)https://mstdn.nere9.help/@orange_in_space/100451495605903128
スペクトログラム、ピーク周波数の値を最大値としてノーマライズすれば、フォルマントとか見やすいかも?><って思った><(ので実験中><)
スペクトログラム作ってこんがらがって「なんか表示おかしい><;」と思ったら、バグってて上下逆さまに描いてた・・・><;
大気圧、998.12hPaくらいまで下がった><
オレンジは、メンタル極度に極度にアレしてる時はテレビとかの人の声も苦痛になるし、なんというか、逆?><;(極度にじゃない時でも素人っぽい声は苦手・・・><)
派生した話になるけど、ネトゲのロビーとかでもたまに「誰かボイチャしよ」って言ってるメンヘラ(※1)な方々を見かけたりするけど、電話嫌いなオレンジ的にはわりと考えられない心境かも><(当たり前だけど><;)(※1 であるとネトゲのロビーのテキストチャット自ら発言してたりする、ロビーの主みたいな)
ていうか全然相談になってないレベルに酷くても繋がればおkって話ならAIすら不要で、短い固定音声でも流せばいい話><
思考の /dev/null