引用 琪露诺:
这个好玩,做了STFT以后对音乐的处理跟图像处理很像了。
回想起以前为了交作业抓学音乐的同学帮忙手动分析泛音的事了,因为坐标系的缘故,这里的……
DBSCAN是笔误,已改。
原先确实用过DBSCAN,但是感觉它的参数不大好调整,效果不好。后来改成SpectralClustering,副作用就是慢了好多。
给记混了2333
MATLAB、Octave和matplotlib里的specgram()的图都是这种纵坐标反过来的2333。。。不过MATLAB生成了图之后还可以把坐标轴编辑正过来。。//其实另外两个也行...只是没有一个“坐标轴反转”的勾勾,但是调换下上下限是一样的......
使用PCA也许能在处理比较复杂的成分时也能获得十分好的效果......具体应用方法有待研究......
如果用有监督的话,先生成标签,再按标签生成MIDI文件,再以此用软音源/MIDI播放器之类的东西(貌似有python库可以干这个?)来生成对应的音频样本应该是比较可行的办法。