t*******r 发帖数: 22634 | 1 基本上首先是先在 Preference => Spectrogram 里面
改一下参数,建议用如下参数(音域根据具体情况可以
改改):
window size "8192", windows type "hanning",
min freq "110", max freq "440",
gain "3dB", range "60dB"
然后在 Track 左边下拉菜单选 "Spectrogram log(f)"
然后选中一段要分析的音,选 Analyze => Plot Spectrum。
然后选 Algorithm "Spectrum", Function "Hanning window",
Size 至少 4096, 大一些比较精确,Axis "Log frequency"
音准看 peak,音质看分布。
根据下面的公式和表格把频率转换为多少音分的偏差。
http://en.wikipedia.org/wiki/Scientific_pitch_notation#Table_of
http://en.wikipedia.org/wiki/Cent_(music)#Use
{ n = 1200 * log2(b/a) }
免费的 Audacity 从下面这个 link 下载,如果只是做分析,
不需要效果附件。
http://audacity.sourceforge.net/
另外想了解 Hann Windows 的,见下面这个 link:
http://en.wikipedia.org/wiki/Window_function#Hann_window
俺自己分析时做了一张样图,见附件。点击看大图。
所以要音准音质唱得好,关键是 FFT 算得好。唱歌唱的准的,
是不是都买了 TI 的硬件 FFT?哈哈哈哈。 |
l*****e 发帖数: 6331 | |
l*****e 发帖数: 6331 | |
t*******r 发帖数: 22634 | 4 理论上依照分析结果为根据,来修音准,加音质效果。
但是Audacity 自带的后期不强大。。。后期强大的软件
一般都自带分析器。Audacity 主要是免费,占资源少。
这个更多的是帮助唱歌了,看看自己唱偏了多少,泛音列/
声带支持/共鸣情况如何,颤音/pitch bend 的情况如何。
【在 l*****e 的大作中提到】 : 这个对做后期有什么帮助麽?
|
l*****e 发帖数: 6331 | 5 大师再多挖掘挖掘audacity有啥好玩的。版上估计就你我两个用了,不仅录音,而且后
期。 |
t*******r 发帖数: 22634 | 6 现在我知道为啥上次躺着中高屋一枪了,主要是泛音
能量比基频高,所以听起来亮一些。其实我基本唱男
中音音域的歌现在。
俺觉得音质唱得比较好的频谱应该是附件里这个样子
的,高频泛音列丰富并且包络线光滑合理。这样音质
rich, open and bright。俺大部分音还不能搞出那个
样子出来。。。 |
z******n 发帖数: 8851 | 7 怎样加强音准啊,俺做梦都想这个问题,哈哈。。。学习了。 |
t*******r 发帖数: 22634 | 8 这个分析器保不准做得不比专业的差,不过就是界面不好用。
说明书跟没有啥不多,基本先要去修一门数字信号处理外加
一门图像处理才能玩得比较溜。
俺这个线程是不是可以认为写了 Audacity
Spectrum/Spectrogram/Frequency Analysis for Dummies。。。
另外界面也比较差,坑爹的地方有:
(1)鼠标每次移动就动 1 Hz,其实 1 Hz 不小了,搞不好
有 8 个 cent 了。
(2)自动检测峰值的频率也就精确到 1 Hz。
(3)鼠标移动时的峰值也就精确到 1 dB。
不过好歹 Audacity 提供界面把结果送到 .txt,估计是可以
让大家把结果往到 Matlab 里插值分析。。。不过这个更坑
爹,都已经上 Matlab 了,干脆直接把原始音频送进 Matlab,
看着 Audacity 上的时间轴在 Matlab 里算 FFT,算完把结果
做一阶求导,解出所有零点,选出其中所有二阶导数为负数的
解,放入结果矩阵。然后看着结果矩阵重唱,保证唱准唱好!!!
有木有!!!有木有!!!
这个 Audacity,显然是老板强迫员工们把理论知识给复习一遍,
这样做公司的 project 更加高屋建瓴、事半功倍。。。这个坑爹
的Audacity,美其名曰:音频软件。。。其实就是个数学软件!
有木有!!!有木有!!!俺昨天晚上复习了两大本砖头书,还
复习了 FFT Hann Window!!!有木有!!!有木有!!!
【在 l*****e 的大作中提到】 : 大师再多挖掘挖掘audacity有啥好玩的。版上估计就你我两个用了,不仅录音,而且后 : 期。
|
t*******r 发帖数: 22634 | 9 看俺上面的帖子,音要唱得准,关键是 FFT 算得又快又好。
还要有合适的 FFT 窗口函数,唱歪了也可能是 FFT 窗口
函数没选对。。。
另外软件只能后期看看,唱的时候不够快。一定要用高质量
的 FFT 硬件协处理器。。。俺正打算败 128 个德州仪器出
的名牌高速 FFT 硬件协处理器,搞个小巨型 FFT 协处理网
络,速度一定没有问题。。。现在主要的问题是散热采取风
冷方案还是水冷方案。前期分析结果是水冷方案效果比较好,
但是俺主要的担心如果哪天上石头山唱歌,搞不到弄个整74
师的下场也未可知。。。张三兄意见如何?
【在 z******n 的大作中提到】 : 怎样加强音准啊,俺做梦都想这个问题,哈哈。。。学习了。
|
n***s 发帖数: 1257 | 10 大师真牛!洋洋洒洒一大篇。
有些不明白:
处理音频信号为啥要看图象处理的书?
昨天晚上大师复习了哪两大本砖头书?
【在 t*******r 的大作中提到】 : 这个分析器保不准做得不比专业的差,不过就是界面不好用。 : 说明书跟没有啥不多,基本先要去修一门数字信号处理外加 : 一门图像处理才能玩得比较溜。 : 俺这个线程是不是可以认为写了 Audacity : Spectrum/Spectrogram/Frequency Analysis for Dummies。。。 : 另外界面也比较差,坑爹的地方有: : (1)鼠标每次移动就动 1 Hz,其实 1 Hz 不小了,搞不好 : 有 8 个 cent 了。 : (2)自动检测峰值的频率也就精确到 1 Hz。 : (3)鼠标移动时的峰值也就精确到 1 dB。
|
|
|
n***s 发帖数: 1257 | 11 木有帮助好像。貌似和后期修补加工不是一回事。
只是分析分析。
小波分析是不是派得上用场啊?
【在 l*****e 的大作中提到】 : 这个对做后期有什么帮助麽?
|
n***s 发帖数: 1257 | 12 OMG!
【在 t*******r 的大作中提到】 : 看俺上面的帖子,音要唱得准,关键是 FFT 算得又快又好。 : 还要有合适的 FFT 窗口函数,唱歪了也可能是 FFT 窗口 : 函数没选对。。。 : 另外软件只能后期看看,唱的时候不够快。一定要用高质量 : 的 FFT 硬件协处理器。。。俺正打算败 128 个德州仪器出 : 的名牌高速 FFT 硬件协处理器,搞个小巨型 FFT 协处理网 : 络,速度一定没有问题。。。现在主要的问题是散热采取风 : 冷方案还是水冷方案。前期分析结果是水冷方案效果比较好, : 但是俺主要的担心如果哪天上石头山唱歌,搞不到弄个整74 : 师的下场也未可知。。。张三兄意见如何?
|
t*******r 发帖数: 22634 | 13 上面的附图里面,上边是 spectrum,光音频处理就够了。
下边是 spectrogram,是把音频处理的结果形成图像。。。
看清楚了,是“spectrum”vs“spectrogram”。。。
http://en.wikipedia.org/wiki/Spectrum
http://en.wikipedia.org/wiki/Spectrogram
【在 n***s 的大作中提到】 : 大师真牛!洋洋洒洒一大篇。 : 有些不明白: : 处理音频信号为啥要看图象处理的书? : 昨天晚上大师复习了哪两大本砖头书?
|
n***s 发帖数: 1257 | 14 对spectrogram做什么图象处理呢?
话说昨夜大师挑灯夜读了哪两本宝典, 以至今日武功回涨了那么多? :-)
【在 t*******r 的大作中提到】 : 上面的附图里面,上边是 spectrum,光音频处理就够了。 : 下边是 spectrogram,是把音频处理的结果形成图像。。。 : 看清楚了,是“spectrum”vs“spectrogram”。。。 : http://en.wikipedia.org/wiki/Spectrum : http://en.wikipedia.org/wiki/Spectrogram
|
z******n 发帖数: 8851 | 15 这个仪器理论,俺是外行。我觉得,最后处理的结果人声会走样很多,不然早有人搞出
来了吧。不过话又说回来,弦兄喜好怎么玩都行,开心就好,哈哈。。。
不知理解对不对啦,研究人声FFT图,可以帮助后期做调试用,压缩,增益,调音准。
。。
【在 t*******r 的大作中提到】 : 看俺上面的帖子,音要唱得准,关键是 FFT 算得又快又好。 : 还要有合适的 FFT 窗口函数,唱歪了也可能是 FFT 窗口 : 函数没选对。。。 : 另外软件只能后期看看,唱的时候不够快。一定要用高质量 : 的 FFT 硬件协处理器。。。俺正打算败 128 个德州仪器出 : 的名牌高速 FFT 硬件协处理器,搞个小巨型 FFT 协处理网 : 络,速度一定没有问题。。。现在主要的问题是散热采取风 : 冷方案还是水冷方案。前期分析结果是水冷方案效果比较好, : 但是俺主要的担心如果哪天上石头山唱歌,搞不到弄个整74 : 师的下场也未可知。。。张三兄意见如何?
|
n***s 发帖数: 1257 | 16 知道大师是在玩笑。
不过歌唱得好的都是由于相关生理机制运作得好,用不着进行计算
那些处理器对于唱不好得可能会有用。
是不是都买了 TI 的硬件 FFT?哈哈哈哈。
【在 t*******r 的大作中提到】 : 上面的附图里面,上边是 spectrum,光音频处理就够了。 : 下边是 spectrogram,是把音频处理的结果形成图像。。。 : 看清楚了,是“spectrum”vs“spectrogram”。。。 : http://en.wikipedia.org/wiki/Spectrum : http://en.wikipedia.org/wiki/Spectrogram
|
t*******r 发帖数: 22634 | 17 漏了说俺上面的解决方案有光线与神经之间的接口,直接
把处理结果送回人脑。。。
按 FFT 图应该可以调音准,其实就是 pitch shift 一点
点我想。。。不过我还没试过。。。
其实我主要是看看自己是听音的问题更多,还是唱的问题
更多。另外我看看音质好的音,跟音质差的音的区别在哪
里。还有一个就是 pitch bend,pitch bend 看软件很直
观,打算将来用这个分析名家的 pitch bend 处理。。。
【在 z******n 的大作中提到】 : 这个仪器理论,俺是外行。我觉得,最后处理的结果人声会走样很多,不然早有人搞出 : 来了吧。不过话又说回来,弦兄喜好怎么玩都行,开心就好,哈哈。。。 : 不知理解对不对啦,研究人声FFT图,可以帮助后期做调试用,压缩,增益,调音准。 : 。。
|
t*******r 发帖数: 22634 | 18 没有,这个就是上两次放在版面上的录音,我就是随便选了
唱的比较准的音,我跟伴奏唱的长音还可以。。。其实唱错
的音不比唱偏的音少。。。好了,我的记忆力差,不要打击
我了。。。
【在 n***s 的大作中提到】 : 对spectrogram做什么图象处理呢? : 话说昨夜大师挑灯夜读了哪两本宝典, 以至今日武功回涨了那么多? :-)
|
t*******r 发帖数: 22634 | 19 btw:时间轴有偏差,因为我最后输出 mp3 的时候切掉的开头
的空白段(伴奏开头总是有空白段),我分析用的是录音的干
声。。。
【在 t*******r 的大作中提到】 : 没有,这个就是上两次放在版面上的录音,我就是随便选了 : 唱的比较准的音,我跟伴奏唱的长音还可以。。。其实唱错 : 的音不比唱偏的音少。。。好了,我的记忆力差,不要打击 : 我了。。。
|
t*******r 发帖数: 22634 | 20 wavelet。。。那个 master 的书都不够啊,得上 PHD 的。
但是俺不是那方面的 PHD 啊,只见大家互修 master 的课,
有互修 PHD 的课么?是不是有人实在英雄寂寞,打算搞个
3.0 的 GPA 出来玩玩?
俺没修过课的,咋整?这个任务留给您了。
是不是还有一个可能的方向是神经网络。。。
【在 n***s 的大作中提到】 : 木有帮助好像。貌似和后期修补加工不是一回事。 : 只是分析分析。 : 小波分析是不是派得上用场啊?
|
|
|
n***s 发帖数: 1257 | 21 大师打算用神经网络干啥?分类,回归,...?
wavelet,你哪两本有讲吗?
不管有没有,给书名呗,知道几本参考书,找个时间自学也成啊
【在 t*******r 的大作中提到】 : wavelet。。。那个 master 的书都不够啊,得上 PHD 的。 : 但是俺不是那方面的 PHD 啊,只见大家互修 master 的课, : 有互修 PHD 的课么?是不是有人实在英雄寂寞,打算搞个 : 3.0 的 GPA 出来玩玩? : 俺没修过课的,咋整?这个任务留给您了。 : 是不是还有一个可能的方向是神经网络。。。
|
t*******r 发帖数: 22634 | 22 另外提醒张三兄一个,音准也不需要太死板。俺作为唱不准歌
的纯理论工作者(就是不会修收音机的 PHD 好不好!!!)
从理论上说可能下面几种情况:
(1)平律 vs 纯律:比如,C 调歌曲,前面一个 C 的长音,后
面接一个 E 的长音,如果每次这种情况都是把 E 音比正常唱高
14 cent 左右的话,基本上是唱到纯律上去了。
可能艺术歌曲会比较靠纯律,爵士之类临时转调多点的可能比较
靠平律。A 音有时可能是特例。。。乐队校准音。。。
(2)切过伴奏:有听说过为了切过乐队,音准可以稍稍高一点。
但是高多少貌似没人讨论过。俺来大胆猜测一下,5 cent 以内
一般人听不出差别,估计是高了也白高。也许 5 cent 到
10 cent 之间刚刚好?纯猜测了。
(3)上冲颤音切过伴奏:这个比较坑爹了,据说上冲半个音都是
可以的。上冲半个音的话,峰值能量肯定跑到高一点的频率上
去了。。。我倾向于把上冲颤音理解成介于普通自然颤音和装饰
颤音(比如木管的手指颤音)之间(装饰颤音都是上颤半个音啥
的)。。。可能把这个理解为一种特别的 improvisation 更好理
解一点?
【在 z******n 的大作中提到】 : 这个仪器理论,俺是外行。我觉得,最后处理的结果人声会走样很多,不然早有人搞出 : 来了吧。不过话又说回来,弦兄喜好怎么玩都行,开心就好,哈哈。。。 : 不知理解对不对啦,研究人声FFT图,可以帮助后期做调试用,压缩,增益,调音准。 : 。。
|
t*******r 发帖数: 22634 | 23 如果 wavelet 小波变换能变出个大波诺娃的话,那一定
会有人自学。。。
【在 n***s 的大作中提到】 : 大师打算用神经网络干啥?分类,回归,...? : wavelet,你哪两本有讲吗? : 不管有没有,给书名呗,知道几本参考书,找个时间自学也成啊
|
n***s 发帖数: 1257 | 24 凭大师现有功力,想变啥娃就变啥娃,您老已经不用再自学什么了
【在 t*******r 的大作中提到】 : 如果 wavelet 小波变换能变出个大波诺娃的话,那一定 : 会有人自学。。。
|
t*******r 发帖数: 22634 | 25 哈哈,说实话俺最多变成个毛娃。。。
俺要搞 project 去了。。。否则搞不好老板喊俺回 cube
写 code 。。。 回头再聊。
【在 n***s 的大作中提到】 : 凭大师现有功力,想变啥娃就变啥娃,您老已经不用再自学什么了
|
z******n 发帖数: 8851 | 26 好吧,承认有些看不懂,要是能唱到 30 cent 以内就可以满意了,哈哈。。。
【在 t*******r 的大作中提到】 : 另外提醒张三兄一个,音准也不需要太死板。俺作为唱不准歌 : 的纯理论工作者(就是不会修收音机的 PHD 好不好!!!) : 从理论上说可能下面几种情况: : (1)平律 vs 纯律:比如,C 调歌曲,前面一个 C 的长音,后 : 面接一个 E 的长音,如果每次这种情况都是把 E 音比正常唱高 : 14 cent 左右的话,基本上是唱到纯律上去了。 : 可能艺术歌曲会比较靠纯律,爵士之类临时转调多点的可能比较 : 靠平律。A 音有时可能是特例。。。乐队校准音。。。 : (2)切过伴奏:有听说过为了切过乐队,音准可以稍稍高一点。 : 但是高多少貌似没人讨论过。俺来大胆猜测一下,5 cent 以内
|
t*******r 发帖数: 22634 | 27 上面是纯理论,俺现实的目标是曲子中能唱到 50 cent 以内
就满意啦。。。
【在 z******n 的大作中提到】 : 好吧,承认有些看不懂,要是能唱到 30 cent 以内就可以满意了,哈哈。。。
|
t*******r 发帖数: 22634 | 28 另外另一个现实的用途。。。好像可以用来扒谱。。。
俺在想是不是把味精歌那首原创给扒下来。。。 |
t*******r 发帖数: 22634 | 29 这个现成软件/函数可能是不行,不过如果张三兄直接把音频搞进
Matlab 自己写函数自己编程处理,再找几个物理模型的 paper
参考参考,还真不好说。不过这个可能要数学比较好,别人听到
一个音频文件,三兄说不定听出爱因斯坦的宇宙场方程也不好
说。。。oh,三兄,You are NEO!You are THE ONE!!!
【在 z******n 的大作中提到】 : 这个仪器理论,俺是外行。我觉得,最后处理的结果人声会走样很多,不然早有人搞出 : 来了吧。不过话又说回来,弦兄喜好怎么玩都行,开心就好,哈哈。。。 : 不知理解对不对啦,研究人声FFT图,可以帮助后期做调试用,压缩,增益,调音准。 : 。。
|
a*******u 发帖数: 6324 | 30 大师我回头给你整一个谱,呵呵,不用扒。
【在 t*******r 的大作中提到】 : 另外另一个现实的用途。。。好像可以用来扒谱。。。 : 俺在想是不是把味精歌那首原创给扒下来。。。
|
|
|
t*******r 发帖数: 22634 | 31 张三兄我昨晚还试了,在 Audacity 里面可以直接手工修。办法就是先看
Spectrum 差多少频率,比如 spectrum 里面量出来是 225Hz(A3),
标准 A3 应该是 220Hz,那应该下移 (220/225 - 1)就是 -2.22%。
然后选中那个音,选 Effect => Change Pitch。不要管对话框里面测出来
的频率,那个可能不如你自己看 Spectrum 的准。在 percentage 里面输入
-2.22,就可以了。对话框会自动显示 -0.39 semitone,就是 -39 cent。
【在 z******n 的大作中提到】 : 这个仪器理论,俺是外行。我觉得,最后处理的结果人声会走样很多,不然早有人搞出 : 来了吧。不过话又说回来,弦兄喜好怎么玩都行,开心就好,哈哈。。。 : 不知理解对不对啦,研究人声FFT图,可以帮助后期做调试用,压缩,增益,调音准。 : 。。
|
a*******u 发帖数: 6324 | 32 这个啊?
你就单纯这么修啊,声音可能就变了。
现在的技术是叫做elastic pitch这种。
就是说,你移动了频率,还听得像是你唱的,
而不是那种不自然的声音。
我最多修的超过5个半音吧?听起来还是真的。
【在 t*******r 的大作中提到】 : 张三兄我昨晚还试了,在 Audacity 里面可以直接手工修。办法就是先看 : Spectrum 差多少频率,比如 spectrum 里面量出来是 225Hz(A3), : 标准 A3 应该是 220Hz,那应该下移 (220/225 - 1)就是 -2.22%。 : 然后选中那个音,选 Effect => Change Pitch。不要管对话框里面测出来 : 的频率,那个可能不如你自己看 Spectrum 的准。在 percentage 里面输入 : -2.22,就可以了。对话框会自动显示 -0.39 semitone,就是 -39 cent。
|
t*******r 发帖数: 22634 | 33 如果就差半个音,会听得出差别么?
多了肯定不自然。。。
【在 a*******u 的大作中提到】 : 这个啊? : 你就单纯这么修啊,声音可能就变了。 : 现在的技术是叫做elastic pitch这种。 : 就是说,你移动了频率,还听得像是你唱的, : 而不是那种不自然的声音。 : 我最多修的超过5个半音吧?听起来还是真的。
|