【技术】用免费 Audacity 做录音音准音质分析 - Music版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Music版 - 【技术】用免费 Audacity 做录音音准音质分析

相关主题
● 【灌水】其实音准也就是那么回事	● 【技术】从Celtic Woman说起，谈谈口腔～～～～
● 重提人气问题及乐版潜规则	● 【求教】话筒
● 【翻唱】zhangsan -- 撕夜（更新小波后期）	● 【翻唱】wiids -- 归来的星光 \| 真诚的美丽
● 【翻唱】zhangsan -- 流着泪说分手	● 【请教】请教老白一个提笑肌的问题
● 【翻唱+交作业】turkeylin -- 浪漫集美	● 【翻唱】crazysongs -- 秋来秋去（哭砂粤语版）
● [翻唱+FFT] 著名走音公鸭嗓 -- You Are My Destiny	● 【技术】从玄影的谱图说起，谈歌唱美好的分析
● [欣赏 + FFT] Paul Anka -- You Are My Density	● 【翻唱】wiids -- 人间第一情
● 请教关于midi伴奏	● 【技术】求助-男生如何唱假音（更新有demo，慎入）

相关话题的讨论汇总
话题: audacity话题: fft话题: spectrum话题: 音准

进入Music版参与讨论

(共1页)

t*******r
发帖数: 22634

基本上首先是先在 Preference => Spectrogram 里面
改一下参数，建议用如下参数（音域根据具体情况可以
改改）：
window size "8192", windows type "hanning",
min freq "110", max freq "440",
gain "3dB", range "60dB"
然后在 Track 左边下拉菜单选 "Spectrogram log(f)"
然后选中一段要分析的音，选 Analyze => Plot Spectrum。
然后选 Algorithm "Spectrum", Function "Hanning window",
Size 至少 4096, 大一些比较精确，Axis "Log frequency"
音准看 peak，音质看分布。
根据下面的公式和表格把频率转换为多少音分的偏差。
http://en.wikipedia.org/wiki/Scientific_pitch_notation#Table_of
http://en.wikipedia.org/wiki/Cent_(music)#Use
{ n = 1200 * log2(b/a) }
免费的 Audacity 从下面这个 link 下载，如果只是做分析，
不需要效果附件。
http://audacity.sourceforge.net/
另外想了解 Hann Windows 的，见下面这个 link：
http://en.wikipedia.org/wiki/Window_function#Hann_window
俺自己分析时做了一张样图，见附件。点击看大图。
所以要音准音质唱得好，关键是 FFT 算得好。唱歌唱的准的，
是不是都买了 TI 的硬件 FFT？哈哈哈哈。

l*****e
发帖数: 6331

sf，收藏。

l*****e
发帖数: 6331

这个对做后期有什么帮助麽？

t*******r
发帖数: 22634

理论上依照分析结果为根据，来修音准，加音质效果。
但是Audacity 自带的后期不强大。。。后期强大的软件
一般都自带分析器。Audacity 主要是免费，占资源少。
这个更多的是帮助唱歌了，看看自己唱偏了多少，泛音列/
声带支持/共鸣情况如何，颤音/pitch bend 的情况如何。

【在 l*****e 的大作中提到】

: 这个对做后期有什么帮助麽？

l*****e
发帖数: 6331

大师再多挖掘挖掘audacity有啥好玩的。版上估计就你我两个用了，不仅录音，而且后
期。

t*******r
发帖数: 22634

现在我知道为啥上次躺着中高屋一枪了，主要是泛音
能量比基频高，所以听起来亮一些。其实我基本唱男
中音音域的歌现在。
俺觉得音质唱得比较好的频谱应该是附件里这个样子
的，高频泛音列丰富并且包络线光滑合理。这样音质
rich, open and bright。俺大部分音还不能搞出那个
样子出来。。。

z******n
发帖数: 8851

怎样加强音准啊，俺做梦都想这个问题，哈哈。。。学习了。

t*******r
发帖数: 22634

这个分析器保不准做得不比专业的差，不过就是界面不好用。
说明书跟没有啥不多，基本先要去修一门数字信号处理外加
一门图像处理才能玩得比较溜。
俺这个线程是不是可以认为写了 Audacity
Spectrum/Spectrogram/Frequency Analysis for Dummies。。。
另外界面也比较差，坑爹的地方有：
（1）鼠标每次移动就动 1 Hz，其实 1 Hz 不小了，搞不好
有 8 个 cent 了。
（2）自动检测峰值的频率也就精确到 1 Hz。
（3）鼠标移动时的峰值也就精确到 1 dB。
不过好歹 Audacity 提供界面把结果送到 .txt，估计是可以
让大家把结果往到 Matlab 里插值分析。。。不过这个更坑
爹，都已经上 Matlab 了，干脆直接把原始音频送进 Matlab，
看着 Audacity 上的时间轴在 Matlab 里算 FFT，算完把结果
做一阶求导，解出所有零点，选出其中所有二阶导数为负数的
解，放入结果矩阵。然后看着结果矩阵重唱，保证唱准唱好！！！
有木有！！！有木有！！！
这个 Audacity，显然是老板强迫员工们把理论知识给复习一遍，
这样做公司的 project 更加高屋建瓴、事半功倍。。。这个坑爹
的Audacity，美其名曰：音频软件。。。其实就是个数学软件！
有木有！！！有木有！！！俺昨天晚上复习了两大本砖头书，还
复习了 FFT Hann Window！！！有木有！！！有木有！！！

【在 l*****e 的大作中提到】

: 大师再多挖掘挖掘audacity有啥好玩的。版上估计就你我两个用了，不仅录音，而且后
: 期。

t*******r
发帖数: 22634

看俺上面的帖子，音要唱得准，关键是 FFT 算得又快又好。
还要有合适的 FFT 窗口函数，唱歪了也可能是 FFT 窗口
函数没选对。。。
另外软件只能后期看看，唱的时候不够快。一定要用高质量
的 FFT 硬件协处理器。。。俺正打算败 128 个德州仪器出
的名牌高速 FFT 硬件协处理器，搞个小巨型 FFT 协处理网
络，速度一定没有问题。。。现在主要的问题是散热采取风
冷方案还是水冷方案。前期分析结果是水冷方案效果比较好，
但是俺主要的担心如果哪天上石头山唱歌，搞不到弄个整74
师的下场也未可知。。。张三兄意见如何？

【在 z******n 的大作中提到】

: 怎样加强音准啊，俺做梦都想这个问题，哈哈。。。学习了。

n***s
发帖数: 1257

大师真牛！洋洋洒洒一大篇。
有些不明白：
处理音频信号为啥要看图象处理的书？
昨天晚上大师复习了哪两大本砖头书？

【在 t*******r 的大作中提到】

: 这个分析器保不准做得不比专业的差，不过就是界面不好用。
: 说明书跟没有啥不多，基本先要去修一门数字信号处理外加
: 一门图像处理才能玩得比较溜。
: 俺这个线程是不是可以认为写了 Audacity
: Spectrum/Spectrogram/Frequency Analysis for Dummies。。。
: 另外界面也比较差，坑爹的地方有：
: （1）鼠标每次移动就动 1 Hz，其实 1 Hz 不小了，搞不好
: 有 8 个 cent 了。
: （2）自动检测峰值的频率也就精确到 1 Hz。
: （3）鼠标移动时的峰值也就精确到 1 dB。

相关主题
● [翻唱+FFT] 著名走音公鸭嗓 -- You Are My Destiny	● 【技术】从Celtic Woman说起，谈谈口腔～～～～
● [欣赏 + FFT] Paul Anka -- You Are My Density	● 【求教】话筒
● 请教关于midi伴奏	● 【翻唱】wiids -- 归来的星光 \| 真诚的美丽
进入Music版参与讨论

n***s
发帖数: 1257

木有帮助好像。貌似和后期修补加工不是一回事。
只是分析分析。
小波分析是不是派得上用场啊？

【在 l*****e 的大作中提到】

: 这个对做后期有什么帮助麽？

n***s
发帖数: 1257

OMG!

【在 t*******r 的大作中提到】

: 看俺上面的帖子，音要唱得准，关键是 FFT 算得又快又好。
: 还要有合适的 FFT 窗口函数，唱歪了也可能是 FFT 窗口
: 函数没选对。。。
: 另外软件只能后期看看，唱的时候不够快。一定要用高质量
: 的 FFT 硬件协处理器。。。俺正打算败 128 个德州仪器出
: 的名牌高速 FFT 硬件协处理器，搞个小巨型 FFT 协处理网
: 络，速度一定没有问题。。。现在主要的问题是散热采取风
: 冷方案还是水冷方案。前期分析结果是水冷方案效果比较好，
: 但是俺主要的担心如果哪天上石头山唱歌，搞不到弄个整74
: 师的下场也未可知。。。张三兄意见如何？

t*******r
发帖数: 22634

上面的附图里面，上边是 spectrum，光音频处理就够了。
下边是 spectrogram，是把音频处理的结果形成图像。。。
看清楚了，是“spectrum”vs“spectrogram”。。。
http://en.wikipedia.org/wiki/Spectrum
http://en.wikipedia.org/wiki/Spectrogram

【在 n***s 的大作中提到】

: 大师真牛！洋洋洒洒一大篇。
: 有些不明白：
: 处理音频信号为啥要看图象处理的书？
: 昨天晚上大师复习了哪两大本砖头书？

n***s
发帖数: 1257

对spectrogram做什么图象处理呢？
话说昨夜大师挑灯夜读了哪两本宝典, 以至今日武功回涨了那么多？ :-)

【在 t*******r 的大作中提到】

: 上面的附图里面，上边是 spectrum，光音频处理就够了。
: 下边是 spectrogram，是把音频处理的结果形成图像。。。
: 看清楚了，是“spectrum”vs“spectrogram”。。。
: http://en.wikipedia.org/wiki/Spectrum
: http://en.wikipedia.org/wiki/Spectrogram

z******n
发帖数: 8851

这个仪器理论，俺是外行。我觉得，最后处理的结果人声会走样很多，不然早有人搞出
来了吧。不过话又说回来，弦兄喜好怎么玩都行，开心就好，哈哈。。。
不知理解对不对啦，研究人声FFT图，可以帮助后期做调试用，压缩，增益，调音准。
。。

【在 t*******r 的大作中提到】

n***s
发帖数: 1257

知道大师是在玩笑。
不过歌唱得好的都是由于相关生理机制运作得好，用不着进行计算
那些处理器对于唱不好得可能会有用。

是不是都买了 TI 的硬件 FFT？哈哈哈哈。

【在 t*******r 的大作中提到】

t*******r
发帖数: 22634

漏了说俺上面的解决方案有光线与神经之间的接口，直接
把处理结果送回人脑。。。
按 FFT 图应该可以调音准，其实就是 pitch shift 一点
点我想。。。不过我还没试过。。。
其实我主要是看看自己是听音的问题更多，还是唱的问题
更多。另外我看看音质好的音，跟音质差的音的区别在哪
里。还有一个就是 pitch bend，pitch bend 看软件很直
观，打算将来用这个分析名家的 pitch bend 处理。。。

【在 z******n 的大作中提到】

: 这个仪器理论，俺是外行。我觉得，最后处理的结果人声会走样很多，不然早有人搞出
: 来了吧。不过话又说回来，弦兄喜好怎么玩都行，开心就好，哈哈。。。
: 不知理解对不对啦，研究人声FFT图，可以帮助后期做调试用，压缩，增益，调音准。
: 。。

t*******r
发帖数: 22634

没有，这个就是上两次放在版面上的录音，我就是随便选了
唱的比较准的音，我跟伴奏唱的长音还可以。。。其实唱错
的音不比唱偏的音少。。。好了，我的记忆力差，不要打击
我了。。。

【在 n***s 的大作中提到】

: 对spectrogram做什么图象处理呢？
: 话说昨夜大师挑灯夜读了哪两本宝典, 以至今日武功回涨了那么多？ :-)

t*******r
发帖数: 22634

btw：时间轴有偏差，因为我最后输出 mp3 的时候切掉的开头
的空白段（伴奏开头总是有空白段），我分析用的是录音的干
声。。。

【在 t*******r 的大作中提到】

: 没有，这个就是上两次放在版面上的录音，我就是随便选了
: 唱的比较准的音，我跟伴奏唱的长音还可以。。。其实唱错
: 的音不比唱偏的音少。。。好了，我的记忆力差，不要打击
: 我了。。。

t*******r
发帖数: 22634

wavelet。。。那个 master 的书都不够啊，得上 PHD 的。
但是俺不是那方面的 PHD 啊，只见大家互修 master 的课，
有互修 PHD 的课么？是不是有人实在英雄寂寞，打算搞个
3.0 的 GPA 出来玩玩？
俺没修过课的，咋整？这个任务留给您了。
是不是还有一个可能的方向是神经网络。。。

【在 n***s 的大作中提到】

: 木有帮助好像。貌似和后期修补加工不是一回事。
: 只是分析分析。
: 小波分析是不是派得上用场啊？

相关主题
● 【请教】请教老白一个提笑肌的问题	● 【翻唱】wiids -- 人间第一情
● 【翻唱】crazysongs -- 秋来秋去（哭砂粤语版）	● 【技术】求助-男生如何唱假音（更新有demo，慎入）
● 【技术】从玄影的谱图说起，谈歌唱美好的分析	● 【求教】(更新无压缩版)俺的声带支持貌似不够提笑肌
进入Music版参与讨论

n***s
发帖数: 1257

大师打算用神经网络干啥？分类，回归，...?
wavelet，你哪两本有讲吗？
不管有没有，给书名呗，知道几本参考书，找个时间自学也成啊

【在 t*******r 的大作中提到】

: wavelet。。。那个 master 的书都不够啊，得上 PHD 的。
: 但是俺不是那方面的 PHD 啊，只见大家互修 master 的课，
: 有互修 PHD 的课么？是不是有人实在英雄寂寞，打算搞个
: 3.0 的 GPA 出来玩玩？
: 俺没修过课的，咋整？这个任务留给您了。
: 是不是还有一个可能的方向是神经网络。。。

t*******r
发帖数: 22634

另外提醒张三兄一个，音准也不需要太死板。俺作为唱不准歌
的纯理论工作者（就是不会修收音机的 PHD 好不好！！！）
从理论上说可能下面几种情况：
（1）平律 vs 纯律：比如，C 调歌曲，前面一个 C 的长音，后
面接一个 E 的长音，如果每次这种情况都是把 E 音比正常唱高
14 cent 左右的话，基本上是唱到纯律上去了。
可能艺术歌曲会比较靠纯律，爵士之类临时转调多点的可能比较
靠平律。A 音有时可能是特例。。。乐队校准音。。。
（2）切过伴奏：有听说过为了切过乐队，音准可以稍稍高一点。
但是高多少貌似没人讨论过。俺来大胆猜测一下，5 cent 以内
一般人听不出差别，估计是高了也白高。也许 5 cent 到
10 cent 之间刚刚好？纯猜测了。
（3）上冲颤音切过伴奏：这个比较坑爹了，据说上冲半个音都是
可以的。上冲半个音的话，峰值能量肯定跑到高一点的频率上
去了。。。我倾向于把上冲颤音理解成介于普通自然颤音和装饰
颤音（比如木管的手指颤音）之间（装饰颤音都是上颤半个音啥
的）。。。可能把这个理解为一种特别的 improvisation 更好理
解一点？

【在 z******n 的大作中提到】

t*******r
发帖数: 22634

如果 wavelet 小波变换能变出个大波诺娃的话，那一定
会有人自学。。。

【在 n***s 的大作中提到】

: 大师打算用神经网络干啥？分类，回归，...?
: wavelet，你哪两本有讲吗？
: 不管有没有，给书名呗，知道几本参考书，找个时间自学也成啊

n***s
发帖数: 1257

凭大师现有功力，想变啥娃就变啥娃，您老已经不用再自学什么了

【在 t*******r 的大作中提到】

: 如果 wavelet 小波变换能变出个大波诺娃的话，那一定
: 会有人自学。。。

t*******r
发帖数: 22634

哈哈，说实话俺最多变成个毛娃。。。
俺要搞 project 去了。。。否则搞不好老板喊俺回 cube
写 code 。。。回头再聊。

【在 n***s 的大作中提到】

: 凭大师现有功力，想变啥娃就变啥娃，您老已经不用再自学什么了

z******n
发帖数: 8851

好吧，承认有些看不懂，要是能唱到 30 cent 以内就可以满意了，哈哈。。。

【在 t*******r 的大作中提到】

: 另外提醒张三兄一个，音准也不需要太死板。俺作为唱不准歌
: 的纯理论工作者（就是不会修收音机的 PHD 好不好！！！）
: 从理论上说可能下面几种情况：
: （1）平律 vs 纯律：比如，C 调歌曲，前面一个 C 的长音，后
: 面接一个 E 的长音，如果每次这种情况都是把 E 音比正常唱高
: 14 cent 左右的话，基本上是唱到纯律上去了。
: 可能艺术歌曲会比较靠纯律，爵士之类临时转调多点的可能比较
: 靠平律。A 音有时可能是特例。。。乐队校准音。。。
: （2）切过伴奏：有听说过为了切过乐队，音准可以稍稍高一点。
: 但是高多少貌似没人讨论过。俺来大胆猜测一下，5 cent 以内

t*******r
发帖数: 22634

上面是纯理论，俺现实的目标是曲子中能唱到 50 cent 以内
就满意啦。。。

【在 z******n 的大作中提到】

: 好吧，承认有些看不懂，要是能唱到 30 cent 以内就可以满意了，哈哈。。。

t*******r
发帖数: 22634

另外另一个现实的用途。。。好像可以用来扒谱。。。
俺在想是不是把味精歌那首原创给扒下来。。。

t*******r
发帖数: 22634

这个现成软件/函数可能是不行，不过如果张三兄直接把音频搞进
Matlab 自己写函数自己编程处理，再找几个物理模型的 paper
参考参考，还真不好说。不过这个可能要数学比较好，别人听到
一个音频文件，三兄说不定听出爱因斯坦的宇宙场方程也不好
说。。。oh，三兄，You are NEO！You are THE ONE！！！

【在 z******n 的大作中提到】

a*******u
发帖数: 6324

大师我回头给你整一个谱，呵呵，不用扒。

【在 t*******r 的大作中提到】

: 另外另一个现实的用途。。。好像可以用来扒谱。。。
: 俺在想是不是把味精歌那首原创给扒下来。。。

相关主题
● 【灌水】这个坑爹的 FFT spectrogram	● 重提人气问题及乐版潜规则
● 颤音有办法练么？	● 【翻唱】zhangsan -- 撕夜（更新小波后期）
● 【灌水】其实音准也就是那么回事	● 【翻唱】zhangsan -- 流着泪说分手
进入Music版参与讨论

t*******r
发帖数: 22634

张三兄我昨晚还试了，在 Audacity 里面可以直接手工修。办法就是先看
Spectrum 差多少频率，比如 spectrum 里面量出来是 225Hz（A3），
标准 A3 应该是 220Hz，那应该下移（220/225 - 1）就是 -2.22%。
然后选中那个音，选 Effect => Change Pitch。不要管对话框里面测出来
的频率，那个可能不如你自己看 Spectrum 的准。在 percentage 里面输入
-2.22，就可以了。对话框会自动显示 -0.39 semitone，就是 -39 cent。

【在 z******n 的大作中提到】

a*******u
发帖数: 6324

这个啊？
你就单纯这么修啊，声音可能就变了。
现在的技术是叫做elastic pitch这种。
就是说，你移动了频率，还听得像是你唱的，
而不是那种不自然的声音。
我最多修的超过5个半音吧？听起来还是真的。

【在 t*******r 的大作中提到】

: 张三兄我昨晚还试了，在 Audacity 里面可以直接手工修。办法就是先看
: Spectrum 差多少频率，比如 spectrum 里面量出来是 225Hz（A3），
: 标准 A3 应该是 220Hz，那应该下移（220/225 - 1）就是 -2.22%。
: 然后选中那个音，选 Effect => Change Pitch。不要管对话框里面测出来
: 的频率，那个可能不如你自己看 Spectrum 的准。在 percentage 里面输入
: -2.22，就可以了。对话框会自动显示 -0.39 semitone，就是 -39 cent。

t*******r
发帖数: 22634

如果就差半个音，会听得出差别么？
多了肯定不自然。。。

【在 a*******u 的大作中提到】

: 这个啊？
: 你就单纯这么修啊，声音可能就变了。
: 现在的技术是叫做elastic pitch这种。
: 就是说，你移动了频率，还听得像是你唱的，
: 而不是那种不自然的声音。
: 我最多修的超过5个半音吧？听起来还是真的。

(共1页)

进入Music版参与讨论

相关主题
● 【技术】求助-男生如何唱假音（更新有demo，慎入）	● 【翻唱+交作业】turkeylin -- 浪漫集美
● 【求教】(更新无压缩版)俺的声带支持貌似不够提笑肌	● [翻唱+FFT] 著名走音公鸭嗓 -- You Are My Destiny
● 【灌水】这个坑爹的 FFT spectrogram	● [欣赏 + FFT] Paul Anka -- You Are My Density
● 颤音有办法练么？	● 请教关于midi伴奏
● 【灌水】其实音准也就是那么回事	● 【技术】从Celtic Woman说起，谈谈口腔～～～～
● 重提人气问题及乐版潜规则	● 【求教】话筒
● 【翻唱】zhangsan -- 撕夜（更新小波后期）	● 【翻唱】wiids -- 归来的星光 \| 真诚的美丽
● 【翻唱】zhangsan -- 流着泪说分手	● 【请教】请教老白一个提笑肌的问题

相关话题的讨论汇总
话题: audacity话题: fft话题: spectrum话题: 音准

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天