五千年(敝帚自珍)

主题:【原创】科学的欣赏流行乐 -- 比的原理

共:💬309 🌺1010 🌵31
分页树展主题 · 全看首页 上页
/ 21
下页 末页
    • 家园 技术贴,收藏。双响炮。

      消费两通宝推荐 关闭

      感谢:作者获得通宝一枚。恭喜:你意外获得 8 铢钱。1通宝=16铢

      作者,声望:3;铢钱:20。你,乐善:4;铢钱:-24。本帖花:3

    • 家园 第五章:音高

      这一章插入的有点奇怪,不过不讲这个的话,后面就会有很多人不明白我用的符号都是什么意思。

      音高

      音的高度。音的高低是由振动频率决定的,两者成正比关系:振动频率高则音”高”,反之则”低”。

      基频决定音高

      一个有各种泛音的声音,即使泛音比基频大得多,也依然以基频来定音高。这一点很重要。这就是为什么同唱一个音高,不同人的音色截然不同的根本原因:他们只是基频相同,泛音是截然不同的。

      音高的计量:国际谱

      钢琴上每七个白键一个循环,分别叫做CDEFGAB(为何不是从A开始,而是从C开始?这是个历史问题。。。),也就是我们熟知的”Do Re Mi Fa So La Si”,过了一个循环就下标加一,又叫升八度,即,C1, C2, C3, C4…

      八度有什么意义

      高八度的声音,频率高一倍,也就是说,C2比C1的频率高一倍,C3比C2的频率高一倍。按照我们之前了解的,第一泛音比基频高一倍的事实。如果一个人唱C2,另一个人唱C3,那第一个人的第一泛音就会和第二个人的基频完美叠和在一起。以此类推,两人的高阶泛音也都会产生重叠。

      这就是女声比男声高八度的由来:两声部差八度,则泛音可以很好的重合,这是一种很好的和声状态。

      钢琴中央C是C4,中央区的A键为440Hz(即标准音高。–---那为何标准音高又是用A来制定的呢?目测是制定者想纠正前面的错误)。

      点看全图

      外链图片需谨慎,可能会被源头改

      点看全图

      外链图片需谨慎,可能会被源头改

      上图的男高音女高音什么的,讲的是美声/民族的划分方法。一般指的是有效音域。

      想直观的体验一下音高,可以玩这个

      在线钢琴

      音高的计量:钢琴谱(女唱谱)

      点看全图

      外链图片需谨慎,可能会被源头改

      在唱谱中通常书写”Do Re Mi Fa So La Si”,升一个八度就在上面加一点。为了克服国际谱中数字标过大的问题(C5写成DO上5个点?坑爹啊),女唱谱中普通c即c1=国际谱C4,写作”Do”。如果升一个八度,则在字母上面标一个点,俗称“一点Do”,就是c2 = 国际谱C5。

      再升八度,就是女谱里的high c,又名两点Do,c3 = 国际谱C6。

      如果在普通c上降八度呢?那就在Do下面加一点。

      钢琴谱在中国学院派里是通用的。

      音高的计量:男唱谱

      男唱谱比女唱谱低八度(也有说男唱谱高八度记谱的,不重要,领会精神就好),所以男唱谱里c1 = 国际谱C3,c2 = 国际谱C4。

      点看全图

      外链图片需谨慎,可能会被源头改

      通常说的男声high c,就是c3 = 国际谱C5。

      女声天生比男声高一个八度?这个说法显然是不对的,这只是源于唱谱高一个八度而已,女声一般比男声高4度的样子吧。

      看到这各位也明白了,这也太混乱了,不说清楚根本不知道你用的男谱还是女谱。所以我一般都是直接用国际谱,消除歧义。

      音高的计量:简谱

      无论是莫名其妙的”Do Re Mi fa So La Si”,还是诡异的从C开始CDEFGAB,都是极为不科学和反人类的。所以唱谱中另有一套简谱“1234567”(终于弄出点人性化的东西啊)。同样的,升一个八度上面加一点,降一个八度下面加一点。

      简谱同样分男谱和女谱。

      半音

      列表中带有#或b的就是半音,#为升,b为降。源自钢琴上的黑色键。见下图:

      点看全图

      外链图片需谨慎,可能会被源头改

      注意,7个全音只有5个半音。e和f之间,b和c之间是没有半音的。

      那是不是钢琴做疵了某些半音弹不出来呢?

      当然不是!

      其实半音是一个很有误导性的词。因为音高多少是由频率决定的(严格的说是频率的对数—-好吧,还是不够严谨,领会精神就好),而半音和全音之间的频率差和两个全音(如果中间没有半音)之间是完全一样的。 也就是说d和#d之间的频率差距,和e和f之间的频率差距是一样的。

      所以更严谨的说法是,一个八度之间有12个半音。其中七个(CDEFGAB)叫自然音,另外五个叫变化音。自然音之间一般是隔着两个半音(相隔两个半音可以叫距离为一个全音)。也有部分自然音之间(EF,BC)只隔一个半音。

      升key

      群众们喜闻乐见的升key指的是升半音。所以升12key可以提高一个八度。

      三谱对比表及频率

      西西河不支持表格,想看清楚点的请前往

      http://bideyuanli.com/?p=97

      国际谱 男唱谱 女唱谱 频率

      C0 C1 C2 16.35

      C#0/Db0 #C1 #C2 17.32

      D0 D1 D2 18.35

      D#0/Eb0 #D1 #D2 19.45

      E0 E1 E2 20.6

      F0 F1 F2 21.83

      F#0/Gb0 #F1 #F2 23.12

      G0 G1 G2 24.5

      G#0/Ab0 #G1 #G2 25.96

      A0 A1 A2 27.5

      A#0/Bb0 #A1 #A2 29.14

      B0 B1 B2 30.87

      C1 C C1 32.7

      C#1/Db1 #C #C1 34.65

      D1 D D1 36.71

      D#1/Eb1 #D #D1 38.89

      E1 E E1 41.2

      F1 F F1 43.65

      F#1/Gb1 #F #F1 46.25

      G1 G G1 49

      G#1/Ab1 #G #G1 51.91

      A1 A A1 55

      A#1/Bb1 #A #A1 58.27

      B1 B B1 61.74

      C2 c C 65.41

      C#2/Db2 #c #C 69.3

      D2 d D 73.42

      D#2/Eb2 #d #D 77.78

      E2 e E 82.41

      F2 f #F 87.31

      F#2/Gb2 #f F 92.5

      G2 g G 98

      G#2/Ab2 #g #G 103.83

      A2 a A 110

      A#2/Bb2 #a #A 116.54

      B2 b B 123.47

      C3 c1 c 130.81

      C#3/Db3 #c1 #c 138.59

      D3 d1 d 146.83

      D#3/Eb3 #d1 #d 155.56

      E3 e1 e 164.81

      F3 f1 f 174.61

      F#3/Gb3 #f1 #f 185

      G3 g1 g 196

      G#3/Ab3 #g1 #g 207.65

      A3 a1 a 220

      A#3/Bb3 #a1 #a 233.08

      B3 b1 b 246.94

      C4 c2 c1 261.63

      C#4/Db4 #c2 #c1 277.18

      D4 d2 d1 293.66

      D#4/Eb4 #d2 #d1 311.13

      E4 e2 e1 329.63

      F4 f2 f1 349.23

      F#4/Gb4 #f2 #f1 369.99

      G4 g2 g1 392

      G#4/Ab4 #g2 #g1 415.3

      A4 a2 a1 440

      A#4/Bb4 #a2 #a1 466.16

      B4 b2 b1 493.88

      C5 c3 c2 523.25

      C#5/Db5 #c3 #c2 554.37

      D5 d3 d2 587.33

      D#5/Eb5 #d3 #d2 622.25

      E5 e3 e2 659.26

      F5 f3 f2 698.46

      F#5/Gb5 #f3 #f2 739.99

      G5 g3 g2 783.99

      G#5/Ab5 #g3 #g2 830.61

      A5 a3 a2 880

      A#5/Bb5 #a3 #a2 932.33

      B5 b3 b2 987.77

      C6 c4 c3 1046.5

      C#6/Db6 #c4 #c3 1108.73

      D6 d4 d3 1174.66

      D#6/Eb6 #d4 #d3 1244.51

      E6 e4 e3 1318.51

      F6 f4 f3 1396.91

      F#6/Gb6 #f4 #f3 1479.98

      G6 g4 g3 1567.98

      G#6/Ab6 #g4 #g3 1661.22

      A6 a4 a3 1760

      A#6/Bb6 #a4 #a3 1864.66

      B6 b4 b3 1975.53

      C7 c5 c4 2093

      C#7/Db7 #c5 #c4 2217.46

      D7 d5 d4 2349.32

      D#7/Eb7 #d5 #d4 2489.02

      E7 e5 e4 2637.02

      F7 f5 f4 2793.83

      F#7/Gb7 #f5 #f4 2959.96

      G7 g5 g4 3135.96

      G#7/Ab7 #g5 #g4 3322.44

      A7 a5 a4 3520

      A#7/Bb7 #a5 #a4 3729.31

      B7 b5 b4 3951.07

      C8 c6 c5 4186.01

      C#8/Db8 #c6 #c5 4434.92

      D8 d6 d5 4698.64

      D#8/Eb8 #d6 #d5 4978.03

      比的原理:第六章:胸腔共鸣

      关键词(Tags): #音高

      本帖一共被 1 帖 引用 (帖内工具实现)
      • 家园 为什么是八度呢

        可不可以理解成,是人脑的某种缺陷导致了频率差一倍的所有声音中,咱们只能有效辨认那七个,结果就成了do,re,mi,fa,so,la,xi

        记得光学里面的彩虹,赤橙黄绿蓝靛紫,标准波长的关系也是恰好全全半全全全半

    • 家园 楼主强人,能不能科学解释一下日常现象?

      比如破锣嗓子,公鸭嗓子,五音不全等等日常的声音现象?

      • 家园 楼主分析的都是乐音,而且是录制好的音乐作品

        实际上人能够发音,是人体一系列器官,如声带和口腔共同作用的结果,你说的这些声音种类都是器官的缺陷(也有可能是本人使用不当)造成的。比如说五音不全,应该就是发音者无法控制发音频率,可能是器官的问题,也可能是该人的反馈系统有问题,还有可能是心理问题(我的母亲就有类似经历,小时候的某个打击导致对唱歌有阴影)。

      • 家园 其实我只能算刚起步

        很多现象都没法解释。也可能解释的有错误,欢迎大家指正!

        但是说真的,我还没见过中文网站里哪个比我研究的更深入一点。也可能是我孤陋寡闻。。。

        再深入的研究,就需要喉镜了,咱没那高端货啊。所以,你的问题我只能根据我的常识来试着解答一下。

        你说的前两个,目测是声带永久性损伤,或者是声带有缺陷。声音表现呢,一种是带有很多杂音(非标准基频/第一泛音/第二泛音/。。)。一种就是泛音分布不符合我们的常识(人耳很强力的,可以听出很多我们自己都不知道的常识)。

        后面我会贴一个金池的视频,你可以看出一些问题。

        五音不全,一般说的是唱歌就跑调。从物理上讲,应该不存在“就是唱不到某个音”的可能。就是控制不好。

    • 家园 第四章:音色与频谱/声谱图

      泛音的种类和多少决定了音色

      为什么有的人声音听起来暗,有的人听起来亮?事实上即使是唱同一个音高,大家的音色也天差地别,差别就在泛音上了。

      一般来说

      1. 泛音越充分的声音越饱满。

      2. 低频泛音越充分的声音听起来越“厚实”,越“有力”。

      3. 高频泛音越充分的声音穿透力越强,声音听起来越“亮”,越“尖”。

      4. 高低频都有并且合理分布的声音,就是比较完美的声音。

      声乐理论里,一般把低频泛音叫低位置共鸣,高频泛音叫高位置共鸣。

      频谱图/声谱图

      频谱图/声谱图是观察泛音的最好办法。

      点看全图

      外链图片需谨慎,可能会被源头改

      频谱图/声谱图是描述一个声音是由多少波符合而成的,我自己做了个软件,如下图:

      点看全图

      外链图片需谨慎,可能会被源头改

      此图由两部分组成,上半部分为声谱图(Spectrogram),下半部分为频谱图(Spectrum)。

      先看上图:

      横坐标是时间,纵坐标是频率值,同一时间的纵线上存在着数个波,重合而成最终的波。颜色越亮则表示波的振幅越大。混乱的背景都是伴奏,我们只观察人声线。

      再看下图:

      下图反映了上图的某个时间点(上图中的黄线)的频率分布。横坐标为频率,纵坐标为振幅。这个图更有利于直观的观察泛音的成分和强弱。

      频谱/声谱图是如何制作的

      我们都知道原始的声音是波形图,不过原始的波形图并没有太大研究价值,而且事实上也看不出“波形”。因为震动频率太高,比如帕瓦罗蒂的high c吧,500多的震动频率,表示一秒钟要震动500多次,那肯定是看上去一大坨,类似这样:

      点看全图

      外链图片需谨慎,可能会被源头改

      放大几十倍之后,大约能看出波形,类似这样

      点看全图

      外链图片需谨慎,可能会被源头改

      无论哪种都不适合研究。

      所以音频解析的过程是:取连续采样点,一般是4096个点,考虑到音频文件的采样率一般是44.1k,所以就是取了1/10秒之内的数据。然后对这4096个点作做快速傅里叶变换,就得到了频谱图。频谱图的信息是4096个点,每一个点对应的是这个频率上的振幅。

      频谱图反应的是在这个时间点上的频率分布情况。

      严格的说应该是这1/10秒内的平均情况。

      来一张典型频谱图,看看跟我的图下部是不是一回事:

      点看全图

      外链图片需谨慎,可能会被源头改

      将当前时间点的频谱画到声谱图里就得到了瀑布图(第二章视频中的图)。画法是:振幅越大的点,用越亮的颜色。

      纵坐标是频率,从下到上大约是0到6000。

      所以一个人唱了个C5,那他的基频就大概是500,第一泛音是1000,第二泛音是1500,画到声谱图上的结果就是从下到上每隔500画一个点,根据振幅有颜色的区别。

      随着时间的推移,声谱图会不断向右延伸,这样我们就得到了一段时间内频率分布图。比如一个C5的线在声谱图上水平延续了5秒,那表示该歌手唱了C5五秒。

      声谱图上类似“波”的东西是颤音,也就是歌手演唱中不断改变音高,所以自然会不断改变纵坐标。

      来一张wiki的声谱图:

      点看全图

      外链图片需谨慎,可能会被源头改

      最后,频谱图/声谱图的wiki链接

      外链出处

      图上出现的水平线有什么意义?

      水平线表示一个歌手在某个音高上持续了一段时间。越亮的线表示振幅越大,听感上当然就音量大了。

      直线就是一个长直音。考察长直音主要看稳定度,整个线越直则这个长音越稳,如果大抖就是破音,如果小抖就是不稳。如果歪了,那就是音准没把握好。

      波浪线就是颤音。波浪越大则颤音越大。看颤音也是看稳定度,如果颤的不稳就是气息出现问题,控制不好。

      如何看共鸣?

      看泛音主要看三点:丰富与否;分布情况;泛音的音量。

      点看全图

      外链图片需谨慎,可能会被源头改

      一般来说,所谓的泛音强弱都是和自己的基频来比的。因为音频文件的音量是可以调的,单纯看泛音大小没多大意义,以基频为参照才比较有实际意义。(低频的共鸣情况取决于元音的类型,每一个元音都有其特定的共鸣特性。一般来说,基频被共鸣强化的情况比较少。)

      可以看到,此例中第一泛音巨大(看多了就知道,一般都是第一泛音最大),在3000左右的三个泛音也很强。

      另一种观察方法就是和伴奏比,人声线越明显则人声越强,越能穿透伴奏。

      再来看另一个例子

      后知后觉对比版

      [FLASH]http://player.youku.com/player.php/sid/XNjI1NTAxMzQ4/v.swf[/FLASH]

      http://v.youku.com/v_show/id_XNjI1NTAxMzQ4.html

      点看全图

      外链图片需谨慎,可能会被源头改

      张雨生后知后觉清唱“你不辞冰雪”,竟然有如此大的高频泛音!

      要知道,这可是清唱,中音区!唱高音的时候鼓足了气,有很大的共鸣很正常,但唱低缓的主歌,竟然也能爆出这么大的泛音!只能说宝哥太逆天!

      下面,请出阿妹躺枪:

      点看全图

      外链图片需谨慎,可能会被源头改

      (图中竖线为背景音,就是那个类似指响的声音)

      泛音少太多了。。。。

      听感上也是很显然的,阿妹的音色暗的多,而宝哥的非常的清亮。

      当然,必须要说明:宝哥占了cd版的优势。不过我们关注的是最终听感,声音经过怎么处理并不是我们关注的重点。这个例子很好的对比了泛音对音色的影响。

      如何看音准?

      我的软件特别加了标准音高线,以及标准的泛音线,所以可以很清楚的看清音准:

      点看全图

      外链图片需谨慎,可能会被源头改

      蓝色标准线比较暗,大家仔细看。。(太亮的话会干扰声音线)

      下面有请躺枪天后阿妹展示一下音准不好是什么样的:

      点看全图

      外链图片需谨慎,可能会被源头改

      很明显,比E5高,越到高频差得越远。(高频会放大差值)

      点看全图

      外链图片需谨慎,可能会被源头改

      提高1key看看,又低了。这次差得更远。

      所以可以判定,阿妹唱到了E5 . 5。

      再看几个例子

      点看全图

      外链图片需谨慎,可能会被源头改

      帕瓦罗蒂大师,堪称全频段制霸了。大家都知道帕瓦罗蒂的C5是无敌的。

      点看全图

      外链图片需谨慎,可能会被源头改

      磊叔传说中的五百年。也差不多全频段制霸了。

      多说两句:

      上面的例子看的很明显吧,人声基本都本着标准的

      基频/第一泛音(基频的二倍)/第二泛音(基频的三倍)/....

      来的。自然界物体振动发声,绝大多数都是这样的。

      如何自己看图?

      对不起,我的软件不能外传,因为一旦落入别有用心的人手里,后果堪忧,比如这个http://tieba.baidu.com/p/2795531384

      想自己看图最方便的是foobar:

      通过点击 View(视图) > Visualizations(可视化) > Spectrogram(声谱)

      可以调出声谱view,再播放音乐的时候,声谱就会即时出现了。

      类似的,Spectrum就是频谱图。

      或者Spectrogram这个软件也不错。

      对我有质疑的话,可以用如上的办法自己看图,看看跟我的图是不是一样。

      比的原理:第五章:音高

      比的原理:番外篇:听声音,辨歌手,29款《青藏高原》

      通宝推:年青是福,铁手,岑子,洛水清,明心灵竹,陈王奋起,rentg,

      本帖一共被 1 帖 引用 (帖内工具实现)
      • 家园 呵呵,既然是倍频,为什么时域瀑布图里,不同频率的波形里的

        波长根本就看不出有什么区别呢?

        • 家园 话说,你说的波形图

          比如帕瓦罗蒂的high c,500多hz,也就是一秒要震荡500次,无论如何你也看不到波形吧,真正的波形图,要放大几十倍才能看清波形。不放大看过去就是一坨的样子。

          比如这个就是典型的波形图

          点看全图

          外链图片需谨慎,可能会被源头改

          放大几十倍大约可以得到类似这样的图

          点看全图

          外链图片需谨慎,可能会被源头改

          这两种图都没有太大的价值,作了傅里叶变换之后才有意义。

        • 家园 假定你说的是声谱图

          就是第二章视频里的那种图。

          画法是这样的:在某一个时间点上,对连续时间采样(4096采样点,1/10秒),做快速傅里叶变换,就得到了频谱图。频谱图的信息大约是4096个点,每一个点对应的是这个频率上的振幅。

          将当前时间点的频谱画到声谱图里就得到了瀑布图。画法是:振幅越大的点,用越亮的颜色。

          纵坐标是频率,从下到上大概是0到6000。

          所以一个人唱了个C5,那他的基频就大概是500,第一泛音是1000,第二泛音是1500,画到声谱图上的结果就是从下到上每隔500画一个点,根据振幅有颜色的区别。

          声谱图上你看到的类似“波”的东西是颤音,也就是不断改变音高,自然会不断改变纵坐标。

分页树展主题 · 全看首页 上页
/ 21
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河