要把这张图看懂,咱们得先把那些啥“线性回归”“均方根误差”之类的词往后藏一藏,直接回到图上看着看。
这张图实际上是把声音的波形画得跟拍电影帧数似的,你不用管它是不是确实按秒拍的,只要看着它上下翻折,就能感觉到声音在跳动。 你看最上面那条线,那是基音,也就是那声大调音阶里的“根”音。想象一下人声要么乐器,基础就是那种温暖、有厚度的低音。在图里,它就是那条平稳横着走的线,别看有时候会有抖动,但整体趋势稳当。下面那条线才是它配上的和弦,也就是那个旋律声。 这就好比你在做戏,基音是那个稳当当的定场诗,和弦是跟着你跳的舞。你只管盯着看,哪一段线往右上方斜,哪一段往右下方斜,哪一段是上下来回跑。
这就对应着音乐里的和弦进行:比如从属七和弦转到小七和弦,要么五度叠置。 别被这些复杂的频率分析吓到了,咱们直接看曼德博函数图里的样子。
那个函数画得挺圆润,像水波一样。你顺着曲线走,就能发现第 k 个圈对应的就是第 k 个和弦。
这在音乐里是个“套式音乐”要么“循环音乐”,就像老式收音机里那种一插就响、停播又再亮起来的广告,你听不出来旋律变化,可是节奏感极强,循环往复。 你看那个波峰,就是在唱高音的时候,那就是那个共鸣点。声压级越大,波形肚子就得越鼓。
这意味着啥?意味着这个和弦听起来更珍贵、更亮。
反之,波峰瘪下去,要么振幅变小,那就是和弦没对上,要么大家情绪不对,声音就变得沉闷、干瘪。 这里有个细节特别有意思。
看那个波动,有时候是交替的,有时候是一起往里的。
这对应着音乐里的装饰音,要么叫“相邻和弦”。
比如在某个强和弦预备转下去之前,先玩个转位要么加个音,这时候波形就会跟着起个小骚动,像个小火星子。
这就是所谓的“前导音”。 再细点看,你会发现这个波形不是直线,是带个波浪的。
为啥?出于声音是有物理属性的,它受空气阻尼和管路的摩擦影响。
要是是那种挺扭曲的波形,那可能就不是人声要么乐器,而是那种失真挺大的电子合成,要么是有严重混响的录音。理想的波形,那个振幅变化是有规律的,是有节奏的,像时钟的滴答声一样。 想象一下,要是把那个基音切掉,只剩下一堆乱糟糟的杂音,那这图就废了。基音忒关键了,它是这个声音的骨架。
没有它,和弦就只是无意义的频率叠加。
故此,你要看这张图,实际上就是看这个骨架如何支撑起上面的衣服。 再看那个曲线走势,有时候是单调的爬升,有时候是锯齿状的乱跳。在音乐里,这对应着“线性化”和“非线性”的处理。
比如你在用钢琴,键的行程长度不一样,声音就不一样,这就害得波形会有点“起劲”。而管弦乐,特别是管风琴,那声音特别直,波形就特别平,像个起伏极小的波浪。
这种图里,底噪大约就占了十几到二十分贝,略微忒响一点,你就认定那是爆炸声。 看看那个高频局部,也就是右边轻微波动的那些地方。
这一般对应着金属撞击声、玻璃破碎声,要么是管乐里的口哨音。
这些声音挺清脆,但也挺好办在录音里被放大,显得“刺耳”。
不管啥时候,只要波形突然在这个区域跳得挺了得,那大约率是这个声音的音色被“提亮”了。 实际上做这种图,最直观的就是看它的频谱包络。别看你不用管那些数学符号,但你能够把频谱包络看作一个肚子大小。
要是这个肚子大,说明声音的能量高;要是肚子小,声音就弱。你能够把它跟工夫轴对应一下,工夫轴走得快,能量下降得也快;工夫轴走得慢,能量就持久。 还有那个波形的对称性。
你看,左边和右边是不是长得差不多?这代表声音是“实”的,没有回声,没有空气腔体的混响。
要是是回声,波形就会飘得歪歪扭扭。自然,要是录音是在挺大混响的房间里录的,整个波形都会像被水波打湿了一样,水平方向上会铺开。
这时候波形就不算“干净利落”了。 最终看那个振幅的衰减。别看人声要么乐器的能量不是一直衰减的,但整体的声压级是慢慢变小的。
这对应着音乐里的“渐弱”要么“渐强”处理。
有时候你听认定声音突然变小了,那就是这种图上的能量突然瘪下去了。
有时候反而认定声音突然转大了,那就是能量突然鼓起来。 实际上做这种图,最大的乐趣就在于这种“听图”的感觉。
不用管它是不是工程师画的,也不用管它是不是物理学的实验数据,只要看着那条线,你脑海里就该浮现出那个旋律。
你看那线条如何弯,耳朵就跟着弯;线条如何尖,耳朵就跟着尖。
这就是声学图像最神奇的地方,它把声音的微观波动,变成了宏观的视觉艺术。 别纠结那些公式了,把注意力全放在图上的线条和起伏上。每一道线条转折的地方,都是音乐情绪的一个瞬间。
有时候线条拐个角,就是音乐里的一句停顿;有时候线条爆开一个包,就是音乐里的高潮。就如此看着,看着,直到你也能在自己的脑海里,画出那条归于你的旋律线来。
毕竟,只要你能听到,那么这张图,你就是最懂它的听众。