五千年(敝帚自珍)

主题:哪位搞音频或者语音的,请教一个基本概念 -- 黑猫夜行

共:💬46 🌺36
分页树展主题 · 全看首页 上页
/ 4
下页 末页
    • 家园 你问的问题我没看太懂,不过随便说说看看有帮助没。

      声音信号有两种分析方法,时域上的和 频域上的。

      人的声音是个模拟信号。 它在频域上的带宽是无限的。就是说你想用数字

      方法储存,---- 单论理论上说是存储空间是要求无限大的。

      其次上其实用不了那么大。因为人耳能听到的带宽是 50Hz -22000Hz,

      其他的频率分量是无用的。所以基本只要储存这些模拟信号即可。

      根据香农(不是咖啡的香浓)定理,保存这些模拟信号,可以通过数字

      抽样的数据保存,但必须比它的最大频率大两倍,即是要求数字抽样信号

      的频率是 44kHz。否则会有叠频的问题。造成差错。

      大于 44khz,就可以把这个模拟的声音信号在每一 1/44000 秒的声值

      大小抽取出来保存成数字信号,以便用于恢复模拟声音信号。这叫抽样。

      数字抽样是如何抽呢? 就是说,在某一瞬间抽样取得声音大小分级数

      也是问题,分级太多,储存量极大,分级太少,大小声音无法区分,

      16bit 是个权衡值,相当于是2 的16 次方,取了1024 个级别。

      声音可能是 1 级,2 级,7 级, 19 级,一直到 1024 为最大音量。

      线形 pcm 就是指这些分级是线形的,而非某些优化算法非线性。

      7级和8级的区别 和 1022 和 1023 的区别是一样大的。

      这样抽出来数字抽样信号带有了模拟信号的信息,是一连串的 7, 9 ,

      1022, 13, 989,。。。。。等等等等的数字。它记录的是一秒钟

      44K 次,记录的是声音每前进 1/44000 秒的声强大小。用它就可以完整

      记录声音的信息,而且因为 44000 >= 2*22000,不会出现差错。

      你把每个声音采样点都减少或者增加一个常量确实感觉怪怪的,这

      相当于是频域增加了无数的随机信号,频域的变化是-------

      我且要算上一会儿看看表示是什么呢。不过一般是不这么做的。

      你要想把信号减小或者增大,应该在时域--- 采样点都按比例的

      减小或者增大,才是音量等比例减小或增大,--- 而音调不变,否则

      频域比例一变,肯定是变调了。

分页树展主题 · 全看首页 上页
/ 4
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河