{{blogname}}--语音编码基础知识

比特率:表示经过编码后的音频数据每秒钟需要多少个比特,单位常为kbps
响度,强度:声音的主观属性响度表示的是一个声音听来有多响的程度。响度主要随声音的强度而变化，但也受频率的影响。总的说，中频纯音听来比低频和高频纯音响一些。
采样和采样率：采样是把连续的时间信号，变成离散的数字信号。采样率是指每秒钟采集多少个样本。
Nyquist采样定律：采样率大于或等于连续信号最高频率分量的2倍时，采样信号可以用来完美重构原始连续信号。
时域上的遮蔽效应：在一个很短的时间内，若出现了2个声音，SPL（sound pressure level）较大的声音会掩蔽SPL较小的声音。时域掩蔽效应分前向掩蔽（pre-masking）和后向掩蔽(post-masking),其中post-masking的时间会比较长，约是pre-masking的10倍。
频域上的掩蔽效应：幅值较大的信号会掩蔽频率相近的幅值较小的信号
sound pressure level(声压级):给定声压与参考声压之比的以10为底的对数乘以20，以分贝计。
声压:声压就是大气压受到声波扰动后产生的变化，即为大气压强的余压，它相当于在大气压强上的叠加一个声波扰动引起的压强变化。由于声压的测量比较容易实现，通过声压的测量也可以间接求得质点速度等其它物理量，所以声学中常用这个物理量来描述声波。
- 声压（p）的平方=声强（I）×介质密度（ρ）×声速（C）
量化和量化器：量化是把离散时间上的连续信号，转化成离散时间上的离散信号。
- 常见的量化器有：
  - 均匀量化器:最简单，性能最差，仅适应于电话语音。
  - 对数量化器：比均匀量化器复杂，也容易实现，性能比均匀量化器好。
  - 非均匀量化器：根据信号的分布情况，来设计量化器。信号密集的地方进行细致的量化，稀疏的地方进行粗略量化。
- 量化过程追求的目标是：
  - 最小化量化误差
  - 尽量减低量化器的复杂度
语音编码器
- 波形编器
  - 波形编码器以构造出背景噪单在内的模拟波形为目标。作用于所有输入信号，因此会产生高质量的样值并且耗费较高的比特率
- 声码器
  - （vocoder）不会再生原始波形。这组编码器会提取一组参数，这组参数被送到接收端
- 混合编码器
  - 用来导出语音产生模形。声码器语音质量不够好。混合编码器，它融入了波形编码器和声器的长处
线性预测编码,linear predictive coding
- 线性预测编码（LPC）是主要用于音频信号处理与语音处理中根据线性预测模型的信息用压缩形式表示数字语音信号谱包络（en:spectral envelope）的工具。它是最有效的语音分析技术之一，也是低位速下编码方法高质量语音最有用的方法之一，它能够提供非常精确的语音参数预测。