万维百科

脉冲编码调制本文重定向自 ADPCM

脉冲编码调制(英语:Pulse-code modulation,缩写:PCM)是一种模拟信号的数字化方法。PCM将信号的强度依照同样的间距分成数段,然后用独特的数字记号(通常是二进制)来量化。PCM常被用于数字电信系统上,也是电脑红皮书中的标准形式。在数字视频中它也是标准,例如使用 ITU-R BT.601。但是PCM并不流行于诸如DVDDVR的消费性商品上,因为它需要相当大的比特率(DVD格式虽然支持PCM,不过很少使用);与之相较,压缩过的音频较符合效率。不过,许多蓝光光盘使用PCM作音频编码。非常频繁地,PCM编码以一种串行通信的形式,使数字传讯由一点至下一点变得更容易——不论在已给定的系统内,或物理位置。

调制

模拟信号转换至4-bit PCM的取样和量化

在图标中,一个正弦波(红色曲线)被取样和量化为PCM。正弦波在每段固定时间内被取一次样,即x轴的刻度。而每一个样本则依照某种运算法(在这个例子中是ceiling function),选定它们在y轴上的位置。这样便产生完全离散的输入信号的替代物,很容易编码成为数字资料,以作保存或操纵。以右图为例,很清楚看出样本为8、9、11、12、13、14、15、15、15、14…等,将它们以二进制编码,就得到一组一组的数字:1000、1001、1011、1100、1101、1110、1111、1111、1111、1110…等,这些数字资料之后就可以被特定用途的DSP或者一般的CPU所处理。有一些PCM资料流可以和较大的聚合资料流作多任务传输(multiplex),通常在物理层传输资料时都会这么做。这个技术称作 “时分多路复用(Time-Division Multiplexing,TDM)” (或 “时分复用”,“时分复用”),非常广泛地使用,例如现代的公共电话系统。

有许多方法可以内置一个处理调制的真实设备。在真实系统中,这种设备一般被放在单一个芯片中,并搭配一个振荡器,称作“模拟至数字转换器(analog-to-digital converter,ADC)”。这些设备透过振荡器触动输入信号的接受,并且输出数字化的信号至某种处理器。 差分脉冲编码调制(DPCM) 波形编码器的一个重要分支称为差分编码器。这一类编码器包括增量调制(DM)和差分脉冲编码调制(DPCM)。差分编码器的工作原理就是消除冗余和减熵。消除冗余是对输入样本与预测值之差进行量化,达到一定的幅值水平。因此,差分编码器的两个重要组成部分就是预测器和量化器。 DPCM的工作原理以时刻k-1的输出值为基础预测时刻 k的预测值。记为 ŝ (k|k-1),从时刻k的输入信号s(k)中减去预测值,得到预测误差信号e(k),量化预测误差,然后对量化的预测误差eq(k)进行编码,传送到接收端。eq(k)加上同样编码后的ŝ(k|k-1)就得到了输入样本重构值ŝ (k)。假定不存在信道误差,接收端可准确完成重构。在发送端和接收端,均能以时间k的重构值为基础预测时刻k+1的预测值,然后重复以上的过程。 DPCM系统的主要成分是量化器、二进制编码器/解码器和预测器。 嵌入式差分脉冲编码调制 在通信和计算机网络中,不论何时出现通信繁忙的情况,都允许网络减轻负载,这有时是一个优势。如果允许在传送数据时丢掉最不重要的位,而且信源也不用重新编码,这样就可以实现前面的设想,可是,并不是所有信源的数据表示都可以这样做而不引起重构信源的较大误差,实际上,大多数压缩数据都不能这样简单地丢弃一个位,在这些情况下(Goodman1980)用嵌入编码的压缩方法来处理。 多脉冲线性预测编码(MPLPC) 多脉冲线性预测编码具有 LPC(线性预测编码)和 ADPCM(自适应差分脉冲编码调制)的预测编码结构,它与这些系统的不同之处在于它是一个分析-综合编码器,并采用感知权重设定。 MPLPC试图通过改进激励模型提高LPC的性能,但是不希望像 ADPCM和其他一些波码器那样直接量化、传送预测误差。为达到这一点,MPLPC采用几个脉冲作为一个语音帧的合成滤波器激励。脉冲数量事先选好,但需要考虑复杂性和语音质量。一般看来,MPLPC需要防止提取脉冲间隔。对于16kbit/s以下的高质量语音,其激励搜索的复杂度是可以容忍的,需要一个间隔预测循环。

码激励线性预测编码

码激励线性预测编码(CELP)是在9.6kbit/s以下速率中广泛应用的语音编码。其目的是将多脉冲 LPC中使用的分析-综合方法扩展到低比特率范围。指导思想是用有限数量的存储串行替代多脉冲激励。这个串行为码本。 CELP中的码本编码方法基于下面两个事实。

(1) 用长时或短时预测清除语音信号的冗余之后,剩余信号串行相互独立可用,具有相同概率分布的随机变串行所精确模拟,这个串行称为更新串行或激励串行。

(2)为了编码,可以找出有限数量的串行近似在语音片段中出现的重要激励串行。这个激励串行称为码本。 由于这两个因素,先要找出给定块的语音编码最好的长时和短时预测器,用各种可能的激励作用于它们,然后找出码本中的串行,生成与输入语音最相似的合成语音信号。长时和短时预测器信息和从码本中选出的激励串行的二进制数全都送入接收端进行合成。 Atal和 Schroeder(1984)首次成功地证明了码激励方法的有效性。

通常,在考虑频谱的精细结构时,语音过程可由长时预测器建模。在考虑频谱范围和共振时可由短时预测器来给出基音。 在随机编码的研究中,级联预测器的激励是一个 Gaussian分布的白噪声串行。为了用这个结构对语音编码,每5~25ms就要用 LPC中的技术对长时和短时预测器编码。随机编码或 CELP的目标是提高LPC质量,提供一种对基音提取不敏感并且不依赖于清/浊音分类的方法,这和 LPC有所不同。

在随机码本中,只需要较少码字就可以产生良好的性能,Atal和 Schroeder的研究可以使1 024个码表示40个样本,尽管1 024看起来很大,如果我们用一个独立的二进制数表示这40个语音样本中的每一个时,我们将有2=10种可能的串行。由此看来,1 024相对要小多了。甚至有些系统的码本只有256个。 除了随机码本,研究者还研究了卷积码,向量量化,置换码和经验设计码本,这些在语音编码中都可以应用,有些码本对一些说话者的语音来说比其他码本要好,当然,码本中包含较多串行可以提高性能,也使复杂度和数据速率增加。 激励码本的脱机训练可以提高合成语音的质量,这似乎是一个规律。然而,最近的研究可以使码本中所有脉冲具有同样的幅值水平,合成语音质量不受影响,如果找到一种方法能高效地搜索激励脉冲位置,那么编码综合分析搜索就可以大大简化。 标准编辑

E1是PCM其中一个标准(表现形式)。由PCM脉码调制编码中E1的时隙特征可知,E1共分32个时隙TS0-TS31。每个时隙为64K,其中TS0为被帧同步码,Si,Sa4,Sa5,Sa6,Sa7,A比特占用,若系统运用了CRC校验,则Si比特位置改传CRC校验码。TS16为信令时隙,当使用到信令(共路信令或随路信令)时,该时隙用来传输信令,用户不可用来传输数据。所以2M的PCM码型有 (1)PCM30:PCM30用户可用时隙为30个,TS1-TS15,TS17-TS31。TS16传送信令,无CRC校验。 (2)PCM31:PCM30用户可用时隙为31个,S1-TS15,TS16-TS31。TS16不传送信令,无CRC校验。 (3)PCM30C:PCM30用户可用时隙为30个,TS1-TS15,TS17-TS31。TS16传送信令,有CRC校验。 (4)PCM31C:PCM30用户可用时隙为31个,TS1-TS15,TS16-TS31。TS16不传送信令,有CRC校验。 CE1,就是把2M的传输分成了30个64K的时隙,一般写成N*64, CE1----最多可有31个信道承载数据timeslots1----31timeslots0传同步

PCME1形式结构 在PCME1形式信道中,8bit组成一个时隙(TS),由32个时隙组成了一个帧(F),16个帧组成一个复帧(MF)。在一个帧中,TS0主要用于传送帧。定位信号(FAS):CRC-4(循环冗余校验)和对端告警指示,TS16主要传送随路信令(CAS)、复帧定位信号和复帧对端告警指示,TS1至TS15和TS17至TS31共30个时隙传送话音或数据等信息。称TS1至TS15和TS17至TS31为净荷,TS0和TS16为开销。如果采用带外公共信道信令(CCS),TS16就失去了传送信令的用途,该时隙也可用来传送信息信号,这时帧结构的净荷为TS1至TS31,开销只有TS0。 PCME1形式接口 G703非平衡的75ohm,平衡的120ohm2种接口 [2] 。

PCME1的三种方法 (1)将整个2M用作一条链路,如DDN2M; (2)将2M用作若干个64k及其组合,如128K,256K等,这就是CE1; (3)在用作语音交换机的数字中继时,这也是E1最本来的用途,是把一条E1作为32个64K来用,但是时隙0和时隙15是用作signaling即信令的,所以一条E1可以传30路话音。PRI就是其中的最常用的一种接入方式,标准叫PRA信令。用2611等的广域网接口卡,经V.35-G.703转换器接E1线。这样的成本比E1卡低,DDN的2M速率线路是经HDSL线路拉至用户侧。E1可由传输设备出的光纤拉至用户侧的光端机提供E1服务。

PCME1形式使用注意事项

PCME1形式接口对接时,双方的E1不能有信号丢失/帧失步/复帧失步/滑码告警,但是双方在E1接口参数上必须完全一致,因为个别特性参数的不一致,不会在指示灯或者告警台上有任何告警,但是会造成数据通道的不通/误码/滑码/失步等情况。这些特性参数主要有;阻抗/帧结构/CRC4校验 PCME1形式阻值有75ohm和120ohm两种,PCME1形式帧结构有PCM31/PCM30/不成帧三种。

PCME1形式和PCME2形式区别 (1)PCMT1形式是高速传输的另一种标准。一条PCMT1形式可以同时有多个并发信道,每个信道都是一个独立的连接。在美国的标准PCMT1形式服务提供24个信道,每个信道的速率是56K。PCMT1形式服务与其相应的设备ISDN和普通电话相比都更加昂贵。而PCME2形式相对费却较少。 (2)PCMT1形式通常用于需要在远程站点间进高带宽高速率传输的大型组织。64K专用数据线(DDL)作为T1服务的一个变种或一个分支服务,也提供此类服务。而一条PCME1形式线,只要有ProxyServer提供的缓冲功能,在同等传输下,比PCMT1形式可以有效地节省带宽。 (3)PCMT1形式提供23个B信道和一个D信道,即23B+D.1.544Mbps;PCME1形式提供30个B信道和一个D信道,即30B+D.2.048Mbps (4)PCMT1形式表示具有高质量的通话和数据传送界面,北美使用T1标准,能够支持Max的24位用户同时拔号,而欧洲使用E1标准,可以支持30位用户,PCMT1形式仅是MAX的简单接口。

时分复用编辑 所谓时分复用,是将某一信道按时间加以分割,各路信号的抽样。值依一定的顺序占用某一时间间隔(也成时隙),即多路信号利用同一信道在不同的时间进行各自独立的传输。  

时分复用的特点:   1、复用设备内部各通路的部件基本通用   2、要求收、发两端同时工作,要求有良好的同步系统。 时分复用的目的:一个信道传输多路信号,即若干路信号可以采用时分复用方式以一定的 结构形式复接成一路高速率的复合数字信号-群路信号。  数字复接包括bit复接和码组复接。   PCM-30/32路通信设备是采用码组复接的时分复用系统。   在30/32路PCM系统中,帧结构中第一个时隙TS0用于传送帧同步信号,TS16用于传送话路信令,故只有30个时隙用于传送话音信号,所以只能提供30个话路。当采用共路信令传送方式时,必须将16帧再构成一个更大的帧,称为复帧。复帧的重复频率为500Hz,周期为2ms。   数字电话都采用PCM方式。对PCM系统,国际上采用PDH(准同步)复接技术。此技术有两种制式,一种是北美和日本采用的24路话音信号复接成一个基群的T制,速率是1554kbit/s;一种是欧洲和我国采用的30/32路话音信号复接成一个基群的E制,速率为2048kbit/s。为了进一步提高信道利用率,国际电联规定四个基群复接成一个二次群,四个二次群复接成一个三次群,四个三次群复接成一个四次群 [3]

解调

从数字信号回制成模拟信号的过程,就如同把调制的过程逆转一样,称作解调制(demodulation)。在理想的系统上,每经过取样的固定时间而读取新的资料时,输出会即时改变到该强度。经过这样的即时转换,离散的信号本质上会有大量的高频率能量,出现与采样率的倍数相关的谐波(见方波)。要消灭这些谐波并使信号流畅,信号必须通过一些模拟滤波器,压制任何在预期频域外的能量(例如大于的频域,这是理论上最高的清晰度)。有些系统使用数字滤波器来移除最低和最高的谐波,而在有些系统中不使用任何外部的滤波器,因为不可能有系统重制出无限大的带宽,系统本身的不足补足了信号重制上的瑕疵,或者该系统根本就不要求准确度。取样原理说明,任何一种PCM设备,只要提供相对于输入信号足够大的采样率,在期望频域中就不会有显著的失真因素。

从离散的资料重制回模拟信号所使用的电子学,与从模拟至数字是相似的。这些设备被称作“数字至模拟转换器(digital-to-analog converters, DAC)”,与ADC的运作相似。它们依照输入的数字信号,输出电压或电流(看情况则种类不同),这个输出然后经过滤波器和放大器,达成回放。

限制

可注意的是,在任何PCM系统中,本质上有两种损害的来源:

  • 在量化时,取样必须迫于选择接近哪一个整数值(即量化误差)。
  • 在样本与样本之间没有任何资料,根据取样原理,这代表任何频率大于或等于fs即采样率)的信号,会产生失真,或者完全消失(aliasing error)。这又称作奈奎斯特频率(Nyquist frequency)。

由于所有样本都依据时间取样,重制时至关重要的便是一个准确的振荡器。如果编码或解码时,任何一方的振荡器不稳定,频率漂移就会使输出设备的质量降低。如果两方的频率具有些微的差异,稳定的误差对于质量而言并非巨大的问题。但一旦振荡器并非稳定的(即脉动的间距不相等),不论是音频或者视频上,都将造成巨大的失真。

数字化

在一般的PCM中,模拟信号在数字化之前会经过一些处理(如幅度压缩)。一旦经数字化,PCM信号通常会再进一步处理(如数字资料压缩)。

有些形式的PCM把信号处理结合在编码过程中。老一点的系统会把信号的处理放在模拟回路中,当作模拟至数字转换(A/D)的一部分,新的系统则放在数字回路中。不过由于现代基础于转换的音频压缩技术,这些简单的技术大部分已被认为过时。

  • Differential(差异)或Delta PCM(DPCM)纪录的是目前的值与前一个值的差异值。与相等的PCM比较,这种编码只需要25%的比特数。
  • Adaptive DPCM(ADPCM)是DPCM的变形,给定一个噪讯比,以节省量化密度的方式,允许更大程度的节省带宽。

在电话学中,电话的声音频号编码标准是每秒8000个模拟样本,每个样本8位,总共每秒64 kbit的数字信号,即DS0。DS0默认的信号压缩法若非μ-law (mu-law) PCM(美国和日本),就是a-law PCM(欧洲和世界剩余地方),这些对数压缩系统能将12或13比特的线性PCM转换成8位的值。这个系统被描述于国际标准G.711中。另外,曾有使用浮点数的企图,以5比特的尾数搭配3比特的基数,不过已经放弃。

当电路的成本过高、或者音质的损失是可接受的时候,将声音频号更进一步压缩将会较有效率。有一种ADPCM运算法是用来把8位的PCM信号转换成4位的ADPCM信号,这样电线的带宽将能倍增。这个技术被详细地描述于G.726标准中。

稍后又发现可能进行进一步的压缩,并开发新一代的标准格式。在这些描述新系统或新概念的国际标准当中,有些属于私人的专利技术,要使用它们必须付费。

有些ADPCM技术被用于Voice over IP通信当中。

传输的编码

PCM的纪录方式可以是“归零式(return-to-zero, RZ)”的,也可以是“非归零式(non-return-to-zero, NRZ)”的。若要使用带宽内的信息让一个NRZ系统达到同步,则必定不能有长串的相同符号出现,例如连续的1或连续的0。对于二进制PCM系统来说,“1”符号的密度称作“ones-density”。

ones-density可以透过诸如Run Length Limited的预编码方式控制,编码后的PCM代码会稍微长一些,这样可以保证在写入音轨之前,ones-density在一定阈值以下。在另一些情况中,会写入额外的“framing”比特,来保证在一段时间内,1或0至少会改变一次。

另外一个控制ones-density的方法是使用“scrambler”多项式,通过函数运算让原本的资料变成看起来如伪随机数般的排列,而要回复原本的资料只需要倒转该多项式的效果就可以。在这种技巧中,一连串的1或0仍然可能发生在输出中,但在一般的工程容忍度上,已经不太可能发生错误。

另外,信号的直流输出的稳定性十分重要,因为逐渐累积的直流输出误差(offset)会导致侦测回路的运作超出范围。在这种情况下,必须作特殊的测量来计算直流输出的累积误差,并且在必要时改变电压大小来让误差永远趋向零。

许多的这些代码都是两极的,脉冲要不是正就是负,或者完全没有。在典型的alternate mark inversion代码中,非0脉冲在正和负之间转变。不过这些规则有可能因为必须置入“framing”或者其他特殊用途的代码而遭到违反。

  • 见 T-carrier

PCM的历史

评价上,PCM就像其他伟大的发明一样简单而明了。在电子通信的历史中,采用信号取样的最早理由,是为了使不同的电报系统能够使用同一条电缆线互通有无。电报时分复用TDM(time-division multiplexing)的概念在1853年首次由美国发明家 M.B. Farmer 提出。在1903年,电技师 W.M. Miner 使用一种电力驱动的机械交换器真正达成时分复用 (TDM),让一条线负载许多电报信号,并将其应用于电话机上。他并使用以 3500 至 4300 赫兹频率取样的话机,发表一段清晰的谈话:“below this was unsatisfactory.”(指采样率)。但这只是TDM,使用的编码是脉冲幅度调制(pulse-amplitude modulation, PAM)而非 PCM。

1920年Bartlane电缆图像传输系统首次利用模拟信号横跨大西洋传送了一张5级灰度图片。西方电子(Western Electric,后来成为 AT&T)的 Paul M. Rainey,在 1926 年注册了一台传真机的专利,它使用了光学机械ADC。但这台机器并未量产。英国工程师 Alec Reeves 并不知道这项发明,相反地,1937 年他在为法国的 ITT(International Telephone and Telegraph)工作时,发现了 PCM 在声音传讯上的用处。他写出了它的理论以及优点,但并未付诸实现。在 1938 年他为此申请了专利,而美国的专利则在 1943 年批准。

第一次的数字音频传输发生于二次大战间的 1943 年,使用了 SIGSALY 声音编码设备。它被盟军用来传输高清音质的消息。

在 1943 未过一半以前,设计 SIGSALY 系统的贝尔实验室同样发现了 Alec Reeves 所发现的 PCM 的那种妙用。

在 1950 年代,PCM 必须使用阴极射线管加上一个有孔的极板网栅。如同在示波器上见到的那样,电波以采样率水平地扫过,而垂直偏向则由输入的模拟信号来控制,最终让电波通过在极板上高低不一的孔。极板截断了电波,产生二进制代码形式的电流。与真正的二进制数不同,这个极板被设计成可以产生格雷码(Gray code),避免两极转换时出现干扰。

PCM的命名

“脉冲”一词用在“脉冲编码调制”中似乎显得令人困惑,因为除了在电线中的电力以外,并没有任何明显可见的“脉冲”。但由于这项技术发展自另外两个模拟技术,脉冲宽度调制脉冲位置调制,这样的结果则显得自然。在这两项技术中,信息实际上就是依照离散信号脉冲的不同宽度或位置来作编码的。由这点来说,PCM、PWM 和 PPM 除了三者都能用于 TDM 上,以及 PCM 的确将它的代码表回脉冲以外,PCM 和它的前辈们确实很不相像。在电话的电路中,用于编码和解码功能的设备称作codec(Coder+Decoder 的合称)。

参见

外部链接

  • Ralph Miller and Bob Badgley invented multi-level PCM independently in their work at Bell Labs on SIGSALY: 美国专利第3,912,868号: N-ary Pulse Code Modulation.
  • According to the Inventors Hall of Fame, B.M Oliver and Claude Shannon are the inventors of PCM as described in 'Communication System Employing Pulse Code Modulation,' 美国专利第2,801,281号 filed in 1946 and 1952, granted in 1956.
  • Information about PCM: A description of PCM with links to information about subtypes of this format (for example Linear Pulse Code Modulation), and references to their specifications.

本页面最后更新于2021-09-07 14:53,点击更新本页查看原网页。台湾为中国固有领土,本站将对存在错误之处的地图、描述逐步勘正。

本站的所有资料包括但不限于文字、图片等全部转载于维基百科(wikipedia.org),遵循 维基百科:CC BY-SA 3.0协议

万维百科为维基百科爱好者建立的公益网站,旨在为中国大陆网民提供优质内容,因此对部分内容进行改编以符合中国大陆政策,如果您不接受,可以直接访问维基百科官方网站


顶部

如果本页面有数学、化学、物理等公式未正确显示,请使用火狐或者Safari浏览器