G.723.1双速率语音编解码算法的DSP实现

2024-01-25 来源：客趣旅游网

维普资讯 http://www.cqvip.com

Ｇ．７２３．１双速率语音编解码算法的ＤＳＰ实现　高小波．郑烩　（中国科学技术大学自动化系，合肥２３００２７）　摘　要：在介绍了Ｇ．７２３．１双速率编解码算法标准，Ｓ！ＬｏｇｉＫｃ公司的ＤＳＰ芯片ＫＳＩ４０３ＬＰ的特性以及对Ｇ．７２３．１标准的Ｃ　源代码进行深入分析的基础上，对标准中的双速率语音编解码算法进行了优化，并且在ＫＳＩ４０３Ｉ　Ｐ上进行了实现，结果表　明可以得到较低的算法时延和极高的语音音质。　关键词：Ｇ．７２３．１：语音编码；ＶｏｌＰ；￣化　文章编号：１００２—８３３１（２００６）３３—００９７—０３　文献标识码：Ａ　中图分类号：ＴＰ３９１　Ｉｍｐｌｅｍｅｎｔａｔｉｏｎ　ｏｆ　Ｇ．７２３．１　Ｄｕａｌ　Ｒａｔｅ　Ｃｏｄｅｃ　Ａｌｇｏｒｉｔｈｍ　ｉｎ　ＤＳＰ　ＧＡ０　Ｘｉａｏ－ｂｏ．ＺＨＥＮＧ　Ｑｕａｎ　（Ｄｅｐａｒｔｍｅｎｔ　ｏｆ　Ａｕｔｏｍａｔｉｏｎ，Ｕｎｉｖｅｒｓｉｔｙ　ｏｆ　Ｓｃｉｅｎｃｅ　ａｎｄ　Ｔｅｃｈｎｏｌｏｇｙ　ｏｆ　Ｃｈｉｎａ，Ｈｅｆｅｉ　２３００２７，Ｃｈｉｎａ）　Ａｂｓｔｒａｃｔ：Ｉｎ　ｔｈｅ　ａｒｔｉｃｌｅ，ｔｈｅ　Ｇ．７２３．１　ｄｕａｌ　ｒａｔｅ　ｃｏｄｅｃ　ａｌｇｏｒｉｔｈｍ　ａｎｄ　ｔｈｅ　ｆｅａｔｕｒｅｓ　ｏｆ　ＫＳＩ４０３ＬＰ（【ｓＩ　Ｌｏｇｉｃ）ａｒｅ　ｉｎｔｒｏｄｕｃｅｄ　ａｔ　ｆｉｒｓｔ．Ｔｈｅ　Ｇ．７２３．１　ａｌｇｏｒｉｔｈｍ　ｉｓ　ｔｈｅｎ　ｏｐｔｉｍｉｚｅｄ　ｂａｓｅｄ　ｏｎ　ｔｈｅ　ｆａｃｔ　ｔｈａｔ　ｔｈｅ　Ｃ　ｃｏｄｅ　ｏｆ　ｔｈｅ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　ｉｓ　ｄｅｅｐｌｙ　ａｎａｌｙｚｅｄ．Ｔｈｅｎ　ｔｈｉｓ　ａｌｇｏｒｉｔｈｍ　ｉｓ　ｒｅａｌｉｚｅｄ　ｏｎ　ＫＳＩ４０３ＬＰ．Ｔｈｅ　ｒｅｓｕｌｔｓ　ｉｎｄｉｃａｔｅ　ｔｈａｔ　ｔｈｅ　ｌｏｗｅｒ　ａｌｇｏｒｉｔｈｍ　ｔｉｍｅ　ｃｏｍｐｌｅｘｉｔｙ　ａｎｄ　ｓａｔｉｓｆｉｅｄ　ｓｙｎｔｈｅｔｉｃ　ｓｐｅｅｃｈ　ｑｕａｌｉｔｙ　ａｒｅ　ｒｅｃｅｉｖｅｄ．　Ｋｅｙ　ｗｏｒｄｓ：Ｇ．７２３．１；ｓｐｅｅｃｈ　ｃｏｄｉｎｇ；ＶｏｌＰ；ｏｐｔｉｍｉｚａｔｉｏｎ　ｌ　前言　目前．对适合于家庭和小型办公场所的Ｖｏｉｃｅ　ｏｖｅｒ　ＩＰ　（ＶｏｌＰ）的解决方案的需求正在不断增长．Ｇ．７２３．１和Ｇ．７２９是两　种常用的低码率语音压缩标准　Ｇ．７２３．１标准是ＩＴＵ组织于　１９９６年推出的一种双速牢语音编解码标准．能够将８　ｋＨｚ采样　ｌ６　ｂｉｌ的线性ＰＣＭ语音信号压缩成６．３　Ｋｂｐｓ或５．３　Ｋｂｐｓ的比　特流．压缩比分别达到２Ｏ或２４．并且两种速率下都能提供很　好的语音质量．因此Ｇ．７２３．１成为Ｈ．３２３的首选标准　在普通ＰＣ机上用标准Ｃ定点实现了Ｇ．７２３．１编解码算法　帧，用加权语音信号计算其开环基音周期（ＬＯＬ），基音搜索范　围从１８到１４２　利用计算得到的开环基音周期再构造一个谐　波噪声整形滤波器，和线性预测编码合成滤波器、共振峰感知　加权滤波器一起组成一个联合滤波器．计算联合滤波器的冲击　响应　再利用开环基音周期和冲激响应计算闭环基音周期．然　后从目标矢量中扣除自适应码本分量．并将闭环基音周期和残　差信号送到解码端。在高速牢（６．３　ｋｂＤｓ）下对激励信号进行多　脉冲最大似然量化（ＭＰ—ＭＬＱ）；在低速率（５．３　ｋｂｐｓ）下采用代　数码本激励线性预测（ＡＣＥＬＰ）。先用实际信号减去预测信号得　的基础上，准备存数字信号处理器（ＤＳＰ）上实现该算法。由于　ＤＳＰ系统对语音编码的实时性要求及ＤＳＰ自身资源空间的局　到残差信号．再用一个脉冲序列通过组成滤波器来模拟残差信　号，在最小误差准则下，将得到的一系列参数如滤波器系数、脉　冲位置、脉冲幅度打包成一个比特流传送出去．．整个编码器框　图如图１　限性．要求　将Ｃ程序移植到ＤＳＰ之前必须先对算法进行优　化　本文存介绍了Ｇ，７２３，】语音编解码算法原理的基础上，对　该算法进行分析和优化，最后给出结论。　厂—　２　Ｇ．７２３．１编解码算法　ＬＰＣ转　！墨塾里些堡　ｌ　．１　ＩＳＰ转　　模拟　｝２．１编码器原理　Ｇ．７２３．１编码算法使用线性预测——合成编码来进行语音　分　帧　求　换为ＬＳＰ『　１换为ＬＰＣ　ｒ＿＿１解码器　构成感　知加权　滤波器　构成谐　自适应　高　通　滤　取　ＬＰＣ　及其他声音信号的编码　Ｇ．７２３．１编解码算法来对语音信号　波噪声　滤波器　码本搜索　进行压缩编码时．输入信号按帧读入　帧长为３０　ｍｓ．在８　ｏｏＯ　Ｈｚ　采样时包含２４０个样本值．．每帧信号都先经过高通滤波器除直　流（ＤＣ）成分后再分成４个子帧．每一个子帧送入一个ｌ０阶线　系　波　数　开环基　吲搜索　吲定　码本搜索　性预测编码器（Ｔ　ＰＣ）．计算ＬＰＣ系数。最后一个子帧的ＬＰＣ系　数采用预测分裂矢量量化器（ＰＳＶＱ）量化．最终生成一个２４比　特的子帧　量化前的ＬＰＣ用束建立短时感知加权滤波器，整帧　图１　Ｇ．７２３．１编码框图　２．２解码器原理　解码器也同样采用分帧处理。首先将编码参数解码，重构　信号通过该滤波器后得到感觉加权语音信号　对于每两个子　基金项目：同家８６３高技术研究发展计划资助项目（２００５ＡＡ１０３）。　作者简介：高小波（１９８１一），男（汉族），硕士，主要研究方向：嵌入式系统，语音处理；郑烃，副教授。博士。研究方向：智能控制，人工智能，模式识别　ＫＤＤ　计算机工程与应用２００６．３３　９７　维普资讯 http://www.cqvip.com

维普资讯 http://www.cqvip.com

ｅ　（１）＝ｅｌ—　广１１　（４）　用的初始化代码　ｅ　（ｎ＋２）＝ｅ［（ｎ　ｌｎｏｄ　Ｌ　）一　】Ｏ≤ｎ≤６ｌ　ｂｏｏｔｌｏａｄｅｒ的设计带有一个特殊的功能．．这段ＤＳＰ代码可　其中，　是第ｉ个子帧的基音周期，ｅ（ｎ）是激励矢量。仔细分析　创建另一段特殊的代码　这段代码会被放在ｂｏｏｄｏａｄｅｒ原来所　一下上面的公式，当Ｌ，＜６２时，ｅ　（ｎ）＝ｅ　（ｎ＋ｋＬ　），萁中ｎ＋ｋＬ　≤　在的地方　当主机ｌｏａｄｅｒ装载ＤＳＰ应用程序的时候，它会推迟　６３．ｋ时整数。这样上面的公式义可以表示为：　装载这一段代码直至其他代码装载完毕。最后它会把这一段代　ｅ　（Ｏ）＝ｅ［－Ｌ；－２】　码装载进去　ＤＳＰ的ｂｏｏｔｌｏａｄｅｒ识别出这一段特殊的代码，它就　ｅ　（１）＝ｅ［－Ｌｒ－１】　会允许ｂｏｏｔｌｏａｄｅｒ被覆盖．因此可以收回除了１０ｗｏｒｄｓ以外的　ｅ　（２＋ｊ）＝ｅｌｉ—Ｌｆ］Ｏ　≤　（５）　所有空间　ｅ　（２＋ｊ）＝ｅ　【２　一Ｌ，Ｉ厶≤　≤６１　两阶段的启动过程也被考虑过　这种技术可以让所有的一　这种算法在ＩＳＩ４０３ＬＰ中很容易实现，避开了求余运算．达　次性的初始化代码先执行．然后才把最终的应用程序装载到ＤＳＰ　到了同样的效果　上。这样的话．初始代码可被覆盖。但是，后来发现这种方式没有　在固定码本搜索中．为了生成Ｄｉｒａｃ序列．也会遇到类似　必要．因为在其他方面做的优化已经足够支持所需要的功能。　的问题．同样可以用上述算法来解决。　４．２．２针对Ｉ．Ｓ１４０３１　Ｐ的优化　５　结束语　４．２．２．１循环展开　经实际测试．若采用ＩＴＵ组织提供的Ｇ．７２３．１的Ｃ语言源　使用具有并行能力的ＤＳＰ开发软件时，一个重要的思想　代码．在ＬＳＩ４０３ＬＰ上实现一帧语音数据５．３　ｋｂｉｆｓ的编解码需　就是充分利用ＤＳＰ的字长和数目众多的运算单元．尽量把循　要４５０　ｍｓ．使用ＬＳＩ４０３ＬＰ开发环境的最高优化级优化后时间　环体展开　通过增加每次循环中执行的指令数来减少总的循环　可降至１６０　ｍｓ　最终实现一路语音的Ｇ．７２３．１编解码程序空间　次数．可使得在同样的时钟周期内能运行更多的指令．提高了　约为１８ＫＢ．数据／堆栈空间为３２ＫＢ。试验表明．以男生、女生、　循环的效率　音乐等多种音源作为输入．系统具有良好的适应性，能够达到　４．２．２．２提高寄存器的利用率　通信质量。Ｇ．７２３．１编码器在定点ＤＳＰ上实时实现．产生出了性　ＤＳＰ芯片内部运算单元运行效率非常高．如果寄存器和数　价比极高的语音编解码系统．在数字通信、数字卫星系统、多媒　据总线之『日】的数据交换频繁．将使ＤＳＰ的执行效率大打折扣。　体通信等领域有较广泛的应用前景。（收稿日期：２００６年２月）　冈为ＤＳＰ在进行内存操作时．往往需要若干周期的延迟．如　Ｌｏａｄ指令要有４个周期的延迟．Ｓｔｏｒｅ指令需要２个周期的延　迟．为了减少耗时的内存操作，可以存程序进入循环体之前，将　参考文献：　要频繁使用的数据预先放人寄存器．然后反复调用．实践证明　［１】ＩＴＵ－Ｔ．Ｄｕａｌ　Ｒａｔｅ　Ｓｐｅｅｃｈ　Ｃｏｄｅｒ　ｆｏｒ　Ｍｕｌｔｉｍｅｄｉａ　Ｃｏｍｍｕｎｉｃａｔｉｏｎ　这种方法可以提高一部分效率　Ｔｒａｎｓｍｉｔｔｉｎｇ　ａｔ　５．３　ａｎｄ　６．３　ｋｂｉＶｓ，ＩＴＵ—Ｔ　Ｒｅｃ０ｍｍｅｎｄａｔｉ０ｎ　Ｇ．７２３．１ｆｓ１．　１９９６—０３．　４．２．２＿３　有效地重复使用内存　［２】ＬＳＩ４０３ＬＰ　Ｄｉｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｏｒ　Ｕｓｅｒ’ｓ　Ｇｕｉｄｅ．ＬＳＩ　Ｌｏｇｉｃ　Ｃｏｒｐｏ－　有些内存只是在系统启动时被使用过。这些代码只有当　ｒａｔｉｏｎ，２００２．　ＤＳＰ重新启动时才会被执行．因此没有必要长时间占据这些宝　【３】王炳锡．语音编码【ＭＪ．西安：西安电子科技大学出版社，２００２．　贵的ＤＳＰ内存。这些代码可分为两类。一类是负责装载和启动　『４１杨行峻，迟惠生．语音信号数字处理『Ｍ１．北京：电Ｙ－Ｔ￣，Ｔ，版｝十，１９９５．　ＤＳＰ应川程序的ｂｏｏｔｌｏａｄｅｒ．．另外一类是仅在系统启动时被调　『５】毕厚杰．多媒体信息的传输与处理『Ｍ】北京：Ａ　ＬＯｎｇ电山版社，１９９９．　（上接９Ｏ页）　［２】ＺＯＲＩＮ　Ｄ，ＳＣＨＲＯＤＥＲ　Ｐ，ＤＥＲＯＳＥ　Ａ，ｅｔ　ａ１．Ｓｕｂｄｉｖｉｓｉｏｎ　ｆｏｒ　ｍｏｄｅｌ—　实现丁上述算法．．图５为本文算法的实验结果　ｉｎｇ　ａｎｄ　ａｎｉｍａｔｉｏｎ［Ｊ］．ＡＣＭ　ＳＩＧＧＲＡＰＨ　Ｃｏｕｒｓｅ　Ｎｏｔｅｓ。１９９８，１２．　实验中．通过与用户的变互．本文算法能够方便直观地对　【３］ＫＯＢＢＥＬＴ　Ｌ，ＣＡＭＰＡＧＮＡ　Ｓ，ＶＯＲＳＡＴＺ　Ｊ．Ｉｎｔｅｒａｃｔｉｖｅ　ｍｕｈｉ－ｒｅｓｏｌｕ－　网格局部实施精确编辑．特别足网格对象中的特征比较突ｆｎ的　ｔｉｏｎ　ｍｏｄｅｌｉｎｇ　ｏｎ　ａｒｂｉｔｒａｒｙ　ｍｅｓｈｅｓ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　ＳＩＧＧＲＡＰＨ　部位，如手指、四肢等尤其有效（如图５（ａ））。而对于特征非常　９８，１９９８：１０５　１１４．　不突ｍ的部位．如人头像中的眼睛、嘴唇等部位（如图５（ｂ），右　『４１　ＢＯ　ｒｓＣＨ　Ｍ，ＫＯＢＢＥＬＴ　Ｌ．Ａｎ　ｉｎｔｕｉｔｉｖｅ　ｆｒａｍｅｗｏｒｋｆｏｒ　ｒｅａｌ—ｔｉｍｅ　图为眼部经编辑模型），编辑敛果还不理想。　ｆｒｅｅｆｏｒｍ　ｍｏｄｅｌｉｎｇ［Ｊ］．ＡＣＭ　Ｔｒａｎｓ　Ｇｒａｐｈ，２００４．２３：６３０—６３４．　［５ｌ　ＹＯＳＨＩＺＡＷＡ　Ｓ，ＢＥＬＹＡＥＶ　Ａ　Ｇ，ＳＥＩＤＥＬ　Ｈ　Ｐ．Ｆｒｅｅ—ｆｏｒｍ　ｓｋｅｌｅｔｏｎ—　５　结论　ｄｒｉｖｅｎ　ｍｅｓｈ　ｄｅｆｏｒｍａｔｉｏｎｓ［Ｃ］／／ＡＣＭ　Ｓｏｌｉｄ　Ｍｏｄｅｌｉｎｇ　２００３，ｃ２００３：　目前．针对　维表面网格的局部编辑的系统和算法．在编　２４７—２５３．　辑的准确性、直观性和町控性方面都存在一定的　全面性．．为　［６】ＴＡＭ　Ｒ，ＨＥＩＤＲＩＣＨ　Ｗ．Ｓｈａｐｅ　ｓｉｍｐｌｉｉｆｃａｔｉｏｎ　ｂａｓｅｄ　Ｏｉｌ　ｔｈｅ　ｍｅｄｉａｌ　ａｘｉｓ　ｔｒａｎｓｆｏｒｍ［Ｊ］．ＩＥＥＥ　Ｖｉｓｕａｌｉｚａｔｉｏｎ．２００３—１０：４８１—４８８．　此．奉文在研究了三维网格骨架产生和优化的基础上，提出一　［７】ＤＩＪＫＳＴＲＡ　Ｅ　Ｗ．Ａ　ｎｏｔｅ　ｏｎ　ｔｗｏ　ｐｒｏｂｌｅｍｓ　ｉｎ　ｃｏｎｎｅｘｉｏｎ　ｗｉｔｈ　ｇｒａｐｈ４ＣＶ／　个通过绘图方式改变网格骨架曲线形状的局部网格编辑算法。　Ｎｕｍｅｒｉｓｈｅ　Ｍａｔｈｅｍｅｔｉｋ．Ｎｅｗ　Ｙｏｒｋ：ＡＣＭ　ｐｒｅｓｓ，１　９５９（１）：２６９—２７　１．　经过实验表明，该算法能够实时、方便、　直观地实现三维网格局　【８ｌ朱红斌，王文成，吴恩华，　维模型骨架的矫ｉｖ［ｊ］．软件学报，２００４，　部特征的变形　但对于模型局部特征不太明显的区域的变形．　１５（６）：９６１—９６８．　效果不理想．需要进一步改进　（收稿１３期：２００６年２月）　［９】ＨＯＰＰＥ　Ｈ．Ｐｒｏｇｒｅｓｓｉｖｅ　ｍｅｓｈｅｓ［ｃ】／／Ｃ０　ｐｕｔｅｒ　Ｇｒａｐｈｉｃｓ　３０：Ａｎｎｕａｌ　Ｃｏｎｆｅｒｅｎｅｅ　Ｓｅｒｉｅｓ，１９９６：９９—１０８．　参考文献：　［１０】ＹＡＧＯＵ　Ｈ，ＯＨＴＡＫＥ　Ｙ，ＢＥＬＹＡＥＶ　Ａ　Ｇ．Ｍｅｓｈ　ｓｍｏｏｔｈｉｎｇ　ｖｉａ　［１】ＳＥＤＥＲＢＥＲＧ　Ｔ　Ｗ，ＰＡＲＲＹ　Ｓ　Ｒ．Ｆｒｅｅ－ｆｏｒｍ　ｄｅｆｏｒｍａｔｉｏｎ　ｏｆ　ｓｏｌｉｄ　ｍｅａｎ　ａｎｄ　ｍｅｄｉａｎ　ｆｉｌｔｅｒｉｎｇ　ａｐｐｌｉｅｄ　ｔｏ　ｆａｃｅ　ｎｏｒｍａｌｓ［Ｃ］／／Ｇｅｏｍｅｔｒｉｅ　ｇｅｏｍｅｔｒｉｃ　ｍｏｄｅｌｓ［Ｊ］．Ｃｏｍｐｕｔｅｒ　Ｇｒａｐｈｉｃｓ，１９８６。２０（４）：１５１—１６０．　Ｍｏｄｅｌｉｎｇ　ａｎｄ　Ｐｒｏｃｅｓｓｉｎｇ，２００２：１２４—１３１．　计算机工程与应用２ｏｏ６－３３　９９　

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部栏目

G.723.1双速率语音编解码算法的DSP实现