近几年,随着IP可视对讲技术的逐渐成熟,IP可视对讲产品也逐步得到了普及应用。然而,一些厂家为了节省庞大的研发费用,将IP网络电话技术直接移植到IP可视对讲产品中,消费者无法辨识真假。为此,本文将通过对IP网络电话技术与IP可视对讲技术的分别阐述,并进行比较,以帮助广大消费者辨别真伪IP可视对讲产品。
IP网络电话泛指在以IP(Internet Protocol)为网络层协议的计算机网络中进行话音通讯的系统,它采用的技术统称为VoIP(Voice over IP),即IP上传送话音。由于计算机网络采用的都是分组交换技术,其传送的数据单元都是由控制部分和数据部分封装而成的独立数据包,通常称之为“分组”,因此,从更一般的意义上来说,VoIP属于分组话音通信的范畴。
而从技术上说,IP网络电话则是以IP为标志的网络分组化和以多媒体为目标的网络业务综合化两大主流技术融合的结果。随着分组通信技术、综合业务通信技术,以及IP通信技术的不断发展,尤其是90年代以来以TCP/IP为核心协议的因特网(Internet)在全球范围内超乎寻常的大发展,使得以IP业务为主的数据业务成倍增长,数据业务成倍增长又导致IP网络的大力扩建,增加其带宽,有效提高了Internet传送质量;反过来,它又促进了Internet业务的发展和用户数的增长。
Internet已从单纯的数据业务进入包括声音和图像在内的多媒体通信领域,传统的计算机网络和电信网络壁垒分明的界线已经被打破。Internet进入电信服务的第一步,自然就是用户面最为广泛的基于IP的分组话音通信,即IP网络电话。
IP网络电话关键技术
IP网络电话由于具有价格低廉、可以灵活提供各种增值业务、有利于企业建立高效综合服务内部网、有利于运营商开拓新的市场及有助于和新技术的融合等的应用优势,使得IP网络电话能够赢得市场的青睐。其关键技术主要表现在以下几个方面,即话音处理技术、IP话音通信协议、网络管理和安全技术、终端技术及视频编码技术。
话音处理技术是IP网络电话技术的重要组成部分,IP网络电话中的话音处理主要解决两个问题。一是在保证一定话音质量的前提下尽可能降低编码比特率,二是在IP网络环境下保证一定的通话质量。前者主要是话音编码技术,包括静音检测;后者包括分组丢失补偿和回波抵消技术。在话音通信中,时延指标是主要的,时延过大会使听话者有不连续的感觉,而时延抖动是次要的。另外,话音编码算法需要考虑三个方面的问题:编码比特率、话音质量和算法复杂度。一般来说,这些指标是有矛盾的,比特率越低,线路的利用率越高,但话音质量会受到影响;在同样比特率情况下,算法设计越复杂,话音质量就会有所提高,但处理时延将增加。目前在PSTN中广泛应用的是PCM话音编码,其比特率为64Kbit/s,话音采样率是8KHz。它属于波形编码类型。通常,这类编码的最低比特率为32Kbit/s,即ADPCM。若要进一步降低其比特率,特别是低于16Kbit/s的低比特率编码方案,必须采用新的编码原理,这就是参数编码,又称作声码器(Vocoder)技术。它是通过模拟人的发声器官,提取模型参数来降低话音信息编码率的。
目前,IP网络电话最常用的是G.729和G.723话音编码。G.729是8Kbit/s的LPAS声码器,线性预测采用前馈型前向自适应技术,并使用预示提高合成模型的精度。G.723是双速率LPA声码器,低速率的编码比特率为5.3Kbit/s,高速率的编码比特率为6.3Kbit/s,线性预测也采用前馈型前向自适应,并使用预视。G.723主要应用于低比特率可视电话。
静音检测又称话音活动性检测,它是一种静音压缩技术,实用的静音压缩技术由话音活动性检测器和舒适噪声生成器两个部分组成。分组丢失补偿主要以处理在传输过程中分组的丢失为主要目的。因为在IP网络中分组的丢失是不可避免的,丢失的原因可能是线路误码或者网络路由器故障,更常见的原因则是传输时延过长或网络拥塞导致分组被丢弃。
回波抵消主要针对通话回声的抑制,对于纯IP电话系统来说,由于话音信号的接收和发送经由不同的物理线路,也就是所谓的四线制,因此不存在回音的问题。如果IP网和PSTN互连,通信双方至少有一方是二线制电话,涉及有混合线圈的2/4线转换电力,就会产生回音。(其原理如图1所示)理论上说,混合线圈对端间的衰耗应为无穷大,这样IP电话发出的话音信号只能送到PSTN电话,不会串到对端。可是,实际上混合线圈很难做到完全平衡,这样一部分信号将漏到对端返回IP电话,如果传输时延较长,发话者就会感到明显的回声,严重干扰通话。
回波抵消就是通过自适应方法估计回波信号的大小,然后在接收信号中减去此估计值。这种方法虽然比较复杂,但是已有专用芯片推出,因此得到广泛的应用。在IP网络和PSTN互通的情况下,回波抵消功能一般由网关完成。
除此之外,IP话音通信协议包含有话音通信控制协议、话音信息传送协议、会议电话控制协议及实时控制协议。网络管理和安全技术主要体现在IP网络电话系统的安全性如鉴权、权限验证、加密等和IP网络电话系统必须具有的计费功能和运营商间互操作管理功能等方面。而终端技术则主要体现在基于以太网的专用IP电话机。此类话机具有许多PC机的特性,比如典型的如RJ-45接口、具有自己的IP地址、内置多种话音压缩编码等等。
IP网络可视电话的视频编码技术
IP网络可视电话,即在IP网络电话的基础上增加了视频传输功能。
在IP网络可视电话中,视频编码技术是视频处理的重要组成部分,目前最常用的视频编码为MPEGx及H.26x系列,笔者以H.26x系列为例进行分析。
H.261是最早出现的视频编码建议,目的是规范ISDN网上的会议电视和可视电话应用中的视频编码技术。它采用的算法结合了可减少时间冗余的帧间预测和可减少空间冗余的DCT变换的混合编码方法。和ISDN信道相匹配,其输出码率是p×64kbit/s。p取值较小时,只能传清晰度不太高的图像,适合于面对面的电视电话;p取值较大时(如 p>6),可以传输清晰度较好的会议电视图像。H.263建议的是低码率图像压缩标准,在技术上是对H.261的改进和扩充,支持码率小于64kbit/s的应用。但实质上,H.263以及后来的H.263+和H.263++已发展成支持全码率应用的建议,从它支持众多的图像格式这一点就可看出,如Sub-QCIF、QCIF、CIF、4CIF甚至16CIF等格式。
H.264是ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家组)的联合视频组(JVT:joint video team)开发的一个新的数字视频编码标准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。1998年1月份开始草案征集,1999年9月,完成第一个草案,2001年5月制定了其测试模式TML-8,2002年6月的 JVT第5次会议通过了H.264的FCD板。2003年3月正式发布。H.264和以前的标准一样,也是DPCM加变换编码的混合编码模式。但它采用“回归基本”的简洁设计,不用众多的选项,获得比H.263++好得多的压缩性能;加强了对各种信道的适应能力,采用“网络友好”的结构和语法,有利于对误码和丢包的处理;应用目标范围较宽,以满足不同速率、不同解析度以及不同传输(存储)场合的需求;它的基本系统是开放的,使用无需版权。
在技术上,H.264标准中有多个闪光之处,如统一的VLC符号编码,高精度、多模式的位移估计,基于4×4块的整数变换、分层的编码语法等。这些措施使得H.264算法具有很的高编码效率,在相同的重建图像质量下,能够比H.263节约50%左右的码率。而且,H.264的码流结构网络适应性强,增加了差错恢复能力,能够很好地适应IP和无线网络的应用。
该文观点仅代表作者,本站仅提供信息存储空间服务,转载请注明出处。若需了解详细的安防行业方案,或有其它建议反馈,欢迎联系我们。