一、VoIP的基本 原理与实现形式 VoIP是建立在IP技术上的分组化、数字化传输技术,其基本原理是:通过语音压缩算法对语音数据进行压缩编码处理,然后把这些语音数据按IP等相关协议进行打包,经过IP网络把数据包传输到接收地,再把这些语音数据包串起来,经过解码解压处理后,恢复成原来的语音信号,从而达到由IP网络传送语音的目的。IP电话系统把普通电话的模拟信号转换成计算机可联入因特网传送的IP数据包,同时也将收到的IP数据包转换成声音的模拟电信号。经过IP电话系统的转换及压缩处理,每个普通电话传输速率约占用8~11kbit/s带宽,因此在与普通电信网同样使用传输速率为64kbit/s的带宽时,IP电话数是原来的5~8倍。 VoIP的核心与关键设备是IP电话网关。IP电话网关具有路由管理功能,它把各地区电话区号映射为相应的地区网关IP地址。这些信息存放在一个数据库中,有关处理软件完成呼叫处理、数字语音打包、路由管理等功能。在用户拨打IP电话时,IP电话网关根据电话区号数据库资料,确定相应网关的IP地址,并将此IP地址加入IP数据包中,同时选择最佳路由,以减少传输时延,IP数据包经因特网到达目的地IP电话网关。对于因特网未延伸到或暂时未设立网关的地区,可设置路由,由最近的网关通过长途电话网转接,实现通信业务。 目前VoIP系统一般由IP电话终端、网关(Gateway)、网(关)守(Gatekeeper)、网管系统、计费系统等几部分组成。IP电话终端包括传统的语音电话机、PC、IP电话机,也可以是集语音、数据和图象于一体的多媒体业务终端。由于不同种类的终端产生的数据源结构是不同的,要在同一个网络上传输,这就要由网关或者是通过一个适配器进行数据转换,形成统一的IP数据包。IP电话网关提供IP网络和电话网之间的接口,用户通过PSTN本地环路连接到IP网络的网关,网关负责把模拟信号转换为数字信号并压缩打包,成为可以在因特网上传输的IP分组语音信号,然后通过因特网传送到被叫用户的网关端,由被叫端的网关对IP数据包进行解包、解压和解码,还原为可被识别的模拟语音信号,再通过PSTN传到被叫方的终端。这样,就完成了一个完整的电话到电话的IP电话的通信过程。关守实际上是IP电话网的智能集线器,是整个系统的服务平台,负责系统的管理、配置和维护。关守提供的功能有拨号方案管理、安全性管理、集中帐务管理、数据库管理和备份、网络管理等等。网管系统的功能是管理整个IP电话系统,包括设备的控制及配置,数据配给,拨号方案管理及负载均衡、远程监控等。计费系统的功能是对用户的呼叫进行费用计算,并提供相应的单据和统计报表。计费系统可以由IP电话系统制造商提供,也可以由第三方制作,但此时需IP电话系统制造商提供其软件数据接口。 在实现方式上,VoIP有电话机到电话机、电话机到PC、PC到电话机和PC到PC等4种方式。最初VoIP方式主要是PC到PC,利用IP地址进行呼叫,通过语音压缩、打包传送方式,实现因特网上PC机间的实时话音传送,话音压缩、编解码和打包均通过PC上的处理器、声卡、网卡等硬件资源完成,这种方式和公用电话通信有很大的差异,且限定在因特网内,所以有很大的局限性。电话到电话即普通电话经过电话交换机连到IP电话网关,用电话号码穿过IP网进行呼叫,发送端网关鉴别主叫用户,翻译电话号码/网关IP地址,发起IP电话呼叫,连接到最靠近被叫的网关,并完成话音编码和打包,接收端网关实现拆包、解码和连接被叫。对于电话到PC或是PC到电话的情况,是由网关来完成IP地址和电话号码的对应和翻译,以及话音编解码和打包。 二、VoIP的关键技术 传统的IP网络主要是用来传输数据业务,采用的是尽力而为的、无连接的技术,因此没有服务质量保证,存在分组丢失、失序到达和时延抖动等情况。数据业务对此要求不高,但话音属于实时业务,对时序、时延等有严格的要求。因此必须采取特殊措施来保障一定的业务质量。VoIP的关键技术包括信令技术、编码技术、实时传输技术、服务质量(QoS)保证技术、以及网络传输技术等。 1.信令技术 信令技术保证电话呼叫的顺利实现和话音质量,目前被广泛接受的VoIP控制信令体系包括ITU-T的H.323系列和IETF的会话初始化协议SIP。 ITU的H.323系列建议定义了在无业务质量保证的因特网或其它分组网络上多媒体通信的协议及其规程。H.323标准是局域网、广域网、Intranet和Internet上的多媒体提供技术基础保障。H.323是ITU-T有关多媒体通信的一个协议集,包括用于ISDN的H.320,用于B-ISDN的H.321和用于PSTN终端的H.324等建议。其编码机制,协议范围和基本操作类似于ISDN的Q.931信令协议的简化版本,并采用了比较传统的电路交换的方法。相关的协议包括用于控制的H.245,用于建立连接的H.225.0,用于大型会议的H.332,用于补充业务的H.450.1、H.450.2和H.450.3,有关安全的H.235,与电路交换业务互操作的H.246等。H.323提供设备之间、高层应用之间和提供商之间的互操作性。它不依赖于网络结构,独立于操作系统和硬件平台,支持多点功能、组播和带宽管理。H.323具备相当的灵活性,支持包含不同功能的节点之间的会议和不同网络之间的会议。H.323建议的多媒体会议系统中的信息流包括音频、视频、数据和控制信息。信息流采用H.225.0建议方式来打包和传送。 H.323呼叫建立过程涉及到三种信令:RAS(注册:Registration、许可:Admission和状态:Status)信令,H.225.0呼叫信令和H.245控制信令。其中RAS信令用来完成终端与网守之间的登记注册、授权许可、带宽改变、状态和脱离解除等过程;H.225.0呼叫信令用来建立两个终端之间的连接,这个信令使用Q.931消息来控制呼叫的建立和拆除,当系统中没有网守时,呼叫信令信道在呼叫涉及的两个终端之间打开;当系统中包括一个网守时,由网守决定在终端与网守之间或是在两个终端之间开辟呼叫信令信道;H.245控制信令用来传送终端到终端的控制消息,包括主从判别、能力交换、打开和关闭逻辑信道、模式参数请求、流控消息和通用命令与指令等。H.245控制信令信道建立于两个终端之间,或是一个终端与一个网守之间。 虽然H.323提供了窄带多媒体通信所需要的所有子协议,但H.323的控制协议非常复杂。此外,H.323不支持多点发送(Multicast)协议,只能采用多点控制单元(MCU)构成多点会议,因而同时只能支持有限的多点用户。H.323也不支持呼叫转移,且建立呼叫的时间比较长。 与H.323相反,SIP是一种比较简单的会话初始化协议。它不像H.323那样提供所有的通信协议,而是只提供会话或呼叫的建立与控制功能。SIP可以应用于多媒体会议、远程教学及Internet电话等领域。SIP既支持单点发送(Unicast)也支持多点发送,会话参加者和媒体种类可以随时加入一个已存在的会议。SIP可以用来呼叫人或机器设备,如呼叫一个媒体存储设备记录一个会议,或呼叫一个点播电视服务器向会议播放视频信号。 SIP是一种应用层协议,可以用UDP或TCP作为其传输协议。与H.323不同的是:SIP是一种基于文本的协议,用SIP规则资源定位语言描述(SIPUniformResource Locators),这样易于实现和调试,更重要的是灵活性和扩展性好。由于SIP仅作于初始化呼叫,而不是传输媒体数据,因而造成的附加传输代价也不大。SIP的URL甚至可以嵌入到web页或其它超文本链路中,用户只需用鼠标一点即可发出一个呼叫。与H.323相比,SIP还有建立呼叫快,支持传送电话号码的特点。 2.编码技术 话音压缩编码技术是IP电话技术的一个重要组成部分。目前,主要的编码技术有ITU-T 定义的G.729、G.723(G.723.1)等。其中G.729可将经过采样的64kbit/s话音以几乎不失真的质量压缩至8kbit/s。由于在分组交换网络中,业务质量不能得到很好保证,因而需要话音的编码具有一定的灵活性,即编码速率、编码尺度的可变可适应性。G.729原来是8kbit/s的话音编码标准,现在的工作范围扩展至6.4~11.8kbit/s,话音质量也在此范围内有一定的变化,但即使是6.4kbit/s,话音质量也还不错,因而很适合在VoIP系统中使用。G723.1采用5.3/6.3kbit/s双速率话音编码,其话音质量好,但是处理时延较大,它是目前已标准化的最低速率的话音编码算法。表1为G.723.1、G.729和G.729A的部分性能比较。 此外,静音检测技术和回声消除技术也是VoIP中十分关键的技术。静音检测技术可有效剔除静默信号,从而使话音信号的占用带宽进一步降低到3.5kbit/s左右;回声消除技术主要利用数字滤波器技术来消除对通话质量影响很大回声干扰,保证通话质量。这点在时延相对较大的IP分组网络中尤为重要。 3.实时传输技术 实时传输技术主要是采用实时传输协议RTP。RTP是提供端到端的包括音频在内的实时数据传送的协议。RTP包括数据和控制两部分,后者叫RTCP。RTP提供了时间标签和控制不同数据流同步特性的机制,可以让接收端重组发送端的数据包,可以提供接收端到多点发送组的服务质量包馈。 4.QoS保障技术 VoIP中主要采用资源预留协议(RSVP)以及进行服务质量监控的实时传输控制协议RTCP来避免网络拥塞,保障通话质量。 5.网络传输技术 VoIP中网络传输技术主要是TCP和UDP,此外还包括网关互联技术、路由选择技术、网络管理技术以及安全认证和计费技术等。由于实时传输协议RTP提供具有实时特征的、端到端的数据传输业务,因此VoIP中可用RTP来传送话音数据。在RTP报头中包含装载数据的标识符、序列号、时间戳以及传送监视等,通常RTP协议数据单元是用UDP分组来承载,而且为了尽量减少时延,话音净荷通常都很短。IP、UDP和RTP报头都按最小长度计算。VoIP话音分组开销很大,采用RTP协议的VoIP格式,在这种方式中将多路话音插入话音数据段中,这样提高了传输效率。 |