・790・重庆邮电学院学报(自然科学版)第18卷
通信过程。
好qq号通过使用数据捕获和分析工具测试QQ分组发现,QQ登录过程或连接请求过程中数据包格式分为头部、内容和尾部3个部分,固定为:Ox02客户端版本命令序列号QQ号码内容0x03,可得知各字段长度。因此QQ会话具备一定的净荷特征,可根据起始和末尾净荷特征Ox02及0x03,通过DPI机制识别出QQ会话的分组。再根据请求登录令牌,识别出数据包第8至第11字节为主叫QQ号码,以标识一个QQ会话。并且通过测试QQ语音通信的交互过程,发现语音连接建立时,也具有起始和末尾净荷0x02/0x03的特征,之后,则采用类似SIP协议邙]的通信交互机制建立语音会话[6]。因此可以采用DPI机制和简单的协议分析技术来识别QQ的语音会话。净荷特征匹配串为“SIP/user—agent:Ten—cent—VQQ”,“SIP/reason=100’’等‘10|。
2QQ语音业务识别模型和算法
2.1QQ语音业务识别模型总体设计
本文中,我们设计了一种基于净荷检测和会话关联技术的QQ语音业务识别系统,其总体设计框架如
图1所示。从图1中可以看出,系统分为4个层面,从下往上依次是:数据采集层、协议分析层、流量识别(业务感知)层和QQ语音业务应用层。
图1QQ业务感知和QQ语音识别控制技术的总体框架
Fig.1
FrameworkofcontroltechniqueinQQsservicedetectionandvoiceidentification
(1)数据采集层。数据采集层面提供对于不同链路的数据采集或复制技术,如100/1000MFE,ATM,SDH不同速率的采集或复制技术,以保障数据完整、可靠地传送至上一层面(协议分析层)。
(2)协议分析层。协议分析层面将数据进行TCP/IP协议解析,并且向上层提供足够的IP分组头部和TCP/UDP的头部信息及必要的分组净荷信息,以满足上一层(流量识别层)对业务的识别和感知。
(3)流量识别(业务感知)层。流量识别层是整个架构的核心层,主要根据下层(协议分析层)提供的IP分组头部信息TCP/UDP的头部信息及其净荷信息等特征有效识别出QQ业务,匹配失
败的分组则丢弃。该层主要包含QQ会话识别算法和QQ语音会话关联算法。此外,还需采用合适的机制保障识别算法灵活适应QQ业务特征的变化。其算法