一种基于大数据的VoIP音频溯源方法的研究与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:zhuzhugugulili
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,网络电话VoIP凭借建设成本低、功能强大、通信费用低廉、使用方便等优点得到了快速的发展。而针对VoIP电话的追踪技术却相对滞后,这使得VoIP电话成为金融诈骗等犯罪活动的新媒介。大数据时代的到来为溯源研究提供了新思路,VoIP溯源变成一个数据驱动可解决问题。语音特征是诈骗者较难控制篡改的信息,在数据量足够大的情况下,大数据分析技术使得研究者仅需收集这些数据,即可在一定程度上发现VoIP电话的真实来源。本文针对以上问题,提出了基于大数据技术实现VoIP音频溯源的完整方案。本文提出了一种利用SVM、随机森林和神经网络的VoIP溯源方法。首先,提取和筛选音频携带的网络特征及音频本身蕴含的与地理位置相关的特征,然后结合本文提出的基于LSTM神经网络的隐式特征,训练VoIP溯源分类器,用于识别VoIP电话经过的基础设施和网络路径,预测新的呼叫的来源。本文的研究对象是基于SIP协议的VoIP电话。本文设计的VoIP溯源方法包括网络监听、数据包解析、特征工程特征优化、VoIP溯源模型训练以及结果分析五个步骤。其中,研究的重点是音频特征向量的构造。模型选择上,综合考虑样本数据类型、样本容量、特征维度、是否线性可分等因素,选取支持向量机和随机森林模型作为VoIP溯源模型;特征工程上,本文挖掘和优化特征向量,由提取的音频基础特征和二阶动态差分特征,改进到基于森林模型筛选出贡献度最高的音频特征。更进一步,本文提出了基于LSTM神经网络细胞单元学习输出的隐式特征,引入时间序列的关系,去掉模型的全连接层,获得神经网络细胞学习输出的隐式特征,与贡献度最高的特征结合,构造VoIP溯源音频特征向量。通过训练SVM和随机森林非线性分类器,在VoIP溯源的问题上,得到了较好的效果,溯源效果F1值最高达到91.9%。另外,本文设计两种实验场景单人多地场景和多人多地场景采集呼叫数据,以模拟真实世界的VoIP电话数据。将本文设计的VoIP溯源方法应用到上述两种场景,实验验证分别得到VoIP溯源93.8%和84.8%的准确率。
其他文献
突如其来的新冠疫情给我国各行各业造成了不同程度的影响,其中给教育行业更是带来了不小的损失,尤其是校外教培企业或机构。在教育部提出“停课不停学”的应对措施后,教育企业为
牛食道阻塞,多由于饲养管理不当,饲料贮存保管散乱或进食时受到惊吓,有的是由于盗食未经粉碎的块根及块茎饲料造成的。笔者在多年的临床实践中,在传统治疗牛食道阻塞方法的基础上
科技资源整合对于提高我国科技资源利用效率,推动科技进步具有重要的战略意义.分析科技计划在科技资源整合中的作用,并通过对国内外大量科技计划案例的调查,分析研究利用科技
1 品种选择  可选用的品种很多,一般常选用的品种有佳粉15、中杂9号、中杂11号、中杂101、毛T5、金棚1号、合作908、卡依罗、R-144等.
葡萄白腐病又称腐烂病,俗称“水烂”、“烂穗”,是危害葡萄的重要病害之一。该病主要危害果实、穗轴、果梗、枝蔓和叶片,尤其8~9月份果实成熟期果穗发病最重。一般年份损失10%~15%,重
通过对科技评价现状以及科技项目特殊性的分析,提出现实要求必须选取一个更加客观的标准和评价方法来对科技项目进行评价,并实现对科技项目更加有效的监督和管理.考察各种投
德国教育学家第斯多惠说:“教学的艺术不在于传授的本领,而在于激励、鼓励。”笔者多年从事职校数学教学工作,深深了解到职校的学生在数学学习中多数基础差,对相对单调的数学
随着装备研制技术不断的完善,技术状态管理也越来越重要。技术状态就是在技术文件中规定的并且在产品中达到的功能特性和物理特性。为了满足军事电子装备企业技术状态管理需
红富士苹果以其个大、质优、丰产、耐贮,自从日本引进以来,迅速在我国各地推广,现在早已成为我国各苹果主要产区的主栽品种。红富士苹果果实色红,且色彩艳丽,外形美观,深受广大消费
1黑粉病1.1典型症状。感染黑粉病的组织生成大小不等的瘤状物,直径1~18cm,病瘤表面呈白色、灰色或褐色,发病初期瘤表面包围发亮薄膜,薄膜破裂后散发出黑色粉末。叶片感染黑粉