基于运营商大数据和深度学习的OTT终端识别技术的研究与实现

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:liujmjm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着家庭互联网的快速发展,电视服务进入了以互联网为载体的多终端多渠道的大视频消费升级周期。随着技术的不断创新,OTT智能终端已经成为家庭互联网的重要载体和流量入口,其具有很大的营销价值。运营商作为基础宽带的提供者,具有独特的家庭用户流量优势,通过终端维度对家庭互联网流量数据进行深入的分析挖掘和研究,洞悉家庭用户的行为偏好,掌握家庭互联网中用户的上网行为、流量特征,为优化、合理配置网络资源以及优化用户的上网体验等方面提供支持,从而调整自身视频业务的服务方式和内容。据此,本文提出了一种基于运营商大数据和深度学习的OTT终端识别方法。该方法解决了传统的终端识别方法中存在识别率低、效率低、出错率高的问题。针对此方法,本文的主要贡献和创新如下:1、本文结合DPI、正则匹配技术、分布式爬虫技术、Hadoop技术等来识别终端。利用DPI技术对数据包进行深度解析;利用高速正则匹配算法获取UA字符串;通过编写Hive中的自定义函数UDF来解析UA,得到终端型号;通过Trie字典树结构编写终端匹配程序来匹配终端型号与终端名称。实验结果表明,该方法可以更加快速和准确地识别终端,终端识别的准确率可以达到90%以上,相比传统方法有了很大的提升。2、利用分布式爬虫的相关技术获取电商网站上各终端型号的详细信息,将抓取到的详细信息进行存储,从而建立终端库,并对终端库的信息进行不断地更新和维护,以提高终端匹配的成功率。3、终端库信息一直在变化,人工更新终端库信息费时费力且容易出错,本文研究和分析CNN算法在分词识别方面的表现,提出一种利用深度学习对终端库进行自动更新的方法。
其他文献
阿卡人是哈尼族一个重要支系,主要分布于我国云南南部地区和邻近的东南亚国家,即西双版纳州,普洱市澜沧、孟连等县,和东南亚的泰国、缅甸、老挝、越南等地形成阿卡聚居区。《
数值模拟计算技术是研究牺牲阳极阴极保护效果的有效手段,采用边界元数值模拟分析软件对船体压载舱牺牲阳极阴极保护进行了数值模拟分析。结果表明,根据常规牺牲阳极设计,常规数
目的 观察光疗对高胆红素血症(以下称高胆)患儿血钙的影响。方法 对39例高胆患儿于光疗前后检测血清钙水平。结果 光疗前后血清钙水平对比差异有非常显著意义(P<0.01)。39例中有
目的 观察分析肠易激综合征患者的精神心理状况,以期为进一步针对性治疗提供参考。方法 选取2015年1月至2016年12月郑州市第八人民医院收治的73例肠易激综合征患者作为研究对
为了提高储罐与机泵操作的安全性,优化站库的自动化控制系统,可在液化石油气储罐与机泵上安装PLC,从而实现远程监控联锁保护系统的应用越来越广泛。本文对液化石油气储罐与机
康德以其独特的审美视角,把“普遍性”问题的讨论和“判断力”问题的讨论紧紧地结合在一起,对“普遍性”尤其是“主观普遍性”给出了经典论述。以著名的第三大批判《判断力批
经过多年建设,吉林省农民合作社得到了长足发展,但仍存在着许多因素影响并制约着其发展壮大。因此,为充分发挥农民合作社在增产、增效、增收方面的重要作用,吉林省应采取多种
0引言微量注射泵是临床医疗和生命科学研究中经常使用的一种可长时间进行均匀微量注射的仪器,其功能是将少量药液精确、微量、均匀、持续地泵入体内。其操作便捷、定时、定量,
哈佛大学是具有世界影响力的一流大学。在走向世界一流大学的改革过程中,哈佛大学对教师队伍的高度重视和富有创新性的举措,是其不断提高师资质量、赢得国际声誉的关键。梳理