互联网内容分析系统的设计与实现

被引量 : 2次 | 上传用户:ymlazy63
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着当今互联网行业的蓬勃发展,网络内容及相关资源呈现碎片化和无序化,用户在网络中的行为和兴趣导向越来越难以捕捉,因此对于基础网络运营商来讲,如何正确合理地引导用户上网行为和监测网上内容导向已成为急需解决的首要任务。互联网内容分析系统(Internet Content Analyze,ICA)是针对给定URL(Uniform Resource Locator,统一资源定位符)进行识别与分类,还原用户上网场景的系统。通过互联网内容分析对DPI(Deep Packet Inspection,深度报文解析技术)的增强解析,可以提升用户上网行为识别的精度和粒度,为建设用户标签体系和精准画像提供数据支持,进一步支撑基于偏好和时机的精准营销和实时营销。本人在实习公司负责互联网内容分析系统的开发,系统主要包括九个功能模块,本人负责开发了上网场景识别、场景行为识别、场景内容识别、内容分类、输入输出模块、主被动模块识别、规则维护平台七个功能模块。主要技术包括Hadoop分布式处理的软件框架、MapReduce编程模型,URL识别、APP应用二次识别、高性能的解析引擎,其中规则维护平台是基于SpringMVC框架开发的,提高了维护规则库的效率,采用了 MyBatis持久化框架进行数据访问,采用Redis进行数据缓存。电信运营商为了保障自有业务的健康持续发展,以及减缓自身被管道化的进程,有效地复制互联网行业业务和内容营销模式,需要业务部门有针对性地了解用户对业务和内容的偏好,用户上网浏览内容的习惯等,为自有业务的改进和营销内容的更新提供有力的依据。目前系统已经上线,各部分功能运转良好,已经满足公司各部门的业务需要,极大的提高了各部门的工作效率。
其他文献
Li1+xV3O8具有比能量高,锂嵌入量大等优点,是一种非常有发展前途的锂离子电池的正极材料。但其电化学性能受合成工艺影响大,且循环寿命不佳。为此,本文采用三种固相烧结法合成了L
研究目的:构建适合我国国情的ICU谵妄非药物集束化预防干预策略,初步评价ICU谵妄非药物预防集束化干预策略的实施效果,验证该策略的实施,以期减少ICU谵妄的发生率,改善ICU患
本论文主要研究了超临界CO2萃取和超临界CO2抗溶剂结晶(SAS)分离和纯化天然产物有效成分。以超临界CO2为溶剂研究萃取柚子鲜花挥发成分,论证萃取的可行性,优化超临界CO2萃取的工
知名形象的商品化已经成为商业活动中的普遍现象,如处处可见的明星代言,在给名人和商家带来巨大的商业利益的同时,也引起了很多纠纷。而在我国,对知名形象商品化相关权益的保
党的十八大报告提出:“要创新基层党建工作,夯实党执政的组织基础”。基层党组织是党在军队全部工作和战斗力的基础,是推动基层建设科学建设的核心。创新部队基层党建工作,不仅事
报纸
党和国家历来重视革命精神的教育和传承。中国革命精神是中国精神的重要组成部分,是中华民族伟大复兴的精神动力之一。目前,学术界对中国革命精神进行了较为全面深入的研究,
高速的城镇化建设引发很多城市环境问题,例如热岛效应,景观要素的微气候调节上的应用逐渐引起学术界的关注。建造屋顶花园成为解决这一问题的主要方法之一。屋顶花园环境的热
王小波是中国当代文坛上极富个性和生命力的作家,他的小说创作充满后现代意味,为所有拥有自由意志的个体生命建构了一个个想象奇绝、色调浓丽、奇情魔幻的大千世界。历史书写
太阳能是地球上丰富、清洁的可持续绿色能源,半导体光催化技术在治理环境污染和解决能源危机方面引起了研究者们的广泛关注。二氧化钛是研究最为广泛的一种半导体光催化剂,具
中红外相干光源在光谱学、遥感、生物和医疗以及军事等诸多领域都有重要的应用前景和价值,而掺铒氟化物光纤(ZBLAN)激光器是实现2.7 mm中红外激光输出的有效途径之一。综述了