互联网用户行为信息的数据挖掘技术研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:winston69
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今互联网技术发展速度越来越快,人们把互联网当成生活的一个重要部分,所以人们在互联网上的活动就更加频繁,频繁活动就意味着产生大量的互联网数据,人们在互联网上的行为意识通过这些数据反映出来。有些行为是有利于他人的,而有些行为是会产生危害的,所以互联网用户行为信息的掘取是关系到网络安全甚至国家安全的重要课题。本文目的是通过采集到的互联网用户行为信息进行掘取,进而发现危害网络安全或者国家安全的线索。本文结合国内外关于互联网用户行为信息的掘取相关技术以及网络数据侦查的经验加以研究总结,以采集到的互联网用户行为信息数据为源头,通过信息采集、中文分词、信息检索、数据挖掘等多种技术的处理,使线索高度清晰化。其中我们研究的内容涉及中文分词技术、检索技术和数据挖掘技术。文中提出一种网络数据多类型信息交叉检索模型,并实现了网络数据侦查的综合检索引擎。该模型以不同专业领域的信息特征,通过检索引擎进行联合搜索,最后能得到各种我们需要掌握的事件的线索。这种方式能够及时有效地构建业务模型,从而增强一些特殊部门的应急反应能力。最后,本文提出了一种以挖掘互联网行为信息的系统的设计方案,利用多种技术手段来实现对互联网文本信息的挖掘。这个方案的提出,不仅会提高一些特殊部门的工作效率,而且会拓宽他们获取线索的渠道,同时也为网络安全工作的提升做出巨大的贡献。
其他文献
汉字是人们用来表达意思、传承文化的工具,已走过五千多年的历史,它不仅是中华民族的瑰宝,更在世界文化艺术宝库中独放异彩。而字体作为汉字的外在表现形式,更是增强了其视觉
目前,核技术的应用日益广泛,给人类带来了巨大的经济利益。但是,与此同时,发生的核电站泄漏事故、工业核污染事故等等不仅仅给人类的身体健康造成伤害,还给人类赖以生存的自然环境
我国古镇旅游经历了探索、发展、成熟三个阶段,盲目开发导致处于成熟阶段的古镇旅游业开始出现游客量相对下滑的现象。本文首先对古镇旅游现象和存在问题进行推拉力分析以得
自改革开放以来,我国经济取得了空前发展。2000年自西部大开发领导小组的成立,标志着国家实施西部大开发的开始,十多年的发展,让西部各区有了较大变化。在2012年我国又制定了西部
中国作为一个农业大国,农业在整个国民经济发展中所占比重非常之大,农业的发展关系到整个国民经济的发展。中国有将近九亿的农民,如何保证这些人在社会主义现代化建设中能够
用3种不同强度与不同时间的静止磁场处理花椰菜种子后,对萌发的种子及植物幼苗的生理生化指标进行了测定,并对最终产量也进行了测定。结果表明,磁场处理种子后,种子及幼苗的
我国现有有效灌溉面积约占全国耕地面积的50% 左右,却生产全国80% 的粮食。但我国的水资源相对缺乏,农业用水供需不平衡,浪费严重,灌溉农业面临困境。我国的农田灌溉区存在诸多问题,解决
<正>成功的教育教学包括三个基本要素:课程、教学、评价,而评价是一种价值判断活动,是影响学生潜能开发和智能发展的关键,美术教育也概莫能外。美术是一种非语言性表达的艺术
串行传输技术具有更高的传输速率和更低的设计成本,被广泛应用于高速通信领域;研究了一种基于FPGA的LVDS高速数据传输系统方案,该方案以Altera FPGA芯片为核心,通过其LVDS I/
非霍奇金淋巴瘤(NHL)是血液系统恶性肿瘤中较为常见的一种类型。NHL常多发于青壮年,绝大多数为B细胞起源。研究发现在90%以上的B细胞性NHL细胞表面均表达有CD20抗原分子。由于该