基于测量的学术期刊网站仿冒行为特征分析及识别研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:wsx19810518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的快速发展与普及,给人们生活带来了极大的方便,网络上的交易也变得越来越频繁,同时也给网络犯罪提供了平台,利用网络钓鱼进行犯罪的现象迅速增加,不仅给人们造成了严重的经济损失,给社会的信任带来严重的挑战,还扰乱了网络秩序。近年,在网上输入任何一本期刊的刊名,搜索结果便会出现至少三到五个投稿网站,其搜索结果中只有一个真实的投稿网站,其余的都是假冒的投稿网站,而研究人员在学术期刊投稿网站上还没有设计出完整的反钓鱼检测技术。本文根据这一网络现象,在学术期刊网站检测这一领域,提出一种假冒学术期刊网站检测技术,来有效保护用户隐私,维护学术社区的秩序。本论文对国内外反钓鱼检测技术进行了研究与分析,结合学术期刊投稿网站的特征,提出了一种假冒学术期刊网站检测技术。本论文首先使用期刊刊名为关键词,通过搜索引擎爬取到所有真假学术期刊网站的URL,然后通过解析工具和Whois查询提取URL特征、网页内容特征和域名信息特征,对提取的特征量进行统计与分析,通过比较真假学术期刊网站各特征之间的区别,选取合适的特征值,并计算其特征值的权值,再利用SVM(Support Vector Machine)分类学习算法训练分类器,最后利用分类器对学术期刊投稿网站进行分类和鉴别。对于每个特征值在各真假网站中出现的频率有所不同,本文提出了一种更有效的方法替代了传统的布尔型值数型,通过计算每个特征值在真假网页中出现的频率后,赋予它们不同的权重,这样就可以很好的体现每个特征值在检测时的重要程度。实验表明,给每个特征值使用权重来标注比给每个特征值使用布尔型来标注的检测准确率要高。
其他文献
<正> 山水记,滥觞于《尚书·禹贡》,漫衍于《山海经》及《楚辞》、汉赋,蔚然于北魏的《水经注》。但与《水经注》同时出现的《文心雕龙》,却对这历史悠久的山水记并未论及,在肖统主编的文学总集《文选》里,也对它闭门不纳。形成这种有趣的文学现象,除了由于南比朝的北方文人学士以“经学”为圭臬,崇尚朴质学风、南方文人学士以“玄学”为依归,富于哲理探求所产生的不同影响外,主要原因则是由于“记体文”一向被认为是“纪事之文也”,“以善叙事为主”,不需要作者的“缘物起兴”,因而在南朝广泛开展的探讨文学观念的浪潮
从心理学的角度出发,对高校图书馆违章读者的心理进行了分析,提出应采取措施,帮助违章读者克服不良心理,减少文献损失,做好书刊管理工作。
目的:了解宁夏某儿童福利院20年救治的孤残儿童残疾状况及对他们实施医疗及康复治疗后的结果。方法:通过回顾性分析,统计自1996年至2015年20年所接收救治孤残儿童的残疾情况,
目的:观察欣母沛联合宫腔填纱治疗前置胎盘剖宫产术后出血的临床疗效。方法:选择前置胎盘剖宫产术后出血患者90例,采用随机数字表法分为对照组与研究组各45例。两组在给予缩宫
目的:观察全程无缝隙护理模式在高热惊厥患儿急诊救治中的应用效果。方法:选择急诊收治的114例高热惊厥患儿作为研究对象,采用随机数字表法将其分为对照组和观察组各57例。对
目的:探讨奥氮平与利培酮分别合并丙戊酸钠缓释片对精神分裂症兴奋躁动患者的疗效及生活质量的影响。方法:68例精神分裂症兴奋躁动的患者,随机分为奥氮平组和利培酮组,每组各34
目的:观察急性脑梗死患者采用阿替普酶静脉溶栓联合丁苯酞注射液治疗的疗效对其神经功能恢复的影响。方法:选取86例急性脑梗死患者,依照治疗方案不同分为对照组和观察组,各43例
广州话及其代表的粤方言是现代汉语各方言中和普通话差别较大的一种方言。除了语音之外,词汇方面和语法方面,尤其是语法方面还有着一些和普通话明显不同的地方。广州话及其代表
分析了中专读者图书馆读者服务工作中存在的问题,探讨了网络环境下图书馆读者服务工作的对策和措施。
针对现有图书馆管理软件实际使用中存在的问题,结合未来的发展趋势,为中小型图书馆选择管理软件提出有益的建议.