【摘 要】
:
近年来,高校内图书馆资源恶意下载频发,电子资源商一旦发现恶意下载,将立即停止违规IP/IP段的使用权限,使得高校内所有用户无法正常使用电子资源库,严重影响高校中正常用户的使用。因此展开对图书馆资源恶意下载检测的研究具有重要的研究意义。目前,各大高校已根据自身情况对文献下载流量统计与监控进行了研究,大多通过对异常流量、过高下载频率、异常访问请求内容的监控分析判断恶意下载,存在模糊定量、无法精确判断、
论文部分内容阅读
近年来,高校内图书馆资源恶意下载频发,电子资源商一旦发现恶意下载,将立即停止违规IP/IP段的使用权限,使得高校内所有用户无法正常使用电子资源库,严重影响高校中正常用户的使用。因此展开对图书馆资源恶意下载检测的研究具有重要的研究意义。目前,各大高校已根据自身情况对文献下载流量统计与监控进行了研究,大多通过对异常流量、过高下载频率、异常访问请求内容的监控分析判断恶意下载,存在模糊定量、无法精确判断、误判率较高等问题,且对现有的具有伪装能力的低速随机时间间隔爬虫来说不起作用。另外,目前的恶意下载检测均基于IP进行检测,面对校园NAT环境及IP伪造技术时无法识别恶意下载用户真实身份。为解决以上问题,本论文针对图书馆场景,提出一种基于滑动事件窗口的恶意下载检测的算法,将文本内容上的主题相关性作为恶意下载检测依据,利用滑动事件窗口实现检测的随机性,使用聚类算法进行主题聚类,从而进行恶意下载检测。基于所提出的恶意下载检测算法,本研究设计并实现一套图书馆资源恶意下载检测系统。系统利用图书馆资源主题数据收集模块获取用户文献下载请求信息与相关标题或摘要;通过[IP→账号]映射模块与用户账号信息进行关联;在用户行为数据处理模块中提取摘要主题句,统一规范数据,并根据用户账号构建滑动事件窗口;在恶意下载检测模块中通过聚类分析窗口内请求的主题相关性,从而进行恶意下载检测;最后将恶意下载用户信息推送至外部系统,实现告警效果。系统部署在某高校图书馆环境中进行了测试,结果表明,该系统能在传统的基于特征的检测手段上,进一步根据用户请求的主题相关性进行恶意下载检测,对低速的随机时间间隔爬虫具有良好的识别效果。
其他文献
<正>从哲学上讲,形式是内容的存在和表现方式。同样,开会、发文也是作决策、抓落实的重要方法,痕迹管理更是监督考核的有效手段。但正如马克思讲的,"如果形式不是内容的形式,
铜陵有色金属集团公司主要生产矿井开采的主要金属元素为铜,伴生金、银、铁、硫、砷等元素,对于厚大矿体采用大直径深孔高阶段空场嗣后充填法、扇形中深孔阶段空场嗣后充填法,小
目前市场上大部分通信软件跨平台性差、跨终端性差,如腾讯QQ、微信、Skype等,而且这些软件采用的都是私有协议。本文设计并实现了一种基于WebRTC技术的Web端的音视频通信,WebRTC
白条芫菁主要为害大豆,为害辣椒国内外很少有报道.笔者近年在陕西省岐山县马江辣椒试验基地辣椒苗床及中期大田里发现了白条芫菁.该虫属鞘翅目芫菁科,其成虫为害辣椒叶和花瓣
本文报道了吉林省大豆害虫113种,它们隶属于2目,20科。并对它们的种类组成名录以及在吉林省的分布情况做了详细报道。
文化是构建国家形象认同的一条快速通道。在现阶段,我国独特的“国家成长性”注定了在未来很长一段时间内都将作为世界关注的焦点。在世界文化传播与交流中,常常会看到中国制造
<正>股市赚钱了!相信绝大多数股民均是如此。是不是该从股市中撤出一部分资金来做别的事情,比如买房?这当然得根据实际需求来具体确定。如果是一位尚在租房过程中的股民,从股
在我国尚处于尝试阶段的“数学问题解决教学模式”的应用现状其实并不理想,初中数学教师在问题解决教学模式中应遵循创设情境、积极推进、突出过程、分组学习、强化交流等有
文章对西欧中古天主教会的经济伦理及其实践活动进行了动态的考察和实证分析,认为随着12-13世纪西欧社会经济条件的变化,原来与西欧社会状况相适应的天主教教义及其经济实践
本发明提供一种煤制油有机废水的处理方法,该处理方法包括以下步骤:将含烃气体和煤制油有机废水的原水经过预热后分别通过饱和塔的下部和上部送人饱和塔,在饱和塔中实现含烃气体