网页内容安全快速信息抽取方法

来源 :信息网络安全 | 被引量 : 15次 | 上传用户:doublepay2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章提出一种基于静态网页特征的文本信息抽取方法。该方法首先根据静态网页的URL特征判断其是否是静态网页,然后根据静态网页的结构特征和内容特征对标题和正文文本内容进行抽取,再按照统一规范将结果顺序存储便于再处理。实验结果表明,网页内容信息抽取的查全率和查准率分别为96.2%和95.9%,该方法计算量小、抽取速度快、正确率高,可实际应用于大规模的网页内容安全分析。
其他文献
有人认为云计算是计算机发展的未来,是革命性的变化。也有人认为这是业界的概念炒作,让大型主机在互联网时代获得新生的商业手段,或者认为是某些公司创造的新话题。不管怎样,云计算逐渐升温并迅速成为各界讨论的热点,谷歌、微软、亚马逊等IT巨头积极构建其云计算服务体系。与此同时,政府、企业、研究机构纷纷采用云计算解决日益增长的计算和存储问题。云计算正快步向我们走来。本文阐述了云计算的概念和云计算的安全性等问题
通过对北京地铁某线标段的基坑开挖过程进行现场监测,研究分析该方案在实施过程中围护结构水平位移、钢支撑内力、桩体内力及桩土压力的分布和变化规律。研究表明:桩体位移变化
湿陷性黄土在遇水后会发生显著的附加变形,具有极低的承载力,是黄土隧道建设面临的严峻的工程地质问题。以太兴铁路湿陷性黄土隧道为研究对象,对施工期间钢拱架变形进行监测,
随着云技术的广泛应用,云计算和云存储的安全问题越来越引起关注。文章设计了一种支持存在性验证的云存储系统方案,对方案的运行流程和关键技术进行了分析,呈现了相关安全技术模型和算法公式表达,对方案的安全性、可信性和使用前景进行了总结。
宜昌地区水产技术推广站广泛开展应用技术的研究和推广服务,取得了较好的经济效益和社会效益。
江西省上犹县是赣南的一个山区县。民间虽早有稻田养鱼的习俗,但是长期以来,由于农民贫困和技术落后,这项传统的养鱼业发展很缓慢。随着党的富民政策在农村贯彻落实,又加上水产科
本文采用Zung1971年编制的焦虑自评量表(SAS)和自制的调查问卷对漳州师范学院学生的焦虑状况及引起焦虑情绪的原因进行了调查。结果显示:漳州师范学院有9.84%的学生有不同程度焦
为认真贯彻落实全国网络安全和信息化会议精神,推动信息安全等级保护工作深入开展。加强信息安全等级保护技术研究,6月27日~28日“第三届全国信息安全等级保护技术大会”在辽宁
首次采用桩锚支护+加筋土生态边坡联合支护技术,解决了深圳市十二橡树庄园高边坡支护的难题。在桩锚支护设计中首次提出并运用强桩弱锚的设计理念,确保了边坡的长期稳定性。阐述
结合哈大线软土地层桩基施工工程实例,对静态泥浆护壁湿式旋挖工艺在施工过程中遇到的问题进行了分析,并探讨了具体的解决办法和施工注意事项。