基于知识图谱的网络敏感文本分级方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zxw2yanzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化浪潮的到来,网络空间的安全与稳定显得尤为重要。但是,网络空间中存在各类各样的敏感信息,这些信息鼓动暴恐行为,宣扬民族分裂思想,甚至鼓吹推翻国家政权,对社会舆论控制和和谐社会构建产生了巨大的负面影响。因此,对这些不同敏感程度的敏感信息进行敏感性分级研究是有必要的。本课题在调研国内外敏感文本分级及过滤方法的基础上,结合现有的技术与算法,进行了基于知识图谱的网络敏感文本分级方法研究。本课题首先构建了面向网络敏感信息的知识图谱,整个构建过程包括数据集的爬取,实体及实体关系的抽取,知识融合和知识存储四个步骤;然后在已构建的知识图谱基础上计算敏感文本的敏感度值,文本敏感度值的计算是基于文本所包含敏感词的词频、词本身的敏感度等等信息,基于敏感信息知识图谱,添加了新的影响因子,它是根据敏感词实体在图谱中的属性计算得到的敏感因子,接着还引入了RIPPLENET框架,在其中设定以该敏感实体为中心的波纹集的大小,以得到敏感词实体集合中的存在的实体关系Sen值,从而将对敏感文本的分级层面从敏感词层面转化为语义分析层面;最后根据综合计算得到的敏感度值设定阙值进行文本的敏感级别分类。实验结果表明,与传统的以敏感词汇为粒度进行文本敏感性分级的方法相比,该方法可以有效提高敏感文本分级的准确率和全面性,特别针对敏感级别较高的敏感文本,准确率提高明显。
其他文献
天然蛋白质纤维的漂白,是染化技术工作者一向重视的专题。它既要求达到理想的白度,又要避免对纤维的过度损伤。虽然如此,传统的漂毛粉(低亚硫酸钠和焦磷酸钠的混合物)漂白法一直习为沿用,而对白度要求甚高或原色较重的漂白织物,需经繁复冗长的双漂、增白等多道工艺流程,但有时仍
期刊
超声振动搅拌摩擦焊(Ultrasonic Vibration Friction Stir Welding,UVFSW)是在常规搅拌摩擦焊(Friction Stir Welding,FSW)的基础上发展而来的,在搅拌头处复加轴向超声振动,利用超声振动的体积效应和表面效应,影响材料的微观组织结构以及表面间的接触状态,细化晶粒尺寸,提高焊接质量,同时还可以降低搅拌头所受载荷,增长搅拌头使用寿命。本文以
为了进一步促进我国海/陆空跨域协同技术的研究和发展,综述了无人机自主降落标识检测方法的国内外最新研究成果。首先,在分析视觉引导无人机自主降落流程的基础上,简要总结了常用的基于图像分割、基于分类器和基于深度学习的标识检测方法。然后,介绍了无人机自主降落于静平台和车辆、舰艇等动平台的国内外若干研究团队及成果,并对团队采用的降落标识及检测方法进行了梳理。最后,围绕动平台及复杂环境下的标识检测和相关软件算
聚乳酸(PLA)是目前最具发展前景的全生物可降解材料之一。针对聚乳酸材料力学性能和加工性能上的缺陷的解决方法,本文综述了聚乳酸与各种天然纤维材料、微纳米材料、生物可降解和石化基高分子材料等共混复合时,不同材料的相界面和相容性处理方法,并展望了PLA基复合材料的应用前景。
污水处理是解决水资源问题的关键一环。随着国家的重视和大量投入,我国污水处理事业蒸蒸日上、快速发展,但仍存在两方面问题制约着污水处理行业的可持续发展:运营管理难度大,且扩建改造时缺乏参考依据;运营管理依赖人工实践经验,导致管理模式粗放、运行成本偏高以及自动化程度较低。针对这些问题可从三方面着手:发现进水口水质(简称进水水质)规律,对未来进水水质进行长序列预测,为污水处理日常运营管理和水厂扩建改造提供
场景文本图片中文本的存在形式多种多样并且伴随着丰富的背景噪声干扰,这些问题使得场景文本识别(STR)任务依然充满挑战。目前领先的场景文本识别方法可以看成三个模块组成的:(1)将不规则的场景文本图片进行校正的预处理模块;(2)从矫正好的场景文本图片中提取特征序列的特征提取模块;(3)将图像特征序列转换为文本字符序列的特征翻译模块。本论文注意到目前的一些研究工作的注意力主要集中于优化预处理模块,如图像
学位
随着互联网的高速发展,产生了数量庞大的多媒体信息,对数据挖掘技术提出更高的要求。近似最近邻检索(Approximate Nearest Neighbor,ANN)作为数据挖掘中的一个基本问题也是热门问题,旨在从海量数据中快速检索到最相似的数据。但是随着数据维度的增长,传统的基于树的检索方法和基于哈希的检索方法的检索速度和精度,已经不能满足要求。目前基于图的检索方法有着不错的表现,但是仍存在索引构建
学位
无线电能传输技术(Wireless Power Transfer,WPT)的发展大大开拓了无线可充电传感器网络(Wireless Rechargeable Sensor Network,WRSN)的应用场景,例如环境监测、移动通信、医疗护理、交通物流等应用。其操作灵活性、用户友好性和产品耐用性的优势克服了传统有线充电的弊端,受到学术界和工业界的广泛关注。在传感器网络中,传感器主要负责数据采集、数据