互联网新闻敏感信息识别方法的研究

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:m116730647
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
敏感信息识别是净化互联网环境的关键,在当今信息爆炸的时代,人们每天都要从互联网中获得大量信息,如何过滤大量信息中的敏感信息对整个社会安定和谐有着重要的意义.现有的方法主要是基于敏感关键词的方法进行过滤,需要不断更新迭代敏感关键词,泛化性弱,本文中使用基于预训练模型的深度学习方法可以学习到互联网新闻文本中更深层的语义信息,进而更有效的识别和过滤敏感信息,泛化性强,但是只使用深度学习方法会一定程度上的损失敏感关键词特征.本文首次将传统的敏感关键词方法与深度学习方法相结合应用于互联网敏感信息识别,提出了一种融合敏感关键词特征的模型Mer-Hi-Bert.实验结果表明,与之前的敏感关键词方法以及深度学习模型相比,模型的性能有进一步提高.
其他文献
“我来自少数民族,从小是在党和政府民族政策的关怀下成长起来的。现在我在事业上有所成绩,真的是抱着一种很朴素的感恩之心,想要报效国家、回报社会。”“中国第一考”的司
2009年末以来,青岛银行便驶向了资产规模快速发展的快车道,在2010年存款规模连破400亿元、500亿元的基础上,2011年6月更是突破了600亿元大关。在制订了“服务地方经济、服务
粉末材料的微波耗散机理不同于块状材料,非磁性的金属与氧化物混合粉末展现出对微波磁场较强的吸收特性.本文针对金属与氧化物混合粉末的电导率和微波磁吸收特性开展研究,并
1956年初夏的一天,空4师12团领航副主任吴克明接到师司令部的通知,“立即返回部队”。吴克明回到鞍山,副师长李永泰亲自找他谈话说:“上级指示,要调你去飞机工厂搞试飞”。这
从教小学语文二十多年的我,教过一批批学生,改过一摞摞作文,见得最多的是“乏味作文”“抄袭作文”,造成这种现象根源在于教师引导不当,因此,我在作文教学中十分注重加强以下几个方
20世纪20年代陶行知发起《中华教育改进社改造全国乡村教育宣言》,倡导“生活即教育,教学做合一”的理念,在教育救国的旗帜下拉开了演绎“知行合一”的序幕。一批有志报国的
根据健康教育和运动人体科学的特点,采取合理的渗透途径和方法,将运动人体科学各学科和健康教育在教学中相互融合,既有利于加深学生对运动人体科学教学内容的理解,又能使学生
无人机是一种典型的依靠通信和控制系统实现自主飞行的信息物理系统,在安全性和可靠性方面引起了广泛的关注.本文考虑无人机传感器易受网络攻击问题,充分利用数据的时间相关性,提出了针对无人机传感器数据的异常检测模型.首先采用LSTM神经网络对传感器数据进行预测,再将预测值与实际值做差,并将差值输入LSTM分类器进行训练得到包含正样本的超平面,最后计算测试数据到超平面的距离函数值,根据其正负判定异常与否.并
随着我国地铁建设的发展,多功能自动监测系统的重要性不断凸显出来。由于地铁建设与运营对自动监测的要求越来越高,为避免监测对施工、运营的影响,文章提出了基于全站仪自动监测系统的构建方法,并研究了该方法在地铁监测中的应用,对保证地铁施工和运营安全具有重要的意义。
报告主题:本土化鲜明在这13个省会城市所作的工作报告当中,各地结合发展显著特点和区位优势提出了最具本地特色的主题和指导思想。郑州依托中原经济区上升为国家战略这一契机