中文文本敏感信息自动校对方法研究

来源 :电脑与电信 | 被引量 : 0次 | 上传用户:jonquil1981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对海量文本内容中的敏感信息自动校对问题,提出了一种基于规则和SVM(支持向量机)相结合的敏感信息自动校对方法。以《新华社新闻信息报道中的禁用词和慎用词》和相关的中央文件与网络文本提供的重要敏感信息为依据,对敏感信息进行分类,针对不同的类别,构建分类处理规则库,设计相应的规则自动处理算法,实现敏感信息的自动校对,同时应用SVM模型对规则处理结果进行情感分析,大大减少了误报。测试结果显示,该方法的召回率为89.98%,准确率为98.31%,每秒处理10万字以上的文本内容,解决了实际工程应用中的关键难点问题。
其他文献
现有的翻译原则难以适用经贸外宣资料翻译,使现实中大量存在着的、具有重要意义的经贸外宣资料翻译无章可循。本文通过对经贸外宣资料语篇功能和翻译事例分析,提出经贸外宣资
白马湖作家群以夏丐尊、朱自清、丰子恺、叶圣陶、朱光潜、俞平伯为代表,这个群体既从事文学创作,又担任教师一职,还涉足编辑出版工作,在中国的文教领域留下了深刻的足迹。白
经过三十年的高速发展,我国经济进入新常态的发展模式。经济发展新常态下,经济高速发展所掩盖的环境恶化、社会矛盾堆积、经济结构发展不平衡等问题愈加凸显,这都成为了社会
功能性消化不良英文全名(Functional Dyspesia),临床上之表现会有上腹部的疼痛、胀满,嗳气,食欲低下,早饱,恶心,呕吐等症状,症状可持病发或是反复性发作上述等症状,一般界定
研究目的:本课题以寒热错杂型功能性消化不良患者为研究对象,观察胃康宁方的临床疗效及其安全性。研究方法:本课题源于中国中医科学院望京医院院内制剂。研究采用自身前后对照
对蜗尾型双桨推轮首次进行了线型研究和模型试验研究,给出了一种与常规蜗尾有很大差别、与正车舵+导管桨+倒车舵系统有良好匹配性能的新的蜗尾型推轮.推轮+驳队的模型阻力和
春潮涌动40年,砥砺奋进新时代。与改革开放同频共振,从创新发展一路走来。站在新起点,日照港集团以建设世界一流大港强港为目标,以党建创新为引领,以新企业文化为滋养,不断攻
党的十九大指出,人与自然是生命共同体,人类必须尊重自然、顺应自然、保护自然。“人与自然是生命共同体”的理念告诉我们,生态环境是人类生存最为基础的条件,是我国持续发展最为
报纸
研究目的:总结治疗乳腺增生病的中药外治法用药规律,观察中药外治法治疗乳腺增生病的疗效,从而为临床合理用药提供数据也为中药外治法治疗乳腺增生病疗效评价提供证据。研究方
中国正处于一个大力弘扬慈善的时代,虽然中国很早就开始使用“慈善”一词,但在当今语境中,我们究竞在何种意义上使用“慈善”一词?现代慈善又具有哪些区别于传统慈善的特征?这是很