基于概念网的不良信息过滤研究与实现

被引量 : 0次 | 上传用户:wujun33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,各种不良信息(反动、色情、暴力等)在互联网上的传播也越来越毫无节制;同时,由于新兴的WEB2.0,Blog和P2P等技术的发展,使得以往的基于信息源,网站的分级标注,URL管理等互联网监管技术面临着新的挑战,通过以上的这些技术对信息发布者发布的内容进行监控变得越来越困难,一个可行的办法就是通过对发布者发布的内容进行监管,这样就可以解决以往监管方案的弊端,这就是基于内容的网络监管的出发点。概念是事物本质特征的概括和抽象,相比于词语而言,具有更高的抽象性。一个概念可以对应于一个词语,也可以对应于若干个词语;概念网则是由概念构成的网络结构,由概念节点和概念之间的关系组成。通过概念网来对文本内容进行表示,可以从语义角度对文本进行理解。本文介绍了一种针对不良文本过滤的概念网的实现和过滤方法。根据不良文本的特点,提出了一种用二元词组来表示概念的方法,并用模糊集隶属度来表示概念的相关度,进而提出了两种概念提取的方法;并在此基础之上构建了一种递归性质的概念网结构,它是通过对概念进行聚合而成的三层概念模型,每一层的概念都是由下层概念聚合而成。同时根据这种概念网的特点设计了一种过滤算法,该过滤算法能够对待过滤文本进行概念推理,推理是一个对概念节点的性质进行判断的过程,根据推理的结果判断该文本是否应当被过滤,实验表明该方法具有判决速度快,准确率高的特点。
其他文献
目的:观察中西医结合治疗眼部带状疱疹的临床疗效。方法:70例眼部带状疱疹患者按就诊时间先后顺序编号,采用随机数字表法分为对照组和观察组。对照组采用更昔洛韦5.0 mg·kg-
随着时代的发展,人民的生活水平也越来越高,衣、食、住、行等各个方面都有很高的要求,尤其对于居住条件更是注重,当今社会还在大力提倡节能环保。因此,住的舒适、安全、环保
开展电力用户负荷特性分析可以帮助供电企业获得其负荷需求变化的知识,对于企业负荷预测、需求侧管理、以及改进电价目录都有重要意义。针对某电力公司大用户实际负荷曲线数
为了抑制电动静液压作动器(EHA)主动悬架作动器输出主动力的脉动,改善车辆的动态性能,提出了一种EHA主动悬架双滑模控制策略.建立了EHA主动悬架动力学模型,设计了基于模型参
通过分析新《大学英语课程教学要求》对大学英语教学评估的要求,以及新时期大学英语教学评估的指导思想,指出新课程要求下的大学英语教学评估应该注重形成性评估与终结性评估
今天,人们广泛讨论的是新经济,是信息产业这样时髦的话题,而重化工业则被称之为夕阳产业,一些人基本否定了重化工业发展阶段的客观存在与继续发展的必然性。由此,本文探讨了日本重
称谓语作为一个重要的语言现象,一直以来都是社会语言学研究的一个重点。称谓语的选择充分体现了人际关系中的“权势”与“同等关系”等社会关系。女性称谓是称谓语当中的一个
“语法化”概念是由法国语言学家Meillet在20世纪初首次提出。总的来说,迄今为止的语法化研究主要可以分为两大学派:生成主义的语法化研究和功能主义的语法化研究。这两大学派
本文首先对次恩丁村纳西语进行了实地田野调查,进而从语音、词汇和语法三个方面加以描述。同时,通过与和即仁(1985)、姜竹仪(1993)等学者的学术观点进行了简要比较,发现次恩
中国古代建筑历史悠久,从最早陕西半坡遗址的浅穴式房屋,到唐代大明宫,再到明清两代的故宫,无不体现出中国古建筑在功能与组合上的独特创造力。四合院的产生满足了建筑的多种