面向信息内容安全的文本过滤系统研究

来源 :全国第六届计算语言学联合学术会议 | 被引量 : 0次 | 上传用户:li_qinglong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文设计并实现了一个面向信息内容安全的汉语文本过滤器.该系统能够通过对正例、反例的学习,来提高自身的过滤性能.并给出了一个过滤器阈值选择的算法,使阈值的选择更为合理.详细描述了能够实现高效过滤的数据结构.最后给出了对大规模网页进行过滤的实验结果.
其他文献
城市化的快速发展,带动了高速公路的建设发展,机电通信系统作为高速公路现代化的一个重要标志,在保证高速公路安全、经济、顺畅上具有重要作用。论文简单分析了高速公路机电通信
随着我国社会的发展,我国建筑行业也发展起来,房子的高度也在不断增加,要求房子的结构越来越严格。我国以前用的建筑材料是普通的板子,现在用的建筑材料是现浇混凝土板。这种材料
城市规划属于公共决策,只有保证公众有效参与才能实现城市规划的价值,公众参与城市规划的制度建设可以提高城市公共决策的民主性和合理性,并且得到了全社会人民群众的认可,国家政
在汉日韩英多语机译系统的研制中,我们设计并实现了一个独立于源语言的通用英语生成器,本文主要介绍了通用英语生成器的句法依存结构描述、词汇复杂特征集及生成策略.
有导文本分类是指在给定的分类体系下,通过对训练语料的学习对每个类建立特征向量以表示该类,然后对每一个新的文本自动确定其类别的过程.本文介绍的文本分类的目的不是按专
会议
当前,随着我国经济社会的发展,城乡一体化进程不断加快.然而,紧跟着城乡建设的不断发展,城乡规划建设中也出现了一系列的问题,对城乡发展产生重大的影响.本文对城乡规划进行
意义段划分是自动文摘系统中文本结构分析阶段所要解决的一个重要问题.对有子标题的文章,本文总结了中文文章的各种子标题模式,根据标题进行意义段划分.对无子标题的文章,则
作为智能信息检索的一个分支,基于概念的信息过滤技术从语义级进行过滤文档和用户模型的匹配.本文对基于概念的信息过滤模型进行了描述,介绍了概念层的功能和构造方法,提出了
本文提出基于统计的文本分类特征词的自动提取方法,使特征词反映文本分类的类别特征,系统能通过自学习完善分类特征关键词;同时本文探讨模糊文本自动分类模型,提出一种模糊文
城市建设的进一步发展限制了地面空间的利用,因此往往修建地下室,而随着我国经济的迅猛发展及国家人防政策的颁布,基于平战结合功能的人防地下室,已逐步成为现代化社区发展必不可