【摘 要】
:
该文的工作主要集中在对包含有特殊信息内容的文本,进行的有害度评测上.参考以往文本过滤系统所采用的技术,我们发现在这个特定领域,特殊应用上,它们有明显的不足之处.该文根
论文部分内容阅读
该文的工作主要集中在对包含有特殊信息内容的文本,进行的有害度评测上.参考以往文本过滤系统所采用的技术,我们发现在这个特定领域,特殊应用上,它们有明显的不足之处.该文根据网络中文信息中有害内容的特点,提出了通过机器学习识别特定内容的新方法.该方法通过对训练语料的归纳学习,获得作为系统知识的词性转移表.在对实际的中文信息文本进行有害度评测时,基于关键词的读音匹配原则,并依据系统知识得到评测值,以此来考查真实文本中匹配上的关键词与语料中学习到的同一关键词在上下文搭配规则的相似程度,如果该评测值超过预定的阈值,则将其屏蔽.我们以此为基础,开发了一个实验性的系统.实验结果表明,包括中文网页的关键词识别模块、基于词性转移表的真实文本的判定模块,均达到了比较理想的效果.
其他文献
目前数字图书馆的元数据一般是由图书馆界专家结合领域的知识制定的,该文利用建模方法从一个全新的角度对主题数字图书馆中元数据的构建问题进行研究.结合科技部《敦煌学数字
随着Internet的迅速发展,网络安全变得日益重要,该论文主要探讨了网络系统底层WinPcap数据包俘获的体系结构和数据包分析的应用,对协议信息内容进行分析,以及研究入侵检测.作
知识工程是人工智能学科的重要研究领域,知识共享和重用是知识工程研究的主要问题,而本体是解决这一问题的有效方法.近几年本体已经成为计算机领域的研究热点,主要研究本体表
该课题采用高速CPU芯片和嵌入式软件技术解决了用户计算机和隔离器之间的网络通信问题.采用虚拟双硬盘技术用软件解决了单硬盘的分区隔离问题,实现了用单硬盘来代替双硬盘完
作为J2EE(Java 2 Platform Enterprise Edition)应用服务器重要组成部分的分布事务管理器遵循JTS(Java Transaction Service)和JTA(Java Transaction API)规范,提供J2EE分布计
该课题采用B/S多层软件的结构,实现高速公路收费系统的各子功能,通过WEB系统来实现收费系统的网络管理.该论文的第一章介绍了课题的背景及B/S软件结构的基本概念,以及多层软
近年来,随着互联网的发展,移动互联网、物联网的普及,可探测和采集的数据急剧增加。随着数据量的增加,人们开始认识到蕴含在数据中巨大的财富,并开始以各种形式挖掘、开采,数据渗透
该文对ME部件的设计分为四部分:图像组控制器、运算部件、控制部件和后处理部件.该文采用一种封闭的图像组格式,由图像组控制器实现对其控制.采用脉动阵列做为运算单元,在课
本文首先分析了传统分布式计算技术CORBA、DCOM和RMI的特点,揭示了其固有的不足及缺陷:都不太适合于在Internet这样松散耦合、异构的、有防火墙的网络环境下进行电子商务应用系
该文所做的工作是国家863科研项目—构件化嵌入式操作系统及其开发环境研制的一部分.目标是设计并实现一个构件化、嵌入式的TCP/IP协议栈JBEIP.该文的重点是如何使协议栈满足