基于文本信息的数据挖掘

来源 :河南科技大学 | 被引量 : 0次 | 上传用户:quchaolove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文通过研究数据挖掘以及文本挖掘技术的思想,建立了中文文本挖掘模型,提出了基于文本信息的数据挖掘体系结构.利用网络底层信息获取技术进行BBS和Email数据包的截获,通过对截获的数据包相关协议的分析,实现了文本挖掘的源信息采集;根据中文词的特点,把设立切分标志法与词相关性分析相结合,对中文文本进行分词预处理:采用向量空间模型和TFIDF公式实现了文本信息的结构化表示;使用分类分析法,对结构化文本信息进行分类,得到文本挖掘的分类结果.最后,将文本挖掘所获得的知识应用于网络信息过滤中,即:把知识的特定信息域和分类特征向量作为信息过滤的规则,对网络中Email和BBS文本信息进行过滤,解决了网络服务中存在大量不良信息的问题. 该文从理论探讨和应用系统实现两个角度对文本挖掘技术进行了深入研究,给出完整、可行的知识获取方法,满足了网络信息过滤的需要.实践应用表明:将文本挖掘技术应用于解决网络不良信息问题是一次成功的探索和研究,具有较好的应用价值.
其他文献
该文在讨论了操作系统的安全性之后,研究如何增强日志系统的安全性,提出对日志记录进行逐条加密的方法.接着分析了中科安胜安全操作系统(SecLinux)的审计部分.最后介绍了SQY1
移动社区发现作为移动网络分析的核心问题,有助于解决移动用户需求的个性化问题。近些年来社区发现方面的研究在生物学、社会学、物理学、计算机以及移动等领域得到广泛应用
嵌入式技术和无线技术的发展带来了网络服务的迅速普及。这个趋势将导致计算环境和计算模式的变更。可以预见,未来人类的生存环境中服务无处不在,而事务处理和计算将表现为一系
电子商务中的传输信息安全问题是电子商务安全问题的一个重要方面,为了更深刻地研究这个问题,作者利用了XML在信息交换和信息定义上的优势、参考了一些已存在的用于解决安全
随着机器人相关技术以及交叉学科研究的不断加深,机器人技术有了很大的提升,与此同时,机器人应用领域也得到了不断的扩展,未来也将在物联网中发挥重要的作用。然而机器人方向
Web应用服务器为开发、部署、运行、集成、维护和管理中间层应用服务提供一个通用运行环境。而为了提高应用服务器EJB访问的效率,节省系统资源和提升整个系统的可伸缩性,需要对
该文详细研究了服务器端组件体系结构EJB架构的特性,和越来越受关注的可用于提高软件质量的设计模式,以广东省政协办公厅管理信息系统项目开发为研究背景,研究探讨了如何在基
该文系统的介绍了数据流挖掘的实现算法DTCTC-基于聚类和决策树的数据流挖掘方法.DTCTC结合数据流的聚类和决策树算法,首先对数据流进行聚类处理,控制数据输出的速度,并得到
该文通过构造介于集成视图和底层数据源模式之间的一种形式——源模式的XML视图的方法,来实现查询转换和结果组装.首先将完整性约束引入到XML数据中,给出了关键元素和元素函
该论文是"国土资源大调查"项目"矿产资源GIS评价系统"(简称MRAS)的组成部分.该论文在讨论重磁数据处理的基本原理、工作方法和科学计算可视化的数据类型、处理流程的基础上,