基于朴素贝叶斯方法的自动文本分类系统的实现

来源 :第十九届全国数据库学术会议 | 被引量 : 0次 | 上传用户：amenking34875627

【摘要】

：

随着Internet的飞速发展,互联网上信息量也以爆炸式的速度迅速增长.因此,合理和有效地对各类海量数字信息进行组织、检索、访问、利用,已成为数字图书馆这一新兴研究领域的中

【作者】

：

任美睿李建中杨艳

【机构】

：

黑龙江大学计算机科学技术学院,哈尔滨,150080

【出处】

：

第十九届全国数据库学术会议

【发表日期】

：

2002年期

【关键词】

：

朴素贝叶斯方法数字图书馆文本分类系统海量数字信息自动分类增长研究领域文本信息信息量计算机互联网爆炸式组织中心检索存储

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着Internet的飞速发展,互联网上信息量也以爆炸式的速度迅速增长.因此,合理和有效地对各类海量数字信息进行组织、检索、访问、利用,已成为数字图书馆这一新兴研究领域的中心问题.随着数字图书馆的发展,特别是在计算机中存储的大量文本信息的迅速增长,使得文本自动分类成为现实的迫切要求.本文分析了基于朴素贝叶斯方法的自动文本分类系统的实现.

其他文献

并行文本数据库中基于代价的查询优化模型

本文提出一种应用于并行文本数据库的查询优化算法。由于求解并行文本数据库的最优的查询计划方案是NP问题，因此本文提出的是一种近似算法。该方法充分利用了我们的并行文本数

会议

并行文本数据库查询优化算法贪心算法近似算法计划方案方法查询结果应用求解基础递归传输操作

度量空间中索引方法的研究

本文提出了一种新的索引技术，它是对M-tree的改进，基于距离和关键维进行索引，旨在提高过滤效率，减少距离计算次数和I/O操作次数。提出了相应的索引结构，建树过程，溢出分裂技术，查询

会议

度量空间索引技术性能分析索引结构算法描述设计思想距离计算基于距离过滤效率分裂技术查询技术关键维溢出操作

R树配合二次精炼策略实现空间数据索引

本文在过滤一精炼策略的基础上，提出二次精炼策略。该策略将精炼分为两个步骤:首先使用一个简单的几何逻辑对过滤之后的候选集进行初步精炼;然后对初步精炼之后的剩余空间对象

会议

二次精炼策略实现空间对象计算复杂性过滤存储空间候选集边界框性能逻辑几何集合基础

一种改进的检测重复记录的方法

数据集成中很重要的一个问题就是检测重复元组,重复指的是对于同一数据,存在两个或多个相同的元组.数据集成的一个很重要的功能就是尽可能地将那些重复记录剔除掉.本文则介绍

会议

检测重复记录数据集成测重功能方法

主存数据库的一种高速缓存敏感性索引结构--CST树

主存数据库的应用越来越广泛.但由于计算机CPU和内存的速度差在日益增大,因此人们在内存和CPU之间增加了一层缓存层--高速缓存.主存数据库的索引结构就必须要考虑高速缓存的

会议

一种嵌套事务并发控制的改进策略

本文在乐观并发控制基础上提出一种改进的方法。它的中心思想是:父事务按照同步方式触发子事务，即在子事务触发执行时，父事务处于等待状态，直到子事务执行完成，根事务提交的最终

会议

事务并发控制子事务事务提交乐观并发控制物理数据库最终结果等待状态中心思想同步方式嵌套事务副本触发执行基础方法

利用高维索引实现关系数据库的向量连接运算

本文给出了一种利用高维索引优化向量连接实现的方法.该算法通过限制一个元组只和那些可能与之满足连接条件的元组进行比较，大大减少了连接过程中的比较次数。本文算法对高维

会议

高维索引关系数据库优化向量连接运算索引算法资源环境执行效率连接条件连接过程辅助结构参数可调数据表实验粒度方法

基于免疫思想的入侵检测研究

本文介绍了基于免疫的入侵检测系统和一些国外学者基于免疫提出的入侵检测系统模型，并分析了基于免疫的入侵检测系统的优点.基于免疫的入侵检测系统借鉴了生物体的免疫系统的

会议

免疫思想入侵检测系统系统的优点系统模型免疫系统国外学者安全问题智能性生物体灵活性计算机

髓系细胞触发受体-1在炎症中作用的研究进展

髓系细胞触发受体(Triggering receptor expressed on myeloid cells,TREMs)是一类隶属于免疫球蛋白超家族的细胞表面受体,在介导各种细胞反应中都扮演着重要的角色。近几年,

期刊

TREMsinflammationdiseasereview

基于数字签名和DISC的认证方法

认证是网络安全的关键问题之一，对于基于Internet/Intranet的电子商务电子政务等应用有着至关重要的作用。本文在分析当前的几种认证方法的基础上，结合Internet/Intranet的环境

会议

数字签名认证方法原型系统网络安全复制技术电子政务电子商务安全性应用基础环境

基于朴素贝叶斯方法的自动文本分类系统的实现

与本文相关的学术论文