文本分类中的同义词和关联词聚类算法研究

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:anan0508
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对基于VSM的文本特征空间中存在着大量同义词和关联词的不足,文章结合潜在语义分析和关联规则挖掘以减少信息冗余,改进分类效率。最后对相应的算法进行了描述并实验验证。
其他文献
基于Struts+JSP2.0+EJB的JavaWeb开发技术,是当今Web应用开发技术的主流,它不仅对MVC提供了很好的支持,而且也代表了最新的B/S信息系统开发模式。本文结合民航地面运行监控系统的实
针对数据迁移中PL/SQL程序要求具有较高的执行速度,分析了迁移程序中游标的查询语句,提出应用外连接技术优化查询语句能减少游标的嵌套层次,达到提高数据迁移程序执行速度的
在传统的分布式计算系统中,基于界面(interface)的平台提供了一些方法来描述界面、方法和参数。本文在设计数据管理系统时,基于兼容性和安全性的问题考虑,必须提供一套标准的类型
针对一种与传统不同的主动式自调度集群系统(ASACS),分析了其优点和不足。通过改进它的体系结构和调度框架,并提出了相应的实现方式,很好地解决了由于在ASACS中所有从客户端发向服
工作流系统是办公自动化系统中的重要组件,而流程定义则是工作流系统所有活动的基础,在工作流系统中占有非常重要的地位。论文以某通信公司的办公自动化系统为背景,从体系结构、
以基于单片机的多路绝缘耐压测试系统为背景,针对力控组态软件与单片机的串行通信问题,采用VC++开发了用于串行通信的AdiveX控件,在力控组态环境下采用规范的OLE接口挂接实现了数
很多Web应用如即时通讯,股票行情系统,都需要将服务器发生的变化实时传送到客户端而无须客户端不停地刷新、发送请求。本文首先对现存的服务器推送技术进行了分析和总结,着重
为完成共享管理信息模型到面向实际数据库存储的部署实现,提出了一个共享管理信息的SMD(System-Metadata-Data)存取适配过程模型,定义了该模型中的四类元数据及其适配函数,并描述
本文研究与分析了目前IP电话的现状,描述了在Internet环境下,实现语音交互的关键技术。并利用现有的硬件设施和技术力量,研究Windows的多任务机制,通过Windows MDK低层音频服务、
通过中国移动通信GPRS网络进行无线数据传输,是当前环保部门选择的通信手段亮点之一。本文从GPRS的特点入手,对基于GPRS技术的环保检测系统的系统硬件和软件设计进行了详细的