基于同义替换和相邻词合并的关键词特征权重计算新方法

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:chzhao2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征项权重计算是文本挖掘中关键词提取的核心,其计算方法的好坏对文本挖掘的结果有着重要的影响。本文在对关键词提取特征项权重计算的传统TFIDF算法分析的基础上,为减少该算法特征权重计算时对词频的过于依赖,提出一种基于同义替换和相邻词合并(KSRAM)的特征权重计算方法。为检验算法性能,对KSRAM算法和传统TFIDF算法进行了关键词提取对比实验,实验表明KSRAM算法在关键词提取的准确率和召回率方面比传统TFIDF算法有明显的提高。
其他文献
远程专家会诊系统为主治医生在紧急手术中能够做出及时、正确的医疗决策起到非常重要的作用。本文提出一个基于PDA的实时远程会诊系统,结合Wi-Fi的无线局域网技术及3G无线通
针对传统k-means聚类算法中对初始聚类中心随意选取和人为指定的缺陷,提出一种改进的初始聚类中心的选取方法,利用差异矩阵将新的聚类初始中心计算方法用在传统的k-means算法
随着虚拟博物馆技术研究的日益深入和广泛,对虚拟场景的真实感和沉浸感都提出更高的要求。为解决上述问题,本文提出一种新的虚拟博物馆系统开发解决方案,介绍采用Unreal3引擎
介绍目前在J2EE平台上应用日益广泛的三个开源框架Struts、Spring以及Hibernate,分析它们的技术特点,提出这三个框架整合的方案,用Struts实现视图和控制器层,Spring构建业务逻辑
随着因特网技术的飞速发展,搜索引擎逐渐成为因特网重要的导航工具之一,而人们日常使用的搜索引擎代码并不开源,不利于研究学习。本文建立一个开源搜索引擎模型,并在ASP.NET中实现
随着大规模集成电路的快速发展,软硬件的协同设计和验证技术变得越来越重要,其中硬件语言Verilog HDL和软件语言SystemC之间的编译转换问题也变得热门。本文研究在Verilog HD
国家教育部制定的高中新课程标准将算法初步作为高中数学课程的必修内容,算法与程序设计也首次纳入到选修课之列。全国大部分普通高中均按新课标开展教学实验,不少省份还把算
介绍利用C8051F32X单片机支持的SPI总线及USB传输功能设计一套完整数据采集系统,叙述两种芯片以及利用LabVIEW软件实现采集卡和上位机之间的通信、软件设计技术及实现细节。
首先简要地介绍Linux系统中虚拟文件系统(VFS)的分层抽象,然后详细分析VFS通用模型中的四个对象类型及内核中实现它们的数据结构,最后介绍它们之间是如何联系起来的。通过对其
如何提高乳腺癌计算机辅助诊断系统(CAD)中的灵敏度一直是众多学者研究的热点,特别是针对亚洲女性及年轻妇女的致密组织图像的检测。尽管之前已经提出了针对该类图像的解决方法,实验也表明,该方法可以提高系统的灵敏度(真阳性率TP),但人们发现随着TP的提高也伴随了假阳性率(FP)的增长。所以,本文的研究目的是在前续研究的基础上,即保证CAD系统的灵敏度的同时尽可能地降低假阳性率。