一种基于概念层次的文本特征权重计算方法

来源 :安徽工业大学学报:自然科学版 | 被引量 : 0次 | 上传用户:hzbhwh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征权重计算是文本表示的关键,权重计算方法的优劣直接影响文本分类和聚类的准确度。基于词形和词频统计的特征加权方法过于近似和粗糙,不能有效突出具有较强类别区分度的重要特征,难以有效区分两类特征,造成了高维稀疏问题,使文本分类性能不够理想,这是特征权重计算的主要障碍。提出一种基于概念层次的特征权重计算方法,将词空间转移为概念空间,在概念层次上引入特征支持度与类别强度两个参数对特征权重进行调整。实验表明,新的方法表现了较好的分类性能,在空间维度的压缩与计算效率上也有明显的改善。
其他文献
考虑了一类生物系统关于有效更新的最优控制模型,利用拉特征线技术,得到了这个系统非负古典解的存在唯一性。并给出了这个系统有效更新最优控制的存在性。
图文资料管理系统的设计研究,旨在开发一个通用的资料管理系统,可同时管理图形和文字资料(任意格式文件),使分散在各地的资料统一管理起来,便于安全保存和为社会提供再服务;使资料管理更加科学化、可视化地为用户服务,并对管理部门的信息化建设起重大作用。介绍了建立该系统的技术方案,包括总体框架设计、数据库设计、功能设计,并给出了实现方法。
采用在溶剂中间接氯化的方法合成对氯甲苯。研究了氯化过程中溶剂,催化剂,氯化温度及氯化时间等因素的影响,并优化了氯化工艺,结果得到氯化反应后甲苯转化率达到85%-94%,氯化产物中对位/(对
背景大量研究表明,儿童孤独症如果能越早被发现和干预,其预后效果就越好。国内现有社区卫生服务机构尚未能提供孤独症早期筛查服务,在社区开展家长自评式孤独症早期筛查,可作
目的探讨高血压合并脑梗死患者的综合心理护理干预效果。方法选择在我院治疗的50例高血压合并脑梗死患者,依据随机分组法将其平均分为两组,每组25例。在治疗过程中,分别给予
介绍一种可测试性转换算法(Testability Transformation Algorithm),通过程序转换的方法,把程序中的标志变量去掉。解决含有标志变量的程序的测试数据产生的问题。通过程序转换把
目的观察早期胰岛素治疗妊娠期糖尿病患者的临床效果。方法选取某医院2015年12月—2017年12月间收治100例妊娠期糖尿病患者进行试验研究,以孕期24周为标准,将孕周在24周以内
乡村振兴,产业兴旺是重点。随着农业现代化的有序推进,知识产权之于农业的推动作用已不止来源于科技创新和品牌建设所提升的农产品附加值,地理标志等知识产权产品所带动的乡
恐怖片是电影的一大类型,它多以紧张的情节、阴森的气氛和狰狞的怪物形象给人以生理和心理上的震颤,从而让人们去思考、去联想现实生活中的恐怖事件:暴力、死亡等等。在黑暗
目的对于病毒性肝炎患者接受甘草酸二铵(甘利欣)进行治疗的具体方法以及治疗效果加以探讨。方法对于天津市宝坻区人民医院收治的病毒性肝炎患者100例作为观察对象,利用入院顺