基于模糊关系的文本分类特征选择方法

来源 :情报学报 | 被引量 : 0次 | 上传用户:zhangmin6278
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
若要有效地实现文本分类,关键是对高维特征空间进行降维,降维方法分为特征选择和特征提取。本文对已有特征选择方法分析后发现,这些方法仅利用文档数来选择特征,没有考虑特征项的权重。为了找出本质特征,我们提出了一种基于特征项与类之间模糊关系的特征选择方法,引入特征项权重来确定其隶属度。采用KNN分类器,在Reuters-21578标准文本数据集上进行了训练和测试。实验表明,宏平均和微平均都达到了最高,分别为81.82%和94.88%,宏平均比IG,CHI提高了4.73%和1.12%,微平均比IG,CHI提高了1.
其他文献
本文通过光谱、酸洗低倍和金相分析,对电炉冶炼的50轻轨钢锭纵裂进行了研究。认为纵裂的主要原因是低熔点硫化物夹杂沿柱状晶铁素体和珠光体的晶界分布,破坏了钢的塑性,加上
阑尾炎在外科急腹症中属于较为常见的疾病,临床治疗中接近35%的患儿早期诊断比较困难,尤其是小儿异位急性阑尾炎常由于症状不显著而造成诊断困难加大。超声显像检查在敏感性和特异性方面较为突出,应在临床治疗过程中得到广泛运用。现对我院治疗的异位急性阑尾炎患儿12例行B超检查的资料进行回顾分析,报道如下。
腹腔镜疝修补术与传统手术相比具有恢复快、疼痛轻、美容等优点,但亦有手术费用较大的缺点。为了降低费用以利于腹腔镜疝修补术的推广,我院改良术式在腰硬联合麻醉下应用“三点一线”式缝合固定法行经腹腔腹膜外腹腔镜疝修补术(TAPP)87例,取得满意的效果。现与同时期进行的无张力疝修补术102例进行回顾性对照研究,现报道如下。
近日,松江区政府召开重点用能企业节能降碳、能源计量业务培训会,92家单位负责人和能源管理专员参加。松江区政府从能源审计、节能、能耗统计政策等方面进行宣传解读。国家能源
文本过滤是网络安全领域的一个重要研究课题.基于内容的文本过滤关键在于建立语义层次上的用户模板.本文提出一种基于非负矩阵分解(Non-negative Matrix Factorization,NMF)
2020年第4期“锐观察”栏目《躬身入局,正视危机》作者“张亚东”应为“赵亚东”。在此更正说明,并为我们的失误向赵亚东董事长表示诚挚的歉意。
本文利用武钢能量平衡基础数据,进行节能潜力分析,提出节能的基本方向和主要措施。
本文在提出文献知识单元概念的基础上,分析了面向用户问题域的文献知识本体,并构建了文献知识库的概念关系模型.针对具体的应用领域和应用目的,提出了基于语义描述的文献知识
在语义网络环境下,通常运用不同领域的本体来组织分散于各处的信息资源。为了有效地解决这些分散信息资源的定位和整合问题,本文提出了一种新的本体转换模型,主要从原理和方法论
一、概述目前、由于锡资源日益短缺和锡价昂贵、为降低生产成本,各镀锡板生产国竞相开展节锡的研究,出现了以减少锡沉积量为主的低锡量镀锡板(LTS)、无锡镀层钢板(TFS)、以及
期刊