基于模糊关系的文本分类特征选择方法

来源 :情报学报 | 被引量 : 0次 | 上传用户：zhangmin6278

【摘要】

：

若要有效地实现文本分类，关键是对高维特征空间进行降维，降维方法分为特征选择和特征提取。本文对已有特征选择方法分析后发现，这些方法仅利用文档数来选择特征，没有考虑特征项的

【作者】

：

甄志龙韩立新陆佃龙

【机构】

：

河海大学计算机及信息工程学院,通化师范学院计算机科学系

【出处】

：

情报学报

【发表日期】

：

2008年6期

【关键词】

：

文本分类特征项权重模糊关系特征选择 text categorization term weights fuzzy relation feature

【基金项目】

：

基金项目：国家自然科学基金资助项目（No.60673186和60571048）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

若要有效地实现文本分类，关键是对高维特征空间进行降维，降维方法分为特征选择和特征提取。本文对已有特征选择方法分析后发现，这些方法仅利用文档数来选择特征，没有考虑特征项的权重。为了找出本质特征，我们提出了一种基于特征项与类之间模糊关系的特征选择方法，引入特征项权重来确定其隶属度。采用KNN分类器，在Reuters-21578标准文本数据集上进行了训练和测试。实验表明，宏平均和微平均都达到了最高，分别为81．82％和94．88％，宏平均比IG，CHI提高了4．73％和1．12％，微平均比IG，CHI提高了1．

其他文献

电炉50轻轨钢锭纵裂分析

本文通过光谱、酸洗低倍和金相分析,对电炉冶炼的50轻轨钢锭纵裂进行了研究。认为纵裂的主要原因是低熔点硫化物夹杂沿柱状晶铁素体和珠光体的晶界分布,破坏了钢的塑性,加上

期刊

电炉炼钢钢锭纵裂50轻轨钢锭

B超诊断小儿异位急性阑尾炎的临床价值

阑尾炎在外科急腹症中属于较为常见的疾病，临床治疗中接近35％的患儿早期诊断比较困难，尤其是小儿异位急性阑尾炎常由于症状不显著而造成诊断困难加大。超声显像检查在敏感性和特异性方面较为突出，应在临床治疗过程中得到广泛运用。现对我院治疗的异位急性阑尾炎患儿12例行B超检查的资料进行回顾分析，报道如下。

期刊

小儿异位急性阑尾炎B超诊断

“三点一线”式缝合固定法在经腹腔腹膜外腹腔镜疝修补术中的应用

腹腔镜疝修补术与传统手术相比具有恢复快、疼痛轻、美容等优点，但亦有手术费用较大的缺点。为了降低费用以利于腹腔镜疝修补术的推广，我院改良术式在腰硬联合麻醉下应用“三点一线”式缝合固定法行经腹腔腹膜外腹腔镜疝修补术(TAPP)87例，取得满意的效果。现与同时期进行的无张力疝修补术102例进行回顾性对照研究，现报道如下。

期刊

“三点一线”式缝合固定法经腹腔腹膜外腹腔镜疝修补术(TAPP)

松江区开展重点用能企业节能降碳、能源计量培训

近日，松江区政府召开重点用能企业节能降碳、能源计量业务培训会，92家单位负责人和能源管理专员参加。松江区政府从能源审计、节能、能耗统计政策等方面进行宣传解读。国家能源

期刊

能源计量企业节能业务培训松江区上海电器科学研究所降碳能源管理能源审计

基于NMF的用户模板构造方法

文本过滤是网络安全领域的一个重要研究课题.基于内容的文本过滤关键在于建立语义层次上的用户模板.本文提出一种基于非负矩阵分解(Non-negative Matrix Factorization,NMF)

期刊

NMF用户模板构造方法文本过滤非负矩阵分解语义索引WEB挖掘网页过滤

更正说明

2020年第4期“锐观察”栏目《躬身入局,正视危机》作者“张亚东”应为“赵亚东”。在此更正说明,并为我们的失误向赵亚东董事长表示诚挚的歉意。

期刊

张亚东更正董事长

武钢能耗概况及节能措施

本文利用武钢能量平衡基础数据,进行节能潜力分析,提出节能的基本方向和主要措施。

期刊

钢铁企业能耗节能

基于用户问题域的文献知识表述及检索系统的建立与实现

本文在提出文献知识单元概念的基础上,分析了面向用户问题域的文献知识本体,并构建了文献知识库的概念关系模型.针对具体的应用领域和应用目的,提出了基于语义描述的文献知识

期刊

文献知识库知识本体XML/RDFJDOM检索系统用户问题域知识单元document repository knowledge ontology

基于语义网的本体转换模型研究

在语义网络环境下，通常运用不同领域的本体来组织分散于各处的信息资源。为了有效地解决这些分散信息资源的定位和整合问题，本文提出了一种新的本体转换模型，主要从原理和方法论

期刊

本体本体转换本体映射语义网ontology ontology translation ontology mapping semantic web.

低镀锡量薄钢板的试验室研制

一、概述目前、由于锡资源日益短缺和锡价昂贵、为降低生产成本,各镀锡板生产国竞相开展节锡的研究,出现了以减少锡沉积量为主的低锡量镀锡板(LTS)、无锡镀层钢板(TFS)、以及

期刊

基于模糊关系的文本分类特征选择方法

与本文相关的学术论文