基于向量空间模型的中文文本层次分类方法研究

来源 :计算机应用 | 被引量 : 33次 | 上传用户:snake_icy1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文本分类的类别数量庞大的情况下,层次分类是一种有效的分类途径。针对层次分类的结构特点,考虑到不同的层次对特征选择和分类方法有不同的要求,提出了新的基于向量空间模型的二重特征选择方法FDS以及层次分类算法HTC。二重特征选择方法对每一层均进行一次特征选择,并逐层改变特征数量和权重计算方法;HTC算法把分别对粗分和细分更有效的类中心向量法与SVM方法相结合。实验表明,该方法相对于平面分类和一般的层次分类方法,有较高的准确率。
其他文献
介绍了Velocity模板技术及Spring2.0和Hibernate两种开源框架,论述了在Spring2.0中集成Velocity和Hibernate的原理和方法,提出了一种集成Velocity、Spring2.0、Hibernate这三种技术的新型Web应用开发模式,举例详细介绍了基于Velocity+Spring2.0+Hibernate构建的教务管理系统学生信息查询功能模块的设计。应用这3
利用含参数积分给出 Cauchy 主值积分的一种内插型求积近似公式的构造,并运用 Chebyshev 多项式 T_n(x)与 U_n(x)给出几个具体的奇异积分求积近似公式。
针对流程工厂设计过程中空间管道布局工作量大、设计周期长的问题,总结了管道设计中的空间布局规则,提出了空间布局中的位置、拓扑方位和工程等约束条件,应用目标分解的方法建立了数学模型,并应用进化策略方法求解此模型。实验结果表明,此方法可以很好地满足管道设计中的工程规范,并可推广到一般的具有拓扑连接关系的空间布局优化问题中去。
目的 探讨小儿膀胱结石的微创治疗方法.方法 设治疗组输尿管镜联合前列腺电切镜鞘耻骨上膀胱穿刺微创治疗与对照组经尿道输尿管镜气压弹道碎石术,总结比较两组的碎石及取石时
目的了解清远市清新县城区3~6岁学龄前儿童乙型肝炎病毒的感染情况及免疫状况。方法采用酶联免疫吸附法(ELISA)检测2005~2009年清远市清新县城区10 575名3~6岁学龄前儿童的乙型肝
研究了任意矩阵在循环矩阵中的逼近问题。证明了最佳逼近元的唯一存在性,并给出了最佳逼近元的计算公式。
目的探讨循证护理在预防妊娠高血压综合征患者引起严重并发症的护理方法,保障母婴健康,降低围产期死亡率。方法将140例妊娠高血压综合征患者按入院顺序随机分成实验组和对照组
目的寻找能预测晚期结直肠癌一线化疗疗效的血清蛋白标记物。方法选择2008年8月至2010年7月在浙江大学医学院附属第二医院的70例从未接受过治疗的晚期结直肠癌患者,其中44例患
读章锦才的简历,展示的是一个严谨治学,潜心钻研并获得斐然成就的专家学者形象。当我走进省口腔医院院长办公室,与章锦才院长面对面,看到的又是一个思维清晰,语言精炼,有着个性化见
针对查询扩展中局部分析方法查准率不高的缺点,提出一种新算法。该算法通过分析与用户查询密切相关的文档,从而得到与其相关的文档类别,进而根据相关类别中的文档用词与用户查询用词的共现关系对查询进行扩展。通过与传统的局部分析方法、全局分析方法的实验对比,结果表明新算法具有更快的检索速度和更高的查准率。