一种结合层次结构和KNN的Web文本分类方法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:A5151
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在Web文本分类中当类别数量庞大或者类别复杂情况下,层次分类是一种有效的分类方法,但其不足之一是在大类正确划分的前提下,由于子类之间存在较多共性,导致分类精度下降.而层次结构本质决定了同一大类下的子类存在特征交叉现象,针对这一局限性,结合KNN的优越性能,提出了一种结合层次结构和KNN的Web文本分类方法.该方法通过建立层次结构模型(树形结构),分类时先从层次结构模型获得相似度最大的k0个类别,然后在kO个类别训练文档中抽取部分代表样本采用KNN算法.最后由一种改进的相似度计算方法决定最终的所属类别.实验
其他文献
随着社会经济的快速发展,BIM技术以其特有的信息技术和应用手段在各大型市政工程均有着较好的发展前景。本文基于BIM技术对市政道路设计中的平面、纵断面、横断面以及附属工
首先本文从理论上分析了当前采用等质量取代水泥检测复合矿物掺合料活性指数做法的不合理之处,即不同复合矿物掺合料因表观密度变化幅度较大,掺入相同质量矿物掺合料时胶浆体
提出一种基于一维触发细胞自动机的数据加密算法.待加密的数据块被分成两个等长的子块在两个触发细胞自动机上并行加密.细胞自动机之间采用对称耦合结构,每个细胞自动机迭代
通过沥青针入度、延度、软化点、粘度、残留针入度比、残留延度等指标分析,确定低温改性剂合理的掺入量。
复合改性水泥修复砂浆作为水泥路面的修复层的铺筑材料,对其力学性能有着较高的要求。本文针对其力学性能及界面粘结性进行研究发现其在力学性能方面有着明显的性能优势,早期
超节点选择是构造基于超节点结构P2P覆盖网的主要问题之一,与通常按节点能力如带宽、CPU处理、存储空间等纯物理性质选择超节点不同,本文充分考虑节点间延时、距离、信息交互
超薄水泥路面修复层受力状态与其使用性能和耐久性有着密切关系,利用Abaqus对其受力状态进行模拟分析,研究可知:超薄磨耗层耐久性与荷载作用位置、旧水泥路面界面粘结状态、
〔结论〕应用嵌合抗原受体T细胞(chimeric antigen receptor T cell,CAR-T)治疗急性和慢性淋巴细胞白血病、B细胞淋巴瘤,在近期已取得了快速进展。CAR-T细胞是将T细胞受体基
在分析高校科研实验室本科生培养现状的基础上,对研究生参与科研平台本科生实践教学进行研究,认为研究生对本科生起到安全宣传、技术指导员和思想领航的作用。通过构建完善的
中国板栗(Castanea mollissima)居群分布,按照群体分布及其生态梯度进行(随机)分组取样,研究了板栗9个种群群体的表型多样性及DNA水平多样性,并对表型与DNA二个不同层次的遗传多