—种新的中文层次化文本分类规则设计

来源 :电信技术研究 | 被引量 : 0次 | 上传用户:zhuce121566
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息爆炸时代,其中存在大量的中文文本,并且文本之间存在层次关系,为了从中及时的获取有用的信息,需要进行有效的组织和管理。本文通过文本分类的方法,设计了“全路径+自底向上”的层次化分类规则,可以缓解自顶向下分类的阻塞,同时兼顾解决多标签和中间节点分类问题。首先使用BR方法即二元关系法把多标签转化为单标签统一处理,为除根节点外的每个节点构建一个二元分类器,使得可以在中间节点和叶子节点进行分类,然后利用节点及其祖先节点的关系从底向上对分类结果进行筛选过滤,以减少错分现象。实验表明采用该方法比常规自顶向下的方法
其他文献
中国抗战对世界反法西斯战争的贡献韦红中国抗日战争是第二次世界大战的一个重要组成部分。中华民族浴血奋战,顽强抗日,不仅粉碎了日本法西斯灭亡中国的侵略计划,同时也支援和配
本文研究讨论了利用信号幕次方谱估计OQPSK符号率、载频等参数,并在恢复信号原基带数据基础上实现码元同步,以获得最佳抽样点,最后恢复星座图实现对OQPSK信号识别。
城市环境图集必须跟踪城市环境的发展与变化,其编制要适应城市环境的复杂性与严重性,使其成为能够满足城市环境多功能要求的动态监控的地图.
晋中市民营科技企业的发展经历了从小到大、由弱到强的道路,在苦练内功的同时,民营科技企业在科技创新,加快科技成果转化和建立现代企业管理制度方面进行了有益的探索.笔者从
顾维超业医50余载,学验俱丰,对张锡纯学术思想积有心得,尤对张氏大气学说多有发挥,在其升陷汤基础上加红景天、仙鹤草、桑寄生、甘松、山萸肉、炙甘草而创制出加味升陷饮,以
本舰噪声干扰是拖曳阵工程应用需要解决的一个重要问题。提出了一种子阵本舰干扰抵消算法,可以较好解决本舰噪声角度展宽问题。海试数据分析表明,该算法能够很好消除本舰噪声
针对实际目标位于地球表面且高程已知的情形,本文提出了一种将地球中心作为虚拟观测站的加权多维标度定位算法。首先基于目标高度约束信息,将地球中心作为虚拟测量站,建立新的定
布依族人口现代化与民族繁荣浅析张天路,陈秀英新中国的民族政策是“民族平等、民族团结、实现各民族共同繁荣”。这里所指的民族繁荣当然是现代型民族繁荣。现代型民族繁荣的
介绍了山西省北部地区污水处理选用的Orbal氧化沟工艺的技术特点及其设计和运行参数,提出了提高Orbal氧化沟处理效果的技术对策.