多主题文本分类的实现算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:quake_bj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对一个文本具有多主题属性,提出一种基于模糊支持向量机的多主题文本分类算法。用1-a—r方法训练子分类器,计算待分类文本到每个超平面的距离,依据距离得到隶属度向量,根据隶属度向量判定该文本所属的主题。实验结果表明,该算法在保证单主题文本分类精度的前提下,实现了多主题文本分类,并且有较好的准确率、召回率和F1值。
其他文献
提出了一种通用的接口模型,在SoC设计的接口综合中对IP核的通信接口进行了建模。基于可扩展标记语言(XML),提出了接口描述文件(IDF—XML)的概念,利用XML的优势对该模型进行描述,并提
在我国,中高端模具产业的自给率严重偏低,在设计研发、材料工艺、零部件等方面与世界先进国家存在差距。而受益国家产业政策,下游行业的巨大需求为我国模具产业赢得了宝贵的发展
针对如何高效地收集分散、异构源数据和生成精确、一致目标数据的问题,提出基于SOA和Web服务技术的数据交换平台,采用二进制优化打包协议附件的形式封装待整合的数据。讨论了数
提出一种基于行列双动态规划的立体匹配算法,采用能量最小化立体匹配模型,其中包含数据项和平滑项,在求解能量最小化过程中,在行方向上利用动态规划的方法给出视差图的能量最小化解,利用行动态规划的求解结果给予对应数据项一个奖励,同时在列方向上对视差图进行动态规划求解,并将其作为最终求解结果。实验结果表明,该算法能够取得较理想的效果。
振兴东北老工业基地是一个区域经济市场化的过程;是一个区域产业结构调整的过程;是一个使区域经济体能够更广泛地参与区际国内以及国际的分工与合作的过程。区域经济市场化表
分析CORBA和移动Agent2种网管技术的特点和不足,提出一种基于CORBA和移动Agent的网络管理系统的设计方法。系统模型采用Java虚拟机作为运行平台,ORB作为底层通信设施,KQML作
<正>慢性鼻-鼻窦炎(chronic rhinosinusitis,CRS)是指鼻与鼻窦黏膜的慢性炎症,鼻部症状持续超过12周,症状未完全缓解甚至加重[1]。本病是耳鼻咽喉科临床最常见疾病之一,以鼻
随着我国经济的持续增长,在国民财富不断增加的同时,流动性过剩问题也日渐突显,尤其是在全球流动性过剩的冲击下,使我国的流动性过剩问题更加趋紧。当前,流动性过剩已成为宏
近十年来,我国农村地区根据国务院《关于基础教育改革与发展的决定》,对部分中小学布局进行了调整,越来越多寄宿制小学的出现,成为农村基础教育的一个显著特点。农村寄宿制小