基于多示例学习框架的文本分类算法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:a596298067
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对有特殊结构的文本,传统的文本分类算法已经不能满足需求,为此提出一种基于多示例学习框架的文本分类算法。将每个文本当作一个示例包,文本中的标题和正文视为该包的两个示例;利用基于一类分类的多类分类支持向量机算法,将包映射到高维特征空间中;引入高斯核函数训练分类器,完成对无标记文本的分类预测。实验结果表明,该算法相较于传统的机器学习分类算法具有更高的分类精度,为具有特殊文本结构的文本挖掘领域研究提供了新的角度。
其他文献
2020年的春季学期对每一所学校来说都是不平凡的。新冠肺炎疫情防疫背景下的教育教学能否有序进行且质量不降低,是对学校干部教师应变能力的考验,也是学校能不能把危机转变为
为探讨不同酒精滴定浓度阳性乳患牛血清钙、磷和羟脯氨酸含量的变化。首先剔除加州乳房炎检测阳性的奶牛,用68%的酒精全群检测酒精阳性乳,再用72%的酒精测定68%的酒精阴性牛乳,最后
针对距离平方反比插值算法(IDW)未能考虑事物的方向性特征以及插值精度较低的情况,提出一种带方向的各向异性空间插值的优化算法。通过最小二乘法的椭圆拟合改进算法确定椭圆
针对传统的中文文本分类在海量的互联网信息中难以胜任的现状,提出一种语句级的卷积神经网络中文新闻分类方案。通过信息提取算法从长短不一的新闻数据中提取固定大小的新闻
<正>乙酰谷酰胺用于治疗脑外伤昏迷,神经外科手术引起的昏迷、肝昏迷及偏瘫、高位截瘫、小儿麻痹后遗症、神经性头痛和腰痛~[1]。乙酰谷酰胺注射液现收载于《中国药典》2015
当今时代,计算机和互联网技术的日渐成熟使以微信、微博为代表的新媒体影响力日益扩大。新媒体有其积极的一面,比如传播速度快、受众影响面广;也有其消极的一面,比如带来了大
目的基于Keap1/Nfr2/ARE信号通路探索机械通气相关肺损伤(ventilation induced lung injury,VILI)形成的分子机制。方法给予SD大鼠过度机械通气建造VILI模型;HE染色检测对照
用200Gy 的^60Co-γ射线诱变皖麦50的干种子,对 M2的性状进行变异及典型相关分析,结果表明,从变异系数看,粒重〉粒数〉沉降值〉退化小穗数〉千粒重〉形成时间〉稳定时间〉湿面筋
图书馆每年都会对相当一部分的图书、期刊进行下架和剔旧处理,但不得不面对旧书利用率降低、处理善后经费上升、再利用效果差等问题。文章基于第三代图书馆建设背景,利用云服