一种基于语义标注特征的金融文本分类方法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:yaojian42506
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对基于词袋的机器学习文本分类方法所存在的高维度、高稀疏性、不能识别同义词、语义信息缺失等问题,和基于规则模式的文本分类所存在的虽然准确率较高但鲁棒性较差的问题,提出了一种采用词汇—语义规则模式从金融新闻文本中提取事件语义标注信息,并将其作为分类特征用于机器学习文本分类中的新方法。实验证明采用该方法相比基于词袋的文本分类方法在采用相同的特征选择算法和分类算法的基础上,F1值提高8.6%,查准率提高7.7%,查全率提高8.8%。本方法融合了知识驱动和数据驱动在文本分类中的优点,同时避免了它们所存在的主
其他文献
在全球范围内,猪圆环病毒2型(PCV2)已成为影响养猪场最常见的一种病原,换句话说,PCV2病毒已成为养猪场内的一种常在病原.当猪群感染猪圆环病毒2型(PCV2)时,其血液和组织中的病毒
猪瘟是一种由猪瘟病毒引起的高度接触性传染病,该病流行广泛,是影响我国养猪业的主要传染病之一。本文通过描述猪瘟的病原体、流行病学、临床症状、病理变化、诊断方法及综合防
腹茧症是一种罕见的疾病,病因不明,术前诊断较困难,本文结合文献报告2例.
目的:研究和分析高原放牧牦牛夏初补饲精料对体质量的影响。方法:选取藏族自治州某地区作为本次试验的产地,对2016年6月1日-7月15日60只耗牛进行初步进料补饲试验,根据随机原则,分
近年来,App的数量呈爆炸式地增长,在庞大数量的手机App中找到合适的App给用户带来了困难。传统的推荐系统方法运用到App推荐上时有很多的局限性,如难以解决冷启动和用户对不同类别的应用具有不同的选择偏好等问题。提出了一种基于主题分组和随机游走的个性化推荐算法TGRW。TGRW针对用户对每类App需要的数量、偏好的程度各不一样的特点,根据用户的App使用记录,构造了user-App组-App的三元
选取涪陵区内母猪饲养量20以上的30个规模养殖场,每个猪场选取10头母猪作为研究对象,研究生物隔离净化技术对种猪繁殖性能的影响。项目开展后平均窝产仔数提高了0.11头(P<0.0
随民众生活水平的提升,生猪养殖得到规模化发展.加上,市场生猪及相关制品的频繁流动,加重生猪疾病的感染几率.这些年,猪水肿病的发病率尤重,对生猪养殖产业造成不可挽回的经
绵羊疥癣病是一种绵羊身上经常发生的体外寄生虫病,俗称“疥螨”“癞”。本病传播速度快,危害性大。最近几年时间来看,随着科学技术的快速发展,人们生活水平有所提高,对棉羊肉的需
我国养猪业发展突飞猛进,竞争日益激烈。为提高母猪的生产力,降低养殖的经济本。目前国内外的集约化养殖场普遍采用21~28日龄的早期断乳,发展优质高效养猪生产,仔猪饲养管理是养猪
文章在分析母牛繁殖期间可能引起的各种疾病类型的基础上对如何治疗和预防提出了若干建议,希望能够降低母牛繁殖疾病的概率,促进母牛繁殖和养殖业的发展。