基于统计特征的Quality Phrase挖掘方法

来源 :数据采集与处理 | 被引量 : 0次 | 上传用户:chrisevenk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Quality Phrase挖掘是从文本语料库中提取有意义短语的过程,是文档摘要、信息检索等任务的基础。然而现有的无监督短语挖掘方法存在候选短语质量不高、Quality Phrase的特征权重平均分配的问题。本文提出基于统计特征的Quality Phrase挖掘方法,将频繁N-Gram挖掘、多词短语组合性约束及单词短语拼写检查相结合,保证了候选短语的质量;引入公共知识库对候选短语添加类别标签,实现了Quality Phrase特征权重的分配,并考虑特征之间相互影响设置惩罚因子调整权重比例;按照候选短语的特
其他文献
2012年11月25日,全军卫生装备学、医学工程学专业委员会教育培训分会成立暨学术大会在西安隆重召开。全军医学工程学专业委员会主任委员、军事医学科学院卫生装备研究所王政研
目的:分析Alcock阴部神经阻滞在无痛人流术中的应用效果。方法:选取2014年1月~2018年6月期间,于某院接受无痛人流术的患者92例,以随机方式将其分为参照组与研究组各46例。参
目的分析非促肾上腺皮质激素(ACTH)依赖性库欣综合征患者的临床资料,总结其临床特征和有效治疗方法。方法对52例非ACTH依赖性库欣综合征患者的一般资料、临床表现及并发症、
目的观察高频振荡叠加常频通气治疗重度新生儿呼吸窘迫综合征(NRDS)的效果及并发症情况。方法重度NRDS患儿67例,随机分为高频振荡叠加常频通气组(H+C组)和高频振荡通气组(H组
日本农水的科研人员从冲绳县58个地点的葫芦科植物上采集病毒,接种到南瓜上,获得了几个毒株。然后将这几个毒株通过藜科植物和南瓜进行多次交替接种和继代培养,从中筛选出一个弱毒
目的探讨自身抗体相关性先天性心脏传导阻滞(ACHB)的有效诊断及治疗方法。方法对1例双胞胎之一ACHB患儿的临床资料作回顾性分析。结果双胞胎之一患儿在母亲孕期及出生后心率
心血管疾病是当今人类死亡的主要原因之一。本文基于改进的残差网络对心电信号进行识别,并将改进后的残差网络和空洞卷积进行结合,特征提取时保持局部信息不变的同时尽可能地
目的:研制一种封闭式医疗废物运送车。方法:车厢、车门、排水漏和喷淋装置等全部采用不锈钢材料,通过焊接制成。结果:防止医疗废物运送车成为流动的污染源而造成医院环境污染,增强
<正> 近年来检测病毒特异性IgM的第三代技术IgM捕获ELISA(MacELISA)已广泛应用于病毒性疾病的早期诊断。此法具有较高的特异性和敏感性。我们将其试用于虫媒病毒的诊断中,并