基于改进DE-Tri-Training算法的汉语多词表达抽取

来源 :数据采集与处理 | 被引量 : 0次 | 上传用户:s4553711
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多词表达的识别错误会对很多自然语言处理任务造成不利影响。DE-Tri-Training半指导聚类算法在聚类初期使用有指导的标注信息,取得了较好的抽取结果。本文采用基于中心词扩展的初始聚类中心确定方法和基于有指导信息的一致性协同学习数据净化方法,提出了半指导策略抽取汉语多词表达,聚类算法的中后期也加入有指导的信息,使分类器能使用正确的标注信息进行训练。通过与DETri-Training算法的对比实验,改进的DE-Tri-Training算法得到的汉语多词表达抽取结果优于原来的算法,验证了改进DE-Tri-T
其他文献
<正>Chinese and American officials have expressed their positions through various channels since news broke in 2014 of US preparations to deploy the THAAD syste
急诊经皮冠状动脉介入治疗(percutaneous coronary intervention,PCI)作为急性心肌梗死(acute myocardial infarction,AMI)最有效的再灌注治疗方法,可迅速改善患者临床症状,减少心脏
目的探讨螺旋CT肺动脉造影在老年肺动脉栓塞(PE)诊断中的临床应用价值。方法采用螺旋CT对66例老年PE患者行肺动脉增强扫描,其中多层、单层螺旋CT(MSCT,SCT)肺动脉造影检查者各为21
目的:探讨新生儿疾病筛查不同采血部位对采血效果的影响,以便获得最佳血液标本质量,提高一次成功率,减轻新生儿痛苦。方法:将在我院生产的368例新生儿随机分为两组,实验组和
扩散加权图像中的噪声为莱斯噪声并且图像本身含有丰富的边界信息,因而要求对DWI图像有效降噪的同时,能够较好地保留图像的边界信息。由于BEMD算法可将图像分解为细节图像及余项图像,其所分解的细节图像包括DWI图像的边界信息以及主噪声,而余项图像则描述图像的趋势信息。因此,提出一种将二维经验模态分解算法与改进的维纳滤波器相结合的降噪算法,并将该算法应用于DWI图像的降噪中。通过实验,将所提出的算法与其
针对使用语音变换技术的语音篡改,提出一种自动检测方法。在分析语音变换基本模型和变换语音失真的基础上,提取语音信号的声道参数以及相关的信号统计量,并通过支持向量机递