基于改进DE-Tri-Training算法的汉语多词表达抽取

来源 :数据采集与处理 | 被引量 : 0次 | 上传用户：s4553711

【摘要】

：

多词表达的识别错误会对很多自然语言处理任务造成不利影响。DE-Tri-Training半指导聚类算法在聚类初期使用有指导的标注信息,取得了较好的抽取结果。本文采用基于中心词扩展

【作者】

：

梁颖红谭红叶鲜学丰黄丹丹钱海忠沈春泽

【机构】

：

金陵科技学院软件工程学院,山西大学计算机与信息技术学院,苏州市职业大学计算机工程学院

【出处】

：

数据采集与处理

【发表日期】

：

2017年1期

【关键词】

：

多词表达半指导协同训练 multi-word expression semi-supervised tri-training

【基金项目】

：

国家自然科学基金（61100138,61402134,11601202）资助项目, 江苏省“333”工程高层次人才培养（BRA2015108）资助项目, 金陵科技学院高层次人才工作启动费（40620022）资助项目, 江苏省高校自然科学研究面上（16KJB520013,14KJB520013）资助项目, 山西省自然科学基金（2011011016-2）资助项目, 山西省回国留学人员科研（2013-0

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

多词表达的识别错误会对很多自然语言处理任务造成不利影响。DE-Tri-Training半指导聚类算法在聚类初期使用有指导的标注信息,取得了较好的抽取结果。本文采用基于中心词扩展的初始聚类中心确定方法和基于有指导信息的一致性协同学习数据净化方法,提出了半指导策略抽取汉语多词表达,聚类算法的中后期也加入有指导的信息,使分类器能使用正确的标注信息进行训练。通过与DETri-Training算法的对比实验,改进的DE-Tri-Training算法得到的汉语多词表达抽取结果优于原来的算法,验证了改进DE-Tri-T

其他文献

Addressing the Dilemma of Sino-US Strategic Security and THAAD＇ s Entry to South Korea

<正>Chinese and American officials have expressed their positions through various channels since news broke in 2014 of US preparations to deploy the THAAD syste

期刊

THAAD系统韩国安全学术界核战略美国部署渠道

急诊经皮冠状动脉介入治疗围术期死亡原因探讨

急诊经皮冠状动脉介入治疗（percutaneous coronary intervention，PCI）作为急性心肌梗死（acute myocardial infarction，AMI）最有效的再灌注治疗方法，可迅速改善患者临床症状，减少心脏

期刊

经皮冠状动脉介入治疗围术期死亡急诊原因探讨山东省交通医院AMI患者PCI治疗急性心肌梗死

老年肺栓塞的螺旋CT肺动脉造影诊断研究

目的探讨螺旋CT肺动脉造影在老年肺动脉栓塞（PE）诊断中的临床应用价值。方法采用螺旋CT对66例老年PE患者行肺动脉增强扫描，其中多层、单层螺旋CT（MSCT，SCT）肺动脉造影检查者各为21

期刊

肺栓塞X线计算机体层摄影术老年人pulmonary embolism X-ray computed tomography elderly

新生儿疾病筛查不同采血部位对采血效果的影响

目的:探讨新生儿疾病筛查不同采血部位对采血效果的影响,以便获得最佳血液标本质量,提高一次成功率,减轻新生儿痛苦。方法:将在我院生产的368例新生儿随机分为两组,实验组和

期刊

新生儿疾病筛查不同采血部位采血效果

一种在扩散加权图像降噪中的算法

扩散加权图像中的噪声为莱斯噪声并且图像本身含有丰富的边界信息,因而要求对DWI图像有效降噪的同时,能够较好地保留图像的边界信息。由于BEMD算法可将图像分解为细节图像及余项图像,其所分解的细节图像包括DWI图像的边界信息以及主噪声,而余项图像则描述图像的趋势信息。因此,提出一种将二维经验模态分解算法与改进的维纳滤波器相结合的降噪算法,并将该算法应用于DWI图像的降噪中。通过实验,将所提出的算法与其

期刊

改进维纳滤波器莱斯校正扩散加权图像二维经验模态分解modified Wiener filter Rician correction diffusion

针对语音变换的语音篡改检测

针对使用语音变换技术的语音篡改,提出一种自动检测方法。在分析语音变换基本模型和变换语音失真的基础上,提取语音信号的声道参数以及相关的信号统计量,并通过支持向量机递

期刊

语音变换语音篡改检测声道参数信号统计量voice transformation speech tampering detection vocal tra

基于改进DE-Tri-Training算法的汉语多词表达抽取

与本文相关的学术论文