【摘 要】
:
在社交网络上,用户常创造一些变体词来替代部分实体名词,将这些变体词还原为原目标词是自然语言处理中的一项重要工作.针对现有变体词还原方法准确率不够高的问题,提出了基于
【机 构】
:
中国科学院信息工程研究所第二研究室,北京100093中国科学院大学网络空间安全学院,北京100049;
论文部分内容阅读
在社交网络上,用户常创造一些变体词来替代部分实体名词,将这些变体词还原为原目标词是自然语言处理中的一项重要工作.针对现有变体词还原方法准确率不够高的问题,提出了基于有效上下文信息的变体词还原方法.该方法利用点互信息抽取出变体词和候选目标词的有效上下文信息,并将其融合进自编码器模型中,获得变体词和候选目标词更准确的编码,并依据此计算相似度进行候选目标词排序,更准确地实现了变体词还原任务.实验表明,该方法较当前主流的几种方法相比效果有显著提升,提高了变体词还原的准确率.
其他文献
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
能谱CT又称能量CT,在20世纪70年代CT诞生时首次被提出这个概念,经过近十年发展已成为主流CT成像并且广泛投入临床及科研当中[1,2].应用于临床的能谱CT以双源CT(双X线球管的双
目的识别、评价和分析洗衣液及配套工程建设项目在生产过程中可能产生及存在的职业病危害因素的种类、危害程度及防护效果,论证该项目职业卫生的可行性。方法依据国家相关法
目的:调查国内医院对眼科诊断用接触镜的消毒现状,评估其消毒效果。方法:采用方便抽样的方法对10所医院进行调查,发现氯霉素滴眼液冲洗、75%乙醇搽拭和0.05%的二氯异氰尿酸钠
目的了解2013年灵宝市某金矿职业危害现状及其控制效果。方法进行现场职业卫生调查和职业危害因素检测,根据(GBZ 2.1-2007)和(GBZ 2.2-2007)进行评价分析。结果金矿工作场所
口腔科门诊每日接待很多患儿,由于年龄小,就诊时情绪紧张、恐惧、哭闹、不予配合影响诊疗工作正常进行.为使医生能顺利完成治疗,针对不同类型患儿采取相应的护理对策,显得尤
目的探讨下肢深静脉血栓采用彩色多普勒超声检查的诊断价值。方法选择该院2015年10月—2016年10月收治的85例下肢深静脉血栓患者,全部患者均采用数彩色多普勒超声(CDUS)进行