A Novel Similarity Measure to Induce Semantic Classes and Its Application for Language Model Adaptat

来源 :计算机科学技术学报(英文版) | 被引量 : 0次 | 上传用户:nie492195407
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
In this paper,we propose a novel co-occurrence probabilities based similarity measure for inducing semantic classes.Clustering with the new similarity measure outperforms the widely used distance based on Kullback-Leibler divergence in precision,recall and F1 evaluation.In our experiments,we induced semantic clases from unannotated in-domain corpus and then used the induced classes and structures to generate large in-domain corpus which was then used for language model adaptation.Character recognition rate was improved from 85.2% to 91%.We imply a new measure to solve the lack of domain data problem by first induction then generation for a dialogue system.
其他文献
目的探讨环磷酰胺(CP)与异环磷酰胺(Ifo)对混悬培养大鼠肝细胞的毒性效应及其可能机制.方法以两步灌流法消化成年大鼠肝细胞,并进行混悬培养.CP与Ifo分别以20mmol染毒,观察染
目的用黑腹果蝇的生存试验来检测烹调剩油对黑腹果蝇寿命的影响.方法收集8 h内羽化而未交配的果蝇进行雌雄分组,每个浓度组200只果蝇,雌雄各8个浓度组,每2 d记录果蝇存活数,
目的了解108抗衰口服液是否具有延缓衰老作用.方法试验选20月龄SD老龄大鼠随机分为老龄对照组及908、1 816、3 632 mg/kg 3个剂量组(分别相当于人推荐饮用量的2.5、5和10倍).
目的转基因棉仁粉可作为家畜、家禽的饲料,研究其毒性.方法将转基因棉仁粉和普通棉仁粉均作脱棉酚处理后,进行大鼠和鹌鹑的短期喂养试验.依据和国家环保总局.大鼠分性别按体
目的评价转基因T5线辣椒的毒性.方法大鼠30 d喂养实验.结果受试动物连续灌胃转基因T5线辣椒30 d后,各组动物健康状况良好,实验组与对照组体重基本同步增长,各剂量组体重、脏
《比翼齐飞》是2017年1月笔者在山东威海荣成市成山镇烟墩角村拍摄的。尼康D4数码相机,70—200mm镜头,185mm端,光圈f/11,快门速度1/250s,曝光补偿+2/3,多区测光模式。烟墩角
目的了解化学中毒事故的病因分析与救治中的毒理学援助的作用.方法以毒物咨询和(或)毒理学实验的方法,对广东二氯乙烷职业中毒事故、广东省金利有机氟中毒事故的病因和乙酰胺
目的了解华神天麻花粉片的亚慢性毒性.方法选用离乳大鼠80只,雄雌各半.试验设625、1 250、2 500 mg/kg3个剂量组和阴性对照组.将受试物按动物体重的10%掺入饲料中喂养1个月,
期刊
目的工艺花卉着香剂是由多种化合物配制成的新型工艺花卉增香物质,为了解其急性毒性和致突变作用,为安全应用提供科学依据进行了实验研究.方法急性毒性实验,按Hs法.昆明种小