基于Word Embedding语义相似度的字母缩略术语消歧

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:zyfscu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文提出基于Word Embedding的歧义词多个义项语义表示方法,实现基于知识库的无监督字母缩略术语消歧.方法分两步聚类,首先采用显著相似聚类获得高置信度类簇,构造带有语义标签的文档集作为训练数据.利用该数据训练多份Word Embedding模型,以余弦相似度均值表示两个词之间的语义关系.在第二步聚类时,提出使用特征词扩展和语义线性加权来提高歧义分辨能力,提高消歧性能.该方法根据语义相似度扩展待消歧文档的特征词集合,挖掘聚类文档中缺失的语义信息,并使用语义相似度对特征词权重进行线性加权.针对25个多
其他文献
人类对常识的认知与原型和定势都有关。原型被称为是一类事物中的"最佳样板",是人类对常识认知的基础和核心部分,有助于我们对常识的认知进行范畴化。定势是人类思想范畴化的
<正>2005年3月5日至19日,由司法部组织,由来自最高人民法院、最高人民检察院、全国人民代表大会常务委员会、公安部、司法部以及山东省司法厅等单位的人员组成考察团对澳大利
智能包装能主动监测、传感、记录、溯源食品在流通过程中所经历的内外环境的变化,帮助消费者直观、准确、科学的判断食品质量与新鲜度状况。智能包装中常用的智能指示器可以
杂交杏李(Plunt or Aprum)是杏和李杂交后,再与李或杏回交而培育出的果树杂交新品种。美国开展杏、李种间杂交育种已有70余年,取得了丰硕成果.近年培育出的新品种就达10多个。美国
目的:分析高脂血症患者脑血流动力学的改变,探讨经颅多普勒(transcranial Doppler,TCD)对高脂血症患者的临床应用价值。方法:应用TCD检测63例高脂血症患者(高脂血症组)脑血流
《高校英语专业教学大纲》新增视听说课程旨在提高学生听说技能的同时培养其创新、独立思考和批判性思维能力。集独创性、多元性和时代性于一身的TED演讲资源在视听说课程立
目的 :探讨脂多糖 (lipopolysaccharide ,LPS)信号转导分子TLR4(Toll likereceptor 4 ,TLR4)与肝脏损伤的关系。方法 :小鼠腹腔注射LPS后不同时间点取肝脏组织 ,HE染色观察病
在初中英语教学过程中部分教师忽略了语法教学的重要性,出现教学观念偏差、语法教学被弱化、教学方法固化以及教学评价片面化等问题。从此类问题出发,寻找形成问题的原因,探
在小学数学教学过程中,教师要自然地将德育工作渗透其中,积极探索在小学数学教学中进行道德教育的机会和资源.尤其可以结合新授课的内容进行德育渗透,抓住德育渗透的机会,与
<正>2007年3月9日,最高人民法院、最高人民检察院、公安部、司法部联合做出了《关于进一步严格依法办案确保办理死刑案件质量的意见》,该《意见》第45条首次以"应当"的方式明