基于语义构词的汉语词语语义相似度计算

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:cyw87325
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语词语语义相似度计算,在中文信息处理的多种应用中扮演至关重要的角色。基于汉语字本位的思想,我们采用词类、构词结构、语素义等汉语语义构词知识,以“语素概念”为基础,计算汉语词语语义相似度。这种词义知识表示简单、直观、易于拓展,计算模型简洁、易懂,采用了尽可能少的特征和参数。实验表明,该文方法在典型“取样词对”上的表现突出,其数值更符合人类的感性认知,且在全局数据上也表现出了合理的分布规律。
其他文献
【正】辛亥孟春,至黔东南州参观学习档案工 作,受益非浅。返怀数日,夜不能寐,故作 此词,以志纪念。 黔东好,胜地近曾游。古今典籍集兰台,天地精华聚阁楼,金凤出雷山。
2006年8月27日,BSI产品服务参加了由中国贸促会电子信息分会和广州市巨流信息科技传媒公司在深圳会展中心举办的2006亚洲电子产品贸易展(AES)。电子电气部总监高弥柯先生(以下简
【正】十一届三中全会以后,随着我省档案工作的恢复和发展,档案学术研究也逐步复苏。1982年省档案学会的成立,《贵州档案》的创刊,标志着我省档案学术研究发展到一个新的阶段
在 HIV-1 Vif 蛋白质和细胞的主人 APOBEC3G 蛋白质之间的相互作用是为 HIV-1 复制的抑制的一个有希望的目标。就那个人而言,房间是为蛋白质相互作用的学习的很复杂的环境,这研
针对维吾尔语名词短语待消解项识别任务,该文提出一种利用栈式非负约束自编码器(Stacked Nonnegative Constrained Autoencoder,SNCAE)完成基于语义特征的待消解项识别方法。为
为了为 SARS-CoV nucleocapsid 基因 expression.The recombinant 的可诱导的控制建立真核细胞的房间线, pTRE-Tight-SARS-N 的 plasmid 被把 plasmid p8S 用作包含盖住 SARS-
三 H9N2 鸟的列性感冒病毒(AIV ) 孤立在 Guangxi 从鸡被孤立省。八份特定的教材在 GenBank 根据 H9N2 的序列被设计并且综合。种系发生的分析证明在 Guangxi 之间的相同的高
疱疹单一的病毒的分子的修正打字我(HSV-1 ) 乙酰化和磷酸化代表的蛋白质对它的生物功能必要。细胞 chromatin-remodeling/assembly 涉及 HSV-1 在怀有 lysin 的 HSV-1 或潜
土拨鼠模型是一个优秀动物模型学习 hepadnaviral 感染。在使可能检验 T 房间的这个模型的新进步调停了在尖锐、长期的 hepadnaviral 感染的有免疫力的回答。最近,为细胞毒素
对自由文本形式的中医古籍文献(医古文)进行标注,是对其进行深入分析的前提,语义标注技术是实现该目的的方法之一。该文将中医古籍文献中包含的术语分为名称性术语以及叙述性术语