词汇相似度相关论文
随着计算机理论和技术的飞速发展,自然语言处理在日常生活以及学术研究中都变得越来越重要,计算词汇相似度就是其中的一个重要方面......
在数字化和网络化浪潮的逐步推动下,情报学、自然语言处理和文本挖掘的研究对象和任务正在悄然发生改变,这种改变主要表现在,从非......
机器翻译系统是人类使用计算机来处理自然语言的一个工具,为了能实现机器翻译,其涉及的领域包括数学,语言学,计算机科学,甚至延伸......
聚类分析是一种无监督的机器学习方法,能有效地组织文本信息,应用非常广泛,而大部分文本聚类算法都采用向量空间模型表示文本对象。因......
C语言试题库是学校C语言考试系统的基础。由于常年的使用以及原系统缺乏重复试题检查功能,在试题库的不断扩充下题库里难免存在大......
在概述相关概念基本内涵和当前关键词-主题词映射主要实现方式基础上,综析了当前主要的中文关键词到主题词自动映射技术:基于词汇......
本文提出一种全局优化的文本分割模型,其中设计了基于语段内部词汇相似度、语段间词汇相似度和语段长度的分割方式评价函数,并采用二......
[目的]在文献层和词汇层之间加入主题层,研究一种新的词汇相似度计算方法.[方法]阐述基于形式概念分析(FCA)的主题定义和表示模型,......
广西梧州市的方言情况比较特殊,市区通用的是广府粤语,郊区通用的是勾漏粤语,从而形成一个被勾漏粤语包围的广府粤语方言岛。长期以来......
对资源分析方法进行了研究,并提出了一种基于情感Ontology的分析方法.首先基于“知网”构建情感Ontology,然后基于情感Ontology抽......
针对传统查询词临近性(QTP)分析方法无法有效提高查准率的问题,提出了一种孤立项过滤的信息检索查询词分析方法.该方法根据词汇相似度......
采用编辑距离法计算《学科分类与代码》(医学类目)与《医学专业分类表》分类体系类目词汇相似度,通过计算机辅助映射结合人工判断类目......
词汇相似度是信息检索、机器翻译、自动文摘、自动问答等应用研究的基础,它是自然语言处理领域中的重要研究课题.本论述研究潜在语......
金乡话是温州市苍南县金乡镇城区内居民使用的一种独特的方言。金乡话的形成与明洪武二十年(1387)所设金乡卫直接相关。金乡卫的建......
为了使个性化虚拟人更加形象生动,能根据用户输入的文本做出表情动作,运用自然语言处理技术对中文和英文文本进行语义和分类处理,......
作为自然语言理解的一项基础工作,词汇语义相似度度量一直是研究的重点。语义相似度度量本身是一个中间任务,它是大多数自然语言处......
对资源分析方法进行了研究,并提出了一种基于情感Ontology的分析方法。首先基于“知网”构建情感Ontology,然后基于情感Ontology抽取......
专利作为一种具有特殊性质的文献,包含先进的技术方案,但存在管理困难、相对孤立、使用率低等弊端。针对该问题,定义分类法类目的......
互联网的迅猛发展和广泛普及使得互联网成为人们获取信息和交流信息的重要平台。一方面,互联网的规模呈爆炸式的增长,网络用户借助......
本体间的异构是语义网建设亟待解决的问题,本体映射则是解决本体异构的有效手段。中文资源是信息网络的重要组成部分,实现中文本体间......
针对网络舆情中观点的获取问题,提出了基于情感词典的情感倾向性分析方法。介绍了情感词的基本概念,给出了基于How Net概念词典通......
为克服传统的短语抽取方法对词对齐信息的依赖性强,抗噪声能力差这一缺陷,提出基于词汇相似度约束的短语抽取策略;在此框架下,提出......
汉语词语语义相似度计算是中文信息处理中的一个关键问题。在知网(HowNet)环境下,通过分析影响词汇相似度计算结果的概念层次树结......
以梧州话、倒水话为例,对两种方言的1300多个日常所用词项进行词汇相似度的计量分析,并以粤方言的标准方言广州话与梧州话的相关系......
网络信息和信息检索在人们日常生活中已成为不可或缺的组成部分,语言文字占据信息形式上的绝大多数,实际上关注的是语言形式所承载......
传统口译理论认为口译中偏重意思的翻译(meaning-based interpreting)占主导地位,偏重形式的翻译(form-based interpreting)占次要......
对文本倾向性分析方法进行了研究,并提出了一种基于情感Ontology的分析方法。首先基于《知网》构建情感Ontology,然后基于情感Onto......
利用知网的义原层次树,考虑树的深度、密度等因素对义原节点权重的影响,得到义原相似度。通过分析义项的描述语言结构,将关系义原......
信息资源的海量剧增,导致我国科技信息用户在“信息爆炸”的环境中,饱受“知识饥荒”和“找不到真正所需求的和最新的信息和数据”......
近些年来,形象生动的虚拟人越来越受到人们的喜爱。越来越多的外形漂亮的虚拟人出现在电影、游戏以及因特网上。如何同虚拟人进行......
随着互联网在中国的普及,人们的生活方式也逐渐地发生变化,越来越多的人通过互联网获取和发布信息。广大互联网用户开始在微博上传播......
词汇相似度广泛应用于自然语言处理的多个领域。然而词汇相似度的计算一般都是基于词而不是基于词的义项来进行的。针对这种情况,......
随着语义Web的不断发展,本体数量日益增加。本体匹配作为本体映射、比较和集成的基础,具有重要的实际意义。由第3届国际语义web大会(3......
相似词是自然语言中普遍存在的现象,词汇相似度计算是情报学、自然语言处理和信息处理等领域的一项中间步骤。首先,基于大规模语料库......