消歧相关论文
随着互联网技术的发展和大数据时代的来临,各领域的专家信息可以轻而易举在网络上查到,然而,由于信息时代数据源质量参差不齐,不同......
现实生活中的许多场景都存在着样本标签不确定的问题,即样本在其对应的候选标签集中,只有一个标签是真实的标签,其余标签为伪标签,......
本文首先分析了德语中的语义歧义现象,然后提出了几种借助配价和语义信息进行消歧的策略。这些策略目前都已应用于同济大学开发的TJTITR德......
【摘要】语料库语言学观点对于基于语料库的计算机语言学很有帮助。本文语料库语言学观点出发,特别研究如何应用语料库资源作为智能......
偏标记学习是一类重要的弱监督学习框架。在该框架下,每个对象在输入空间由单个示例来描述,而在输出空间与多个候选标记相关联,但......
ORCID(Open Research and Contributor i D,开放研究者和贡献者标识符),创立于2010年,是一个非盈利的组织,具有开放性和国际性。OR......
Internet 技术的发展为人们提供了方便快捷的信息获取手段。面对网络上的海量信息,人们有时往往会感到无所适从。如何为每个用户提......
4月25日是世界导盲犬日。在我国,作为一种新兴事物,导盲犬却正在遭遇“出行难”。珍妮是1头温顺聪明的导盲犬,2011年3月的时候,它走进......
分析了句子中确定信息的特征,将其归结为不同层次的模式。分别对模式进行了形式化,对相同层次的模式赋予不同的优先级.利用这些确定信......
在中学语文教学中经常会碰到一些由于语义指向引起的歧义。显然,利用传统的中心词分析法或层次分析法无法解决这种分歧。20世纪80年......
首先从大规模语料中采集到组合歧义字段,进而对其搭配信息进行统计.最后应用多元对数似然比计算出消歧参数进行消歧,实验中考虑了歧义......
汉语自动分词问题是制约中文信息处理发展的瓶颈之一,歧义切分又是影响分词系统切分精度的重要因素。在对已有方法深入分析的基础上......
重点在于融和丰富字特征作为消歧知识以提高分类性能和引入不等式平滑技术来克服数据稀疏问题,同时不等式平滑技术还使特征选择嵌......
面向数据的分析技术(Data-Oriented Parsing,DOP)是一种概率分析策略,其概率模型的主要目的在于为一个给定的句子找到最可能的分析,即分......
由于本体能够消除概念的混淆和重用知识,因此它的质量对于语义网技术的应用非常重要。为了提高本体的质量,很多的工作集中在概念建......
提出了一种以概念相关性为主要依据的名词消歧算法。与现有算法不同的是,该算法在WordNet上对两个语义之间的语义距离进行了拓展,......
机器翻译实现过程中会涉及到形态自动分析方法、各种句法分析、语义分析等分析方法,是机器翻译译文质量的关键环节。 形态自动分......
针对Web文本挖掘中的中文信息处理的问题,介绍了将超文本格式(Html格式)的文档转化为纯文本格式(Txt格式)文档的方法.利用改进的最......
本文使用句法评分和语义评分对句法分析和语义分析阶段进行消歧。句法评分和语义评分可以和传统的句法语义分析阶段结合起来,更有效......
《中文信息结构库》是《知网》的重要组成部分之一,可以作为中文语义分析的规则库,对其进行消歧是实际应用的基础之一。因此,该文......
动词义项如何区分是汉语本体研究及包括中文信息处理、对外汉语教学在内的应用研究的重要内容。目前,相关研究已取得了丰富的成果,......
文档聚类随着网上文本数量的激增以及实际应用中的需求,引起了人们广泛的关注。针对目前文档聚类的主要缺陷,提出了一种新的基于本体......
针对生物医学数据库中基因标识符的描述信息不够丰富和完整,不能很好地区分歧义词不同含义的问题,给出了一种基于扩展语义相似度的基......
为了解决多部主题词表联合标注中标注词条数量大、子串较多等问题,本文提出了基于MMSeg分词的标注方法.采用MMSeg分词算法将待标注......
配价理论对汉语的句法结构组合具有一定的解释力,它可以从语法的角度来进行优选,消除句法结构歧义。带有致使意义的动词会对动词的配......
在信息处理领域,对语言的理解十分重要,而这离不开语义知识的使用。本文建立了基于框架的汉语语义知识表述体系,研究了基于语料的语义......
鉴于自然语言语序的灵活性,使得自然语言知识的自动消歧很困难。提出一种机器翻译中多义词词义消歧的新方法,从语境相关素的角度着手......
组合型歧义切分字段一直是汉语自动分词的难点。用人工校验后的分词语料提供的搭配实例作为组合歧义字段的初始搭配知识,提出使用搭......
自动分词和译文生成处理是混合式汉英机器翻译的两个重要阶段。本文主要工作有:第一,讨论了机器翻译的理论模型;第二,给出了一个自动分......
以汉语句法结构分析中最普遍存在的句法结构歧义现象,即“动词短语+名词短语+的+名词短语”(VP+NP1+的/u+NP2)为研究对象,提出了一种基于知网......
在偏标记学习中,示例的真实标记隐藏在由一组候选标记组成的标记集中。现有的偏标记学习算法在衡量示例之间的相似度时,只基于示例......
分析了LALR(1)分析器生成系统中语法分析冲突问题的起因和解决冲突的时机及策略,提出改写文法应遵循的4条规则,将常用的文法改写技......
采用基于转换的方法进行汉英机器翻译 ,在机器翻译的每个阶段 (汉语切分、词性标注、句法语义分析、树转换、词串生成 )采用规则方......
随着信息技术的不断发展,快速增长的数据涌现在人们眼前,各式各样的信息充斥在生活的各个角落。因此,如何准确地从众多数据信息中......
框架语义分析是目前汉语口语对话系统中常用的语义解析方法,本文分析了语义分析过程中容易产生的两种典型歧义现象-结构歧义和语义......
疾病一直是威胁人类健康的一大因素。因此,如果人们能够对疾病具有更多的了解,就能够提前做好预防措施。然而与疾病相关的文献呈指......
设计了一个基于W eb文本挖掘的分词系统。具体介绍了如何将H tm l格式的文档转化为Txt格式文本,以及利用M M法来实现对文档的汉语......
本研究通过内省选择题测试和问答题测试考查了某大学英语专业三年级和四年级100余名学生理解"直接宾语/主语"类花园路径句的情况。......
消除歧义是英汉翻译系统中要着重考虑的问题。本文首先介绍了歧义的分类,其次介绍了在我们的英汉翻译系统中采用的基于制约的方法处......
自然语言文档复制检测技术是信息处理领域中一个重要的研究课题,是保护知识产权和提高信息检索效率的一种有力手段。文档复制检测......
介绍跨语言信息检索的内涵、发展历程、检索过程及主要技术方法,详细阐述平行语料库的工作原理、优势、取得的成果,分析其在跨库语言......
翻译歧义是影响跨语言信息检索效果的主要因素之一。本文论述了跨语言信息检索中翻译歧义性问题产生的原因,并且总结了目前消除这......
语法歧义是由于句子成分的构造或关系而引起的歧义.韩国语语法歧义包括句子成分歧义、语法关系歧义和否定范围歧义三种.其中,语法......
词对齐是机器翻译领域中的一项基础性课题,已经应用到很多领域中。针对词对齐中翻译歧义和位置歧义问题,提出一种基于锚点词对的通用......
聚类相关度大的个人微博有助于快速了解博主的专业兴趣和经历,目前的短文本聚类方法缺乏对于语义和句子相关度的充分考虑,提出了一......
量词辖域歧义是语言研究的重要课题之一。英、汉语在量词辖域歧义方面存在不对称的现象。汉语简单句中存在着多种类型的量词辖域歧......