消歧相关论文
随着互联网技术的发展和大数据时代的来临,各领域的专家信息可以轻而易举在网络上查到,然而,由于信息时代数据源质量参差不齐,不同......
围绕“差一点没VP”句式进行研究,从“差一点”词汇语义辖域跨语言比较的基础性问题出发,在大规模语料中抽取“差一点”相关语料进......
现实生活中的许多场景都存在着样本标签不确定的问题,即样本在其对应的候选标签集中,只有一个标签是真实的标签,其余标签为伪标签,......
在偏标记学习问题中,每个样本都有一个对应的候选标签集,而其中只有一个标签是真实的标签,其余标签为伪标签,如何利用标签不确定的......
以网络协作标注中的标签为研究对象,调研标签消歧方法,并将其划分为基于数据挖掘方法消歧、基于统计分析方法消歧、利用相关知识组......
本文比较各种机器翻译方法的特点,借鉴短语结构、GPSG、HPSG和语料库等计算语言学理论,采用以单词为核心的方法,建立一组以1000单词为背景的英汉翻......
源语言中单词的目标语译文选择问题,一直是人们广泛关注的难题,直接决定译文的质量。本文采用基于语料库的统计方法,利用单词与单词的......
本文首先分析了德语中的语义歧义现象,然后提出了几种借助配价和语义信息进行消歧的策略。这些策略目前都已应用于同济大学开发的TJTITR德......
用户生成性学习资源是社会化网络环境下催生出的一种新型学习资源。用户生成性学习资源的知识组织具有灵活性、浅层构成、多维链接......
针对某网站在线运行的基于词典的查询翻译接口,对接口中实现的3种比较常用的查询翻译消歧算法进行改进,利用性能测试工具Loadrunne......
从本质上说,机器翻译过程是一个多层次消歧过程。介词短语修饰歧义是导致机器翻译中结构歧义的典型原因之一。本文构造了一个基于类......
无论在自然语言处理还是在机器翻译中 ,自动分词都是一个重要的环节。本文讨论传统的切词方法中 ,歧义的形式 ,以及消歧处理方法
......
为丰富和完善馆藏数字信息资源,提出了基于语义信息检索的馆藏数字资源优化方法。该方法利用语义信息检索技术从互联网上自动采集......
【目的】从ORCID构建机制的角度,为责任者名称标识系统的选择与应用提供依据。【方法】基于文献追踪与实例调研,从构建模式、声明......
【目的】了解ORCID在IR中的整合现状、整合实践以及实现的技术方法。【方法】对IR整合ORCID的实践进行文献追踪和案例分析;对IR通......
本文在潜在歧义理论的基础上,重点分析其中两个名词的语法、语义、语用特性,对汉语中的“n+n”结构做了比较全面的研究。目的在于......
藏文信息处理技术随着对语言文字信息处理研究工作的不断深入,逐步从字信息处理转向语言信息处理。与汉语、日语等语种的信息处理......
【摘要】语料库语言学观点对于基于语料库的计算机语言学很有帮助。本文语料库语言学观点出发,特别研究如何应用语料库资源作为智能......
【目的】以面向语用消歧的量化约束条件系统(Quantifier Constraint System,QCS)为例,构建并实践从本体语言学到其计算实现的完整......
在自然语言文语料库的较高水平分析中,自动的词类分析是非常重要的组成部分.其中一个重要问题是,当词用于具体的上下文中时,获得正......
词切分是像汉语这类非拉丁语言的一个特有问题,并且由于汉语组词中普遍存在着歧义性和语境依赖性,这一问题也是一个尚未得到彻底解......
针对目前词向量表示低频词质量差,表示的语义信息容易混淆,以及现有的消歧模型对多义词不能准确区分等问题,提出一种基于词向量融......
偏标记学习是一类重要的弱监督学习框架。在该框架下,每个对象在输入空间由单个示例来描述,而在输出空间与多个候选标记相关联,但......
词义消歧一直是藏语自然语言处理重要的研究课题和热点问题.统计学方法其良好的词义消歧效果逐渐占据主流地位[1].本文根据藏文句......
期刊
ORCID(Open Research and Contributor i D,开放研究者和贡献者标识符),创立于2010年,是一个非盈利的组织,具有开放性和国际性。OR......
今年是第四次世界妇女大会10周年纪念。2005年2月28日至2005年3月11日,来自不同国家的上千人齐聚联合国纽约总部,参加第49届联合国......
This article reviews the historical course of providing for the protection of women’s rights in the realm of internatio......
句法歧义消解是指在面临多种句法分析的情况下,句法分析器抑制不正确的句法分析而选择正确句法分析的认知过程。研究表明,该过程受......
汉语自动句法分析是当前计算语言学研究的一个热点,由于存在可利用的信息不足、汉语词性和汉语词的语法功能不存在一一对应的关系......
本文通过对歧义结构“没有VP的NP”所进行的语音分析、语料编辑与听辨实验发现,这种结构的消歧韵律手段为“没有”和NP的基频与时长......
动分词技术是计算语言学中的一个瓶颈问题,在刚刚做过的留学生汉语语料库词性标注工作中,我们也发现了许多关于自动分词的问题。围......
ECZ是一个实用的基于知识的一代英汉机译系统,其“七五”期间的目标是建立一个在32位微机上的模型翻译系统。这个翻译系统在纳入......
提出一种汉语分词方法。与其它的如利用单一统计特性的统计方法或者纯规则方法不同,该方法利用字、词、上下文、语法及语义等多种知......
汉语词性自动标注工作是汉英机器翻译的基础。在汉语的词性标注中重点要解决的是兼类词的消歧问题。本文采用了归纳学习算法与覆盖......
以维吾尔语为代表的低资源、形态丰富语言的信息处理对于满足“一带一路”语言互通的战略需求具有重要意义。这类语言通过组合语素......
偏标记学习是一类重要的弱监督学习框架,在该框架下,每个训练样本与一组候选标记相关联,在候选标记集合中有且仅有一个是其真实标......
4月25日是世界导盲犬日。在我国,作为一种新兴事物,导盲犬却正在遭遇“出行难”。珍妮是1头温顺聪明的导盲犬,2011年3月的时候,它走进......
分析了句子中确定信息的特征,将其归结为不同层次的模式。分别对模式进行了形式化,对相同层次的模式赋予不同的优先级.利用这些确定信......
在中学语文教学中经常会碰到一些由于语义指向引起的歧义。显然,利用传统的中心词分析法或层次分析法无法解决这种分歧。20世纪80年......
首先从大规模语料中采集到组合歧义字段,进而对其搭配信息进行统计.最后应用多元对数似然比计算出消歧参数进行消歧,实验中考虑了歧义......
汉语自动分词问题是制约中文信息处理发展的瓶颈之一,歧义切分又是影响分词系统切分精度的重要因素。在对已有方法深入分析的基础上......
重点在于融和丰富字特征作为消歧知识以提高分类性能和引入不等式平滑技术来克服数据稀疏问题,同时不等式平滑技术还使特征选择嵌......
面向数据的分析技术(Data-Oriented Parsing,DOP)是一种概率分析策略,其概率模型的主要目的在于为一个给定的句子找到最可能的分析,即分......