命名实体相关论文
随着互联网的发展,网络已经成为人们日常生活中必不可少的一部分。人们获取新闻时事的主要渠道已经由传统的纸质版媒介转化为以互......
对我国公共数字文化资源中的优秀传统文化内容进行多语言组织与检索,能够有效促进我国优秀传统文化的推广,推动中国优秀传统文化"......
在科学文献管理中,存在大量的科学技术文献需要被高效的识别、分类和保存.对于研究者来说,在研究该领域的相关知识时,通常会检索该......
随着网络技术和计算机技术的飞速发展,网上的信息呈带宽的指数级增长。在这样一个信息量爆炸的社会中,人们希望通过网络获得大量信......
在自然语言处理和信息检索的领域中,语义相关度的测量一直扮演着非常重要的角色。目前很多工作都集中在词与词之间的语义相关度测量......
词义消歧(WSD)技术是计算机根据文本距离、上下文语境等特征来自动获取并确认词语的意义。词义歧义是指一词多义,即一个词在不同的......
随着网络技术的发展,网络上电子可读文本的日益增加,呈指数膨胀的文本信息资源,使得如何准确有效地获取用户所需要的信息成为人们关注......
随着互联网的迅猛发展,Web已经成为世界上最大的信息资源,各种不同的应用都在使用Web信息资源。搜索引擎是目前信息检索最常用的工具......
随着互联网的发展,计算机要处理的文本信息越来越多。人们期望计算机能迅速、准确地理解他们的需求和返回精准的信息。传统的搜索引......
随着搜索引擎用户量大规模的增长,对于搜索引擎服务质量和性能提出了挑战。基于用户搜索行为过程中产生的大量搜索日志,相继展开了优......
实体间语义关系抽取是信息抽取中的重要环节,目的是通过命名实体对的上下文来确定实体之间是否存在关系以及存在何种关系。作为实体......
随着电子计算机技术和互联网的快速发展,网络知识资源呈爆炸式增长,网络资源内容多样,人们往往不能有效的获取、利用所需的网络知......
处于大数据时代下,网络信息出现迅猛增长的趋势,互联网日趋发展成为一个信息覆盖面广的共享仓库,与此同时,对信息资源进行准确地理......
随着互联网信息的飞速发展,信息的增加在满足人们对信息需求的同时也给人们快速、准确的查找所需要的信息带来了一定的难度。在这种......
命名实体(Named Entity,NE)识别的任务是识别出文本中特定的实体,它是信息抽取、机器翻译、信息检索和自动问答等多种自然语言处理......
随着互联网技术的不断发展和应用的不断深入,在线可用的信息呈爆炸式增长。当在线的信息持续增长时,现有的搜索引擎的不足,比如系......
随着网络对传统出版物和媒体的冲击,用户对于新闻浏览习惯发生了改变,越来越多的人养成了每天在网络上浏览新闻的习惯。本文研究如......
随着计算机网络技术的发展,全球互联网用户快速增长,网络信息资源语种也日益多样化,跨语言信息检索已成为越来越重要的研究课题。......
随着世界经济一体化的进展,各国之间互联网交流更为广泛、频繁,互联网信息的多语种特点,给交流带来的语言障碍日显突出。为解决语......
随着社会的发展,互联网信息呈现爆炸式的增长,通过观察网民提交的文本发现,大多数网站特别是新闻和政府的网站,文本信息都具有结构......
随着计算机的快速普及和Internet技术的迅猛发展,网络上的各种信息呈现指数级的增长,Web已经成为一个巨大的信息资源库,从海量数据中......
双语实体在跨语言信息检索、机器翻译等领域有着非常重要的应用。由于缅甸语为资源稀缺语言,汉-缅双语语料库构建面临着很多困难。......
词对齐技术是统计机器翻译中的翻译模型和调序模型的基础,这表明了词对齐技术是统计机器翻译系统中最重要部分。同时,词对齐技术在......
在家庭机器人研究领域,如何将语音指令正确地转化为机器人可执行的任务序列已经成为重要的研究课题之一。解析指令的能力成为机器......
随着一带一路的大力发展,中国与东南亚各国的交流也逐渐频繁,中国和老挝国自古以来关系密切,语言作为重要的交流工具,加强对老挝语......
本论文为比较研究中蒙两国蒙古语网络语言词汇的特点,从中国和蒙古国的共20个蒙古文和基里尔文网站的《时事政治》、《财经》和《......
学位
图像描述是指用于解释图像内容的语言,也被称为图像注释或图像标题。图像描述生成任务则旨在通过一定的技术和方法实现图像描述的......
基于神经网络实现的机器翻译模型已逐渐成为机器翻译的常用方法。但自然语言的复杂性和神经网络随机性导致了未登录词和翻译不可控......
双结构网络是一种以互联网为主结构而以播存网络为次结构的新型网络架构,其能够充分利用物理广播向用户一侧分发互联网热门内容,以......
特定领域的命名实体识别方法在不同的领域中都会存在很大的差别.不同领域的文本具有其自身的不同的特性,这致使目前已有领域的识别......
语义相关度分析足自然语言处理领域的一项基本研究内容,是文本智能化处理和分析的关键技术,主要研究的是文本中词语之间语义关联程......
通过引入扩展频谱技术对水印信息进行编码,提出一种篇章层的自然语言数字水印方法.抽取文本中所有命名实体构成一个向量空间,根据......
命名实体翻译可以有效地提高跨语言信息检索、统计机器翻译等系统的性能.双语新闻语料包含了丰富的命名实体,利用统计方法可以从中......
为解决将汉语人物简历翻译成维吾尔语版本所面临的高成本、低效率等问题,设计并实现了一种基于模板与词典相结合的人物简历汉维机......
在国内外机器翻译、信息检索等领域中英文及中文的命名实体研究技术基本成熟,但是维吾尔文命名实体识别还处于初步阶段,本文中笔者......
期刊
命名实体(Named Entity,NE)蒙古语中又称专有名词等,是指文本中的人名、地名、组织机构名等命名实体。命名实体识别作为自然语言处......
互联网上包含了大量实体的属性信息,如人物的别名、籍贯、出生年月、商品的价格、制造商等.通过搜索引擎获取此类信息时,需要从搜......
藏文命名实体识别是藏文分词和标注系统中必须要解决的问题。通过对命名实体构词规律及分词歧义进行分析,提出基于音节特征感知机训......
针对话题追踪静态阈值的缺点和虚假相关报道问题,提出一种基于动态阈值和命名实体双重过滤的话题追踪方法。该方法中,研究了KL距离......
In this work,an approach is proposed to acquire synonymous attribute phrases of named entities(NEs) from an online encyc......
传统方法将事件检测任务看作分类问题,将词作为实例来训练分类器,容易导致训练正反例不平衡,同时,在语料库规模较小时存在一定的数据稀......
针对话题跟踪任务及话题自身的特点,研究了面向该任务的文本表示技术,通过对文本表示技术的研究来提高话题跟踪系统的跟踪性能。通......
在线百科实体标注目的是标注出属于特定类别(如人名、地名、机构名等)的实体。百科实体标注对大量的应用,诸如实体消歧、实体关系挖......
冗余信息去重是信息抽取中的重要任务,对于多元素表示的信息,该文针对以往对各个元素统一处理所存在的问题,将信息元素进行分类,由......
指代消解是自然语言处理中的重点难点,对信息抽取具有重要意义.指代分有三种形式:代词指代,名词指代及零形回指.其中代词指代和名词......