词嵌入相关论文
命名实体识别是进行文本处理的基础技术手段,深度学习因其强大的学习能力能够挖掘更深层次的文本特征而深受命名实体识别领域研究......
随着网络的普及以及智能设备的广泛使用,海量关于各种事务的文本评价存在于网络当中,并且随着时间的递增,文本的数量也在呈指数形......
作为自然语言处理(Natural Language Processing,NLP)的基础任务,文本分类的目标是用一个或多个类标签对文本进行标注,在信息挖掘和......
如今,电话诈骗案件层出不穷,严重危害到了人们的财产安全和社会的和谐安定。针对社会中的一些诈骗电话问题,提出了一种基于词嵌入和混......
近年来随着个人计算机数量与移动个人终端数量不断攀升,每时每刻都有大量的数据产生。为了更好的处理与利用这些数据,Google公司首......
在软件开发过程中,用户或测试人员在发现被测软件异常情况后,会提交描述相关问题的缺陷报告,开发人员需要仔细分析缺陷报告并查看......
在基于点云和图像的三维模型分类检索中,现有特征融合方法忽略了模态内特征信息和模态间互补信息,存在融合特征丢失的问题,且分类标签......
细菌在次级代谢过程中产生的天然产物具有丰富的化学结构和生物活性,包含着抗生素、抗癌药物和抗病毒药物等多种类型的小分子候选......
随着计算机理论和技术的飞速发展,自然语言处理在日常生活以及学术研究中都变得越来越重要,计算词汇相似度就是其中的一个重要方面......
Internet网络拥有海量的各类电子文本内容,而且还在快速增长,其中隐含大量有价值的信息。通过主题建模从大量文本内发现文本的主题......
在信息过载的大数据时代,推荐系统发展迅速。纵观传统室内空间设计行业,其设计工作的专业性强、人工参与率高,从而导致成本高。人......
传统的话题演化跟踪任务主要使用基于主题模型的方法,但该方法对于文本语义的提取及表征能力较弱.该文在词嵌入方法的基础上结合LD......
深度神经网络(deep neural networks,DNNs)在自然语言处理(natural language processing,NLP)的各个领域特别是情感分析领域已经取得了......
针对中文命名实体识别中词嵌入表示不充分,以及传统分词方法存在分词错误引起误差传播的问题,提出两种词嵌入编码策略,并结合预训......
首先分析了当前在市场质量监管领域开展质量风险分析和产品伤害分析的主要做法,再以重点工业品为研究对象,使用中国质量新闻网民生......
寨上-马坞矿集区位于西秦岭多金属成矿带,有寨上金矿、马坞金矿、锁龙金矿、新庄里金矿、雪花山钨矿、半沟铅锌矿等矿床产出。前人......
DBLP数据库是一个以作者为核心的计算机类英文文献数据库,其中存在着大量的同名作者,为数据库的使用带来了较大的不便.针对DBLP数......
随着互联网技术的快速发展,在线广告系统已成为各个互联网公司的重要收入来源。广告曝光预估是在线广告系统比较重要的一个环节,其......
文本数据大多数是非结构化数据,如何有效处理和准确表达文本的原始信息在文本分类任务中是首要前提,从非结构转化为结构化数据的过......
分层存储是计算机存储领域的一项重要技术,其核心设计是将数据存储在多层级的存储介质中,通过热点文件识别和数据迁移技术来掩盖访......
越界写入漏洞,又名CWE787,通过该漏洞可以修改索引或执行指针算法,修改缓冲区的边界之外的内存数据。如果后续有写入操作,便会产生......
代码克隆检测是程序质量分析中的一项重要任务,检测出程序中的克隆代码有利于提高软件项目的可维护性,降低程序代码冗余。近年来,......
自动文本摘要是人工智能领域中一个非常重要的研究方向,根据摘要产生方式的不同可分为抽取式摘要和生成式摘要。生成式摘要因为与......
互联网的迅速发展和流媒体音乐服务的强势崛起,使得人们能够随时随地聆听海量音乐。人们享受着信息增长带来数字红利的同时,也面临......
[目的]跨学科的研究内容推动了科学重大发现的产生,科研人员需要了解其研究方向中所出现的跨学科研究内容.科学文献规模变得越来越......
在线社交软件的普及使用正在重塑人们的交流表达方式。人们不再满足于在线下加入能让自己产生归属感的群体或兴趣社团,而将注意力......
数学公式检索是信息检索领域一个重要的研究方向。它的检索对象包含数学公式这种具有复杂的二维结构特征的数据。传统的文本检索方......
中医是重在调理、以预防为主的独特的传统医学,经过代代传承至今。经典医案作为当今中医的成功案例被各大期刊杂志记载,能够对临床......
为了帮助像考古学家、历史学家、网络审查员这类人从文档中快速查找感兴趣的内容,使用深度学习等技术对文档(如手写历史文档)进行快......
命名实体识别(NER,Named Entity Recognition)是自然语言处理的热点方向之一,目的是识别文本中的命名实体,并将其归纳到不同的实体类......
近年来,主题情感联合模型成为了无监督学习领域的一项重要研究内容,在文本主题挖掘和情感分析等方面均有实际应用.然而,在现实场景......
随着深度学习理论的不断发展和完善,基于深度学习的模型逐渐成了近些年自然语言处理技术的主流研究方法。而表征学习是基于深度学......
事件抽取是构建知识图谱的关键前置任务之一,而事件论元抽取是事件抽取的子任务,对事件抽取质量有显著影响.针对现有的流水线式事......
社交媒体的不断发展使其逐渐成为互联网用户发表观点和意见的主要平台。每天有大量活跃的互联网用户发布数量巨大的承载用户信息的......
煤炭是支撑国家战略性发展的重要能源。在山西等地区煤炭交易市场中往往受到地方性政策、业务发展水平和市场服务能力等多种因素限......
通常,在语言学中为避免同一词语反复出现而导致句子结构过于臃肿累赘、语义不清晰等问题,常规方法是利用指代词替代已出现代词或名......
随着互联网技术和社交网络的快速发展,各种网络平台生成了大量用户针对不同领域的评论文本。这些文本包含着丰富的情感倾向,从中可......
面对海量的企业文件,单纯地凭借人工进行密点标注,不仅费时费力,其划分标准更受到人为主观意识的影响.因此,对企业文件进行自动定......
目标情感分类是是一种细粒度的情感分类任务,针对人工生成特征模型成本高且不能捕捉上下文语义、传统循环神经网络模型训练时间长......
本文以跨领域情感迁移为视角,提出情感迁移视角下中文词嵌入技术框架.在该框架下,中文文本情感迁移任务能有效建模,打破了轻量数据......
中文文本情感分类应用是商家面对用户改进产品的一种重要手段.传统机器学习中one hot编码效率低下且向量十分稀疏,维度很高.文章通......
随着信息科技的发展,网络中的数据规模越来越大,这些数据给现有的检索系统带来了挑战,如何从驳杂的数据信息中检索到准确的答案越......
随着互联网时代的到来,搜索引擎开始被人们普遍使用。在信息检索任务中,针对冷门查询时,由于用户的搜索词范围过小,导致搜索引擎无......
词嵌入是自然语言处理领域的一个基础而又十分重要的课题.对于具有象形表意特性的汉语来说,如何捕捉隐藏于文字形态中的语义信息,......