文本表示相关论文
随着互联网和社交媒体的飞速发展,用户每时每刻都会生成大量的短文本数据,如何对海量短文本数据进行高效、准确的特征表示与分类,......
随着互联网时代的崛起和移动设备的发展,每分每秒产生的文本信息不可估量,因此提取文本信息内涵和文本情感评价成为了自然语言领域......
基于目标的情感分析(Target-Based Sentiment Analysis)是情感分析领域最具有挑战性的课题之一,需要同时解决目标提取和特定目标情感......
随着5G技术的出现以及计算机技术突飞猛进的发展,通过互联网发布和获取信息变得越来越容易。面对人工难以处理信息爆炸式增长的困......
学位
从CNN、RNN、CNN-RNN、GCN及其他深度学习方法五个方面,全面分析了其在短文本分类应用中的研究现状,比较了各自的优缺点,总结了常用的......
随着信息技术的快速发展,互联网中的文本信息呈爆炸式增长,导致了信息过载的现象,对大量的文本信息进行高效且准确地分类能够很好......
针对文本聚类时文本特征维度高,忽略文档词排列顺序和语义等问题,本文提出了一种基于句向量(Doc2vec)和卷积神经网络(Convolutional Neu......
多标签文本分类作为自然语言处理领域的一项基础任务,广泛应用于情感分析、问答系统和推荐系统等领域。本文主要研究基于深度学习......
针对招标文件中因数据稀疏导致的特征提取困难影响分类准确率的问题,提出了一种基于极端梯度提升(eXtreme gradient boosting,XGBo......
法院系统中主要有人工指定分案和简单随机分案两种模式.这两种模式无法做到人案的自动匹配,存在金钱案、关系案等弊端.目前分案方......
处于大数据时代的今天,数据呈现出规模庞大、模态多样和高速增长等特征,语言数据的价值也随之爆发式地增长,汉语语料信息分析的价......
随着网络技术的飞速发展和信息传播形式的不断变化,网民们可以在微博、微信以及电子商务平台等自由地表达自己的观点,这致使短文本......
文本表示是自然语言处理最为核心的研究方向之一,近年来随着机器学习的发展,文本表示也从最初的统计学方式开始与机器学习相结合。......
随着大数据与人工智能时代的到来,将互联网技术、人工智能技术、大数据思维等信息化手段运用到纪检监察各项工作流程中,已成为主要......
文本生成图像(Text-to-image Generation)旨在基于自然语言描述的文本生成相关图像,实现从文本模态到图像模态的转化,并保持语义。文......
互联网的发展,使得每天都在产生海量数据,且数据规模不一、形式各异,而文本分类技术可以高效准确地将海量数据进行归类,方便用户获......
文本分类是自然语言处理中一个经典的任务,旨在为给定的文本打上特定的标签,依据标签的数量可将此任务分为单标签文本分类任务和多......
当今人工智能、大数据等新兴技术的发展,使得智能化、大数据化的发展趋势更加迅猛。将此类技术应用于社会各个方面,将能创造大量的......
随着社交媒体用户评论数据的急剧增加,对于用户评论文本的情感分析和观点挖掘逐渐受到研究人员的重视。这些评论数据数量众多、风......
指标在衡量与测度综合发展和某一领域发展起到重要指向作用。一直以来,各行各业为了科学管理、有效监测自身情况,在社会经济、教育......
目前,裁判文书的书写愈加规范,且随着电子化裁判文书的普及,裁判文书已然成为司法领域研究的重要对象。本文基于孪生神经网络,并结......
市民服务热线作为政府和各职能单位服务人民的的重要窗口,实现了聆听群众的诉求,普及政策法规,解决难点问题,为维持社会的和谐稳定......
文本表示是自然语言研究的基础问题,也是帮助我们高效处理文本信息的关键,传统的文本表示模型大多是基于词或短语构建,普遍存在容......
文本分类是自然语言处理领域中的一项基础任务,在舆情分析、邮件过滤、问答系统、智能信息推荐等应用场景中具有重要的意义。传统......
在文本分类系统中,传统的特征选择和特征加权方法充分利用了文档信息,而轻视或忽视了类信息.新的特征选择和加权方法以类信息作为......
本文通过可比语料聚类实验以比较三种不同的文本表示方法,分别是空间向量模型(VSM),潜在语义索引(LSI),深度学习(DL).将可比语料中......
随着大数据时代的到来,煤矿企业积累了大量煤矿数据资源.其中煤矿事故案例信息丰富,包括对事故发生时间、事故发生经过、导致事故......
针对文本分类中文本数据表示存在稀疏性、维度灾难、语义丢失的问题,提出一种基于单词表示的全局向量(global vectors for word re......
[目的/意义]随着网络信息技术的发展及国家对技术转移的政策支持,大量的在线技术交易需求产生.在线技术转移服务平台作为技术供需......
随着中国司法信息化建设的不断推进,以各类案件卷宗、裁判文书、法律法规以及司法解释为代表的法律文本数据量迅速增长,基于深度学......
传统的基于"词袋"的文本表示方法假定词的权重只和它本身的出现频率有关,而忽略上下文信息.本文提出了一种基于上下文的图模型文本......
大量的法律案例以数字化的形式存储使得法务工作者及普通民众可以轻松地从法律案例库中搜索需要的信息,其中有用但又很有挑战的一......
以对抗训练和神经网络为核心,构建文本表示与分类的一体化框架BATCBG,利用BERT和对抗训练充分提高文本表示效果,利用CNNBiGRU集成......
该文就文本自动聚类技术的发展及现状进行了系统的回顾,然后,针对社科领域的文本聚类进行了较为深入的探讨与研究,实现了两个实验......
互联网技术飞速发展,衍生出了海量的网络文本数据。但是大部分海量数据没有经过处理和分类,导致了垃圾邮件、广告推送等不良网络行......
文本表示指通过某种方式将自然语言文本编码为计算机可以处理的形式,这是实现自然语言理解最基础也是最重要的步骤。高质量的文本表......
随着互联网技术的发展,网上文档资源的日益增加,面对海量的信息,人们很难迅速准确的找到真正需要的资源。如何对浩如烟海的文献、......
该文从面向大规模真实文本的角度出发,初步介绍并讨论了大规模真实中文文本的处理技术和特点:首先,在文本表示方面,该文采用向量空......
随着网络时代的到来,用户可获得的信息包含了从技术资料、商业信息到新闻报道、娱乐资讯等多种类别和形式的文档,构成了一个异常庞大......
论文综述了中文文本分类中自动分词、文本表示、特征选取和分类模型几个部分的研究现状和研究方法。每个部分都有多种实现技术,不同......
随着电子计算机技术和互联网的快速发展,网络知识资源呈爆炸式增长,网络资源内容多样,人们往往不能有效的获取、利用所需的网络知......
面对如今信息技术的飞快发展,各种电子文档和电子邮件都爆炸式的增长,为了从海量文本中及时准确的获得有效的知识和信息,就需要处理大......
文本表示是很多自然语言处理应用的关键任务,比如文本分类,文本聚类,推荐系统以及情感分析等等。它的目标是将非结构化文本映射到......
随着网络信息技术的飞速发展,用户可以通过网络方便快捷地利用海量的共享信息,同时“信息爆炸”、“信息过载”、“信息垃圾”等很......