基于特征扩展与深度学习的短文本情感判定方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:txmotor
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对中文短文本信息量少、特征稀疏等特点,面向微博短文本进行情感分类研究,为了更好地提取短文本情感特征,从评论转发等上下文内容中挖掘具有语义递进关系的语料对原文本进行扩展,并抽取具有潜在感情色彩的特征词,采用Word2vec计算词语相似度以进行候选特征词扩展,最后引入深度信念网络(Deep Belief Network,DBN)对候选特征词进行深度自适应学习。在COAE(Chinese Opinion Analysis Evaluation)2015任务评测数据集上的实验表明,该方法能够有效地缓解短文本特征
其他文献
主要探讨了如何在DSPs上高效地实现MPEG-4的视频压缩算法,问题的视频对象的数据结构并有效利用DSPs甚长指令和流水线的特点以加速压缩过程的实现.此外,还利用了混合编成的方
基于数据紧迫采集应用场景(如地震、火灾预警),分析了其拓扑控制的目标和需求,建立了网络模型并且进行了形式化描述和数学分析,提出了一种基于送达率约束的低时延拓扑控制算法(LDBDC)。该算法可以根据给定的送达率约束计算给定区域的近似最优平均跳数,从而得到虚拟网格的边长。仿真实验表明,LDBDC能够获得近似最优的拓扑结构,在满足送达率约束的前提下使得网络的平均时延最小。
线路故障后快速寻找故障点为保证电网安全稳定运行的一项关键技术,也是长期以来困扰电网运行的世界性技术难题之一。1997年初,中国电力科学研究院与辽宁省电力有限公司开始精诚
在简单介绍动态K值加权室内定位算法(EWKNN)并分析其不足的基础上,探索研究了基于动态K值及AP MAC地址筛选的室内定位算法。该算法首先使用EWKNN方法动态选择参考点个数,并根据
文本情感分类是一项重要的自然语言处理任务,具有广泛的应用场景。以往的情感分类方法过于注重分类准确率,忽略了训练和分类过程的时间代价,而且使用的特征大多为词袋特征,存在维
在手绘草图的过程中经常会出现单一线元间断绘制的问题,为了将间断的笔画修整为单一线元以获得规范的设计图,提出了一种基于笔画容差带的手绘草图间断多笔画判定与拟合方法。该方法对输入的笔画进行折线化处理,得到笔画逼近折线段的折点序列,并判断笔画类型;根据笔画走势,绘制假想笔画以及扩展的笔画容差带,判定两笔画是否属于间断多笔画;聚类间断绘制多笔画,将笔画序列转换成子草图序列,并对子草图逐一进行拟合,从而得到
节点或边不可靠网络的可靠度分析问题是NP-hard问题,网络节点和边都不可靠的假设更接近现实。基于网络节点和边二元状态的假设,构建了节点和边不可靠网络的形式化模型,给出了分析节点和边不可靠网络可靠度的NEF_MDD算法。该算法将单个节点与其未访问邻接边划分为一个集合,通过枚举节点和边的不同组合,合并导致子网同构的冗余状态,获得简化后的状态向量和可靠度向量,并用一个多值决策图变量来表述。通过使用自定
针对多个云服务之间的跨域认证问题,提出一种基于SAML协议的云服务安全认证方案。阐明了该方案的关键技术机制,建立了云服务安全认证协议抽象模型;采用Casper和FDR软件的组合,通过模型检测法对云服务认证协议进行了形式化分析与验证;通过对安全认证协议进行分段模型检测,解决了安全协议形式化分析验证导致的状态空间爆炸问题。模型检测软件的实验结果验证了云服务跨域认证方案的有效性及安全性。
最近,一种基于比特置乱的超混沌图像加密算法被提出,其核心思想为:首先,用混沌序列对明文图像进行像素置乱操作;然后,根据一个随机序列中相邻两个元素的大小关系对像素进行不同的比特位置乱;最后,把经过比特置乱后的序列与另一个混沌序列进行扩散、混淆运算得到最终的密文图像,从而使明文图像达到更好的加密效果。对该加密算法进行了安全性分析,发现该算法的安全性完全依赖于3个混沌序列,通过选择明文攻击依次破解出原算
关联规则挖掘是数据挖掘领域非常重要的课题,在很多领域被广泛应用。关联规则挖掘算法都需要设置最小支持度和最小置信度。很多国内外学者研究的挖掘算法在这两方面都存在着一