一种构建情感标签均衡语料库的主动学习算法

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:wymanszeto
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提高构建的情感语料库中情感分布的均衡性,提出一种基于主动学习的算法以保持新构建训练集中情感标签的均衡。综合信息性、代表性、多样性和互补性标准于一体,通过文本的情感预测概率和特征统计量逐层筛选样本,利用互补性准则中的标签平衡措施抽取候选样本。该算法可以抑制模型选择高频次情感标签的样本,并促进低频次情感标签的样本选择,以达到情感标签平衡的目的。多标签情感分类实验表明,该算法能有效构造情感标签均衡的文本训练集,并通过所构造的训练集逐步提高文本情感分类的效果。
其他文献
摘 要 中国是有着悠久历史的文明古国,中国陶瓷的发展伴随着整个文化的历程,其中瓷器所取得的成就无疑铸就了耀眼的篇章。紫砂陶作为后起之秀,从一诞生就出于瓷器的光芒之下,在发展了数百年之后异军突起,以自身独特的工艺魅力获得了世界的青睐。  关键词 紫砂;陶瓷;宜兴;文化;工艺   宜兴紫砂不仅在整个中国绝无仅有,在全世界也是独树一帜,紫砂本身的优良材质得到了广泛认同,由于国家对这类珍贵矿产资源的保护,
为了去除冗余特征,提高入侵检测系统的检测性能,提出一种基于改进蚁群算法求解特征子集的入侵检测方法。对蚂蚁的初始位置、启发函数、信息素更新策略及状态转移概率函数均做了优化。对KDD CUP 99数据集进行预处理,根据信息熵理论对特征进行初步提取。由提取的特征点构造邻接拓扑,用改进蚁群算法进一步求解特征子集。通过十折交叉验证法训练及优化改进蚁群算法及支持向量机的参数,并测试该入侵检测方法的性能。实验结
针对在滑动时间窗中发现稠密子图的问题,提出一种有效的动态算法,结合时间窗将网络时间线划分为k个非重叠的间隔,间隔内包含最大密度的子图。算法输入是一个边流,输出是一系列稠密子图及相应的时间间隔。现有技术在图更新时需要迭代整个图,所提算法仅影响图的有限区域,只需要局部更新稠密子图。结合理论分析,证明了该算法比基线KGOPTDP和KGOPTDS更快。多组数据集上的实验结果表明,该算法具有很高的效率和很好
为了求解非线性特征值问题,在线性FEAST特征值算法的基础上,提出一种非线性FEAST扩展算法。通过将复平面分割为不相交的区域集合,计算每个区域的特征对。扩展算法使用与线性FEAST算法相同的一系列运算,通过修改围道积分来支持非线性特征值求解的固定移位集合和固定子空间维数。与线性FEAST算法相似,扩展算法可以通过并行求解额外的线性系统,改进数值围道积分或提升近似特征向量子空间的维数,从而提高非线
摘 要 龙纹作为典型的民族图腾,在中国漫长又悠久的历史发展过程中占据着非常重要的地位。海水龙纹图案属于龙纹的一种,由于其承载着图腾崇拜与祈福纳瑞的精神文化价值,从北宋到明清时期经历了萌芽与发展阶段,尤其是在元代,海水龙纹图案在元青花上更是得到了蓬勃发展。本文以海水龙纹的起源与发展为基础,从元青花海水龙纹的造型形态、布局设计、色彩表现及文化内涵四个层面,对元青花瓷海水龙纹图案的审美特征展开了讨论。 
“器”与“道”形成宇宙的两极,形而上者谓之道,形而下者谓之器,道是器的灵魂所在,承载着空无,即为外象。紫砂器文化价值体系的认识与回归,需要站在中国的历史文化系统、当代思想观念的高度去分析,也需要我们创作者个人回归自然生命、回归人文社会、回归内心的灵魂。有这样一个个人对紫砂文化的价值构架,紫砂器的创作才有生命力、有灵魂。
基于神经网络的文本分类算法需要较长的训练时间,难以满足在线文本分类的需求。针对这种情况,提出基于非迭代训练层次循环神经网络的快速文本分类算法。为循环神经网络设计了对抗训练模型,缓解层次注意力网络的过拟合问题。给出一种循环神经网络的非迭代训练算法,对激活函数进行线性逼近,快速地学习网络连接的权重。实验结果表明,在英文和中文文本的情况下,采用该算法均获得了理想的分类准确率,并且大幅度地减少了训练时间。
在通用可组合框架(UC framework)下研究无证书的签密协议。针对无证书签密协议(CLSC)的安全性不满足通用可组合性,根据无证书签密协议的安全需求,构建安全模型即理想函数。在F-混合模型下构造无证书签密协议,证明该协议安全实现理想函数的条件是满足在适应性选择密文攻击下的不可区分性(IND-CCA2)。基于离散对数问题实现一个具体的签密协议实例,验证了模型的有效性。
针对当前基于循环神经网络的智能电网虚假数据注入攻击(False Data Injection Attacks, FDIA)检测方法无法提取FDIA数据深层特征的问题,提出一种基于双向门控循环单元(Bidirectional Gated Recurrent Unit, Bi-GRU)和自注意力的检测方法。采用Bi-GRU学习量测序列,输出各时间步的隐状态;引入自注意力机制计算各时间步隐状态的线性加权
摘 要 设计来源于生活,人们不断对千变万化的自然形态加以编辑与重组,仿生物形态的设计应运而生。众多陶艺作品中的设计元素正是选自动植物,通过赋予“陶瓷”这一材质成型的技术,展现了陶瓷艺术的独特魅力。本文探究仿生陶瓷艺术作品中的理念表达与成型工艺,通过分析与总结不同成型技法所表现的形式,为陶瓷艺术作品的新技术、新工艺、新思维提供活力源泉。  关键词 仿生设计;陶艺;成型技法;设计理念  1 仿生设计在