一种改进的带有情感信息的词向量学习方法

来源 :计算机应用研究 | 被引量 : 10次 | 上传用户:xytw895
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词语的情感信息对于情感分析任务至关重要,现有大多数基于词向量的无监督学习方法只能对词语的语法语境建模,但忽略了词语的情感信息。针对这一问题,提出了一种结合监督学习和非监督学习的词向量学习方法,既能够获得词语的语义信息又能够获得情感内容。在相关实验中,对词向量分析作了直观的举例对比,并将该方法用于情感分类任务中,通过引入新的评论数据集对该方法进行验证。实验结果表明,融合了语义与情感的词向量方法效果良好,能更为精确地对情感信息进行分类、更为客观地对用户信息进行评价,助力社交网络良性发展。
其他文献
目前常用的室内定位算法在构建指纹库时,因为在参考点处接收到的信号强度值存在噪声值,传统的欧氏距离计算公式忽略信号发射器的稳定程度从而造成定位误差,以及K近邻算法无法根
对跨项目缺陷预测问题展开了深入研究,在源项目实例选择时,考虑了三种不同的实例相似度计算方法,并发现这些方法的缺陷预测结果存在多样性,因此提出了一种基于Box-Cox转换的集成跨项目软件缺陷预测方法 BCEL。具体来说,基于不同的实例相似度计算方法,从候选集中选出不同的训练集;针对这些数据集,进行有针对性的Box-Cox转换,并借助特定分类方法构造出不同的基分类器,最后将这三个基分类器进行有效集成。
许多无线定位应用通过旋转方向天线推测无线信号的到达角度(angle of arrival,AOA),但该类方法在稀疏抽样和复杂环境中定位精度不高。方向天线波瓣曲线的还原实验表明,最大接收信号强度(received signal strength,RSS)附近的波瓣曲线与二次曲线近似。根据这一事实,提出了一种基于RSS二次曲线拟合的AOA定位算法。该算法利用最大RSS附近的数据拟合出二次曲线方程,通
针对面向微博的中文新闻摘要的主要挑战,提出了一种将矩阵分解与子模最大化相结合的新闻自动摘要方法。该方法首先利用正交矩阵分解模型得到新闻文本潜语义向量,解决了短文本信息稀疏问题,并使投影方向近似正交以减少冗余;然后从相关性和多样性等方面评估新闻语句集合,该评估函数由多个单调子模函数和一个评估语句不相似度的非子模函数组成;最后设计贪心算法生成最终摘要。在NLPCC2015数据集上的实验结果表明,该方法
Apriori算法是关联规则挖掘中最经典的算法之一,其核心问题是频繁项集的获取。针对经典Apriori算法存在的需多次遍历事务数据库及需产生候选项集等问题,首先通过转换存储结构、消除候选集产生过程等方法对Apriori算法进行优化;同时,随着大数据时代的到来,数据量与日俱增,传统算法面临巨大挑战,将优化的Apriori与Spark相结合,充分利用Spark的内存计算、弹性分布式数据集等优势,提出了
高效用模式挖掘被广泛地应用于数据挖掘领域。为了挖掘指定数量的高效用模式,一些基于树结构和效用表结构的top-k高效用挖掘算法被提出,但前者在挖掘过程中产生了大量候选模式,后者在效用模式增长时需要进行多次比较;同时,由于在信息社会,数据量呈爆炸性增长,所以在数据集过大的情况下,挖掘高效用模式需以大量存储空间以及计算开销为代价。为了解决这两个问题,基于MapReduce的top-k高效用模式挖掘算法(
在概念设计阶段构造新型的支持创新过程的设计系统,对新产品的设计活动具有重要意义。在机械产品概念设计中将机构看成由图元构成的图形,提出一种面向概念设计的机构草图识别及分析方法,主要内容包括手绘草图输入及机构草图识别、机构方案运动分析。把手绘草图识别技术和机构运动相结合,通过对机构草图的识别以及机构的运动分析,实现在概念设计阶段对机构设计方案的评价分析。
为了解决数据的不平衡性这一问题,提出一种利用分布函数合成新样本的过抽样和随机向下抽样相结合的算法。算法对降维后的主成分进行分布函数拟合,然后利用分布函数生成随机数,并对生成的随机数进行筛选,最后与随机向下抽样相结合。实验所用数据取自NASA MDP数据集,并与经典的SMOTE+向下抽样方法进行对比,从G-mean和F-measure值可以看出,前者的预测结果明显优于后者,预测精度更高。
针对工艺规划与调度集成(integration of process planning and scheduling,IPPS)问题求解复杂性,为提高求解效率,设计了包含探索种群、寻优种群和最优种群的多群体混合进化算法,通过运用混合遗传算法和基于聚类淘汰机制的差分进化算法分别更新探索种群中工艺链和加工顺序链,保持可行解多样性和差异性;然后利用克隆领域搜索算法完成寻优种群中可行解的克隆和领域搜索,进
针对传统协同过滤算法面临数据稀疏、忽略用户时间上下文信息及对兴趣物品偏好程度等问题,提出基于谱聚类与多因子融合的协同过滤推荐算法。首先将FCM聚类融入到谱聚类算法的关键步骤,并通过聚类有效性指数对用户聚类个数进行优化,以降低生成最近邻的时耗;然后将Salton因子、时间衰减因子、用户偏好因子进行融合,从而对相似度进行改进;最后获取系统当前时间为目标用户生成推荐列表。Movie Lens上的实验结果