基于语义准则函数的中文评论性文本极性聚类算法研究

来源 :情报学报 | 被引量 : 0次 | 上传用户:sihuajian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通常用于评论性文本极性挖掘的方法是采用有监督的学习算法完成的,但有监督的学习算法需要大量人工标注的训练集,而且其在处理文本集时还会面临维数灾难、稀疏向量、高时空复杂度、低召回率和精确率等问题而无法用于海量的文本极性分类任务。经典的K-means均值聚类算法是聚类分析中使用最为广泛的算法之一,其具有诸多的优良特性和不足。针对上述情况,本文将语义引入经典K-means均值聚类算法中,构造了专门针对中文评论文本极性判断的极性词语义词典,提出了一种基于语义准则函数的K-means均值聚类算法。这项研究是运用基于语
其他文献
针对文本聚类分析结果表达中缺乏语义关系的缺陷,本文利用人们在可视化形式下对模型和结构的理解和获取能力,提出了一种新的可视化表达方法.通过改进的Force-directed模型对
以电聚合方法制成聚邻氨基苯酚薄膜修饰石墨电极,发现其对间二硝基苯的电化学还原具有明显的电催化作用,据此建立了循环伏安法测定间二硝基苯的新技术.在pH 12.00的磷酸盐缓
建筑工程土建施工是建筑工程建设环节中最为重要的一部分,以科学而系统的方法进行建筑工程土建施工的规范、约束和管理,是保障建筑工程整体质量的基础,同时也是保证工程功能
在“快闪”传播中国传统音乐文化的项目研究前期,笔者大致确立了传播中国传统音乐文化的“快闪”社团的创建模式。在项目的中后期研究中,笔者则将重点转移至在校园中策划人该
本文首次报道了ZnO薄膜发光的激发谱,此薄膜的发射谱主要有绿带和紫外带,峰值波长分别为520和390nm,通过改变生长条件可以获得单一的紫外发射带或绿带。其本征激发带出乎常规的
随着我国灾害防治技术的发展,大量公路边坡工程已得到相应的治理。为保证防护工程长期有效,大量的边坡工程将进入到关键养护期。由于边坡工程岩土特性复杂多变,破坏模式、计
<正> 小儿生长痛临床较少见,笔者自1998年以来采用脏腑按摩治疗小儿生长痛取得明显效果。1临床资料 32例患儿均为门诊病人,其中男19例,女13例;年龄最大12岁,最小3岁,其中3-10
寒假时,我来到北京参加皮皮鲁讲堂一进门我看见一片广阔的“沙漠”,上面长着几根带刺的仙人掌。哎呀!这位“沙漠同志”难道就是传说中的“童话大王”郑渊洁?再一看,真的是。太伟
近年来,我国城中村改造事业发展迅速,并由此产生了多种改造模式。本文从政府、村民、开发商三方结合模式出发,在分析各自效益的基础上,选取相关指标初步构建了评价城中村改造综合
随着我国经济的飞速发展,我国人口也呈现持续增长的趋势,给我国的土地资源带来很大的压力,一方面是基础建设的增加占用了一部分土地资源;另一方面是在发展的过程中对土地资源造成