基于Gaussian LDA与谱聚类融合的代表性负向评论提取

来源 :情报科学 | 被引量 : 0次 | 上传用户:lisky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]在线评论尤其是负向评论是消费者进行购买决策的重要依据.而现有减少信息冗余方法在负向在线评论中表现还有待提高.[方法/过程]文中提出了一种基于Gaussian LDA的负向评论谱聚类方法.首先,利用Gaussian LDA模型获取负向评论中的主题分布,然后通过主题分布来计算评论间的皮尔森相似度,并应用谱聚类算法实现负向评论聚类,最后提取每类距离簇中心最近的m条评论作为该类的代表性评论.[结果/结论]通过将Gaussian LDA、LDA、TF-IDF和Doc2Vec分别与谱聚类结合,以及将Gaussian LDA与K-means、DBSCAN、谱聚类结合进行交叉比较,验证了所提方法的优越性.据此提取的负向评论类别间区分度高,具有高度代表性,较好地解决了信息冗余问题.[创新/局限]先提取主题再进行聚类的多模型集成式聚类方法为解决评论信息冗余问题提供了新的方法和思路,也为研究文本挖掘、文本聚类提供了一种新的参考.
其他文献
[目的/意义]揭示并对比国内外数据挖掘领域研究热点主题的演化过程.[方法/过程]收集1998-2018年CNKI及Web of Science收录的数据挖掘领域核心期刊论文,通过LDA主题模型抽取研
[目的/意义]在线健康社区作为互联网与医疗产业结合的新业态,正日益成为用户进行健康信息共享的重要平台,探索其研究现状及特征,对进一步挖掘在线社区用户交互规律和搭建网络
基于可见光通信与矩形平板LED光源,提出一种室内视觉高精度定位方法,为室内移动机器人提供一种精度高、速度快、成本低的室内定位系统方案。该方法首先利用可见光通信技术获取LED光源的坐标信息,利用单个视觉传感器对矩形LED光源进行成像测量,同时使用IMU传感器记录成像测量的倾斜姿态角辅助单像空间后方交会解算;然后设计并仿真分析了4种单像空间后方交会算法在高精度倾斜姿态角辅助下定位误差随角点提取误差的变
针对长时序大尺度的土地利用类型精细化分类存在的挑战,基于Google Earth Engine遥感大数据云平台,利用具有较好时空一致性的Landsat7、Landsat8数据,采用随机森林模型和众数滤波优化算法研究了过去20年间河南省土地利用分类空间变化特征及趋势。研究结果表明:1)基于GEE遥感云平台提供的丰富数据和强大的计算能力,能较高效率地实现省域尺度长时序多时相的遥感影像土地利用变化检测,
[目的/意义]基于大量UGC数据的情感分析已成为舆情检测和社交组织中的重要任务,对微信推文的情感分类可为舆情动态调控和舆论趋势监测提供一种可行的管理方法,传统的分类模型
[目的]考虑消费者绿色偏好的影响,研究不同渠道权力结构下闭环供应链的决策模型.[方法]在单一制造商、单一零售商和单一的第三方回收商组成闭环供应链中,构建零售商、制造商
[目的/意义]利用扎根研究方法探究高校新媒体环境下,信息平台用户持续关注行为特征和影响因素,为提高用户信息素养和辨别意识,产生利于自身的关注行为提供科学参考.[方法/过
[目的]研究考虑学习效应和顺序相关调整时间的多阶段混合流水车间调度问题.[方法]针对该问题的特点,建立以最小化最大完工时间和总能耗为目标的混合流水车间调度问题模型,同
[目的/意义]利用距离分解改进矩阵分解方法的限制,优化图书个性化推荐的效果.[方法/过程]将传统用户-项目评分矩阵转换为用户-项目距离矩阵;利用距离分解方法获得用户-项目间
[目的]城市垃圾收运系统作为垃圾回收处理的重要环节,研究这一系统的合理规划对城市垃圾有效治理意义重大.[方法]结合城市垃圾收运模式、地下物流系统与选址-分配理论,建立以