基于双层树状支持向量机的观点挖掘与倾向分析

来源 :智能计算机与应用 | 被引量 : 0次 | 上传用户:thp2860051
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要: 本文通过进行大量预处理工作,将经过词袋模型和Word2Vec两种不同向量化方法处理后的文本数据分别输入到SVM和LSTM模型中,训练出可以识别文本情感倾向的模型。进而对新产生的评论进行分类。根据实际数据量的倾斜状况,基于传统机器学习算法支持向量机(SVM),本文提出双层支持向量机,采用2种不同的方法分别训练模型并预测。最后再使用深度学习算法长短时记忆模型(LSTM)再次训练并预测,并对这3种方法做出比较和总结。结果显示,双层SVM比单层SVM的准确度提高了8个百分点;而LSTM比单层SVM低了2个百分点,比双层SVM低了接近10个百分点。
  关键词: 商品评论; 网络爬虫; SVM; LSTM; 情感分类; 数据挖掘
  文章编号: 2095-2163(2021)03-0044-04 中图分类号:TP181 文献标志码:A
  【Abstract】In this paper, a large amount of preprocessing work is carried out, and the text data processed by the following two different vectorization methods as
其他文献
摘 要: 牵引系统身为地铁车辆的关键系统之一,提升其可靠性对于改善整个地铁车辆的可靠运行尤为重要。但是,牵引系统的结构复杂,且失效模式多样,采用传统的可靠性分析方法较为困难。针对这一问题,提出了一种基于贝叶斯网络的系统可靠性评估方法,并结合故障树法,对地铁车辆牵引系统的可靠性进行建模和分析。以某地铁牵引系统为例,利用贝叶斯网络模型计算出牵引系统的可靠度;通过贝叶斯网络的双向推理能力,找出对牵引系统
为实时了解骑行者的骑行状态,便于其调整骑行举动,设计了基于物联网平台的自行车多功能码表.选用AT89C52作为主控芯片,结合传感器技术、WiFi技术、物联网平台实现了包含计算
摘 要: 与传统波叠加法通过逆问题求解获得源强不同,提出一种基于粒子滤波的波叠加算法来实现正向求解源强。该方法基于波叠加理论建立状态空间模型,根据初始化粒子的先验信息预测并更新状态向量。通过权重计算和重采样,估计等效源的强度及其位置,进而重建三维辐射声场。仿真分析与实验验证表明,该算法可避免逆问题求解中的不适定性难题,实现声场的高精度重建。  关键词: 粒子滤波; 波叠加; 声源定位; 声场重建 
目前用于图像识别的大多数卷积神经网络(CNN)都使用相同的原理构建,即:卷积层、池化层、全连接层。文中使用密集卷积神经网络重新评估了用于图像识别的所有组件,并对池化层不存在的必要性提出了质疑。经过实验,分析发现池化层可以由步幅增加的卷积层代替,却不会降低图像识别的准确率。研究中则在DenseNets上训练提出的由卷积层替代池化层的方法,组成新的卷积神经网络体系结构,并在多个图像分类的数据集(CIF
摘 要: 针对于NAO机器人自身语音识别准确率低的问题,提出一种基于NAO机器人的BLSTM-CTC的声学模型研究方法。基于BLSTM-CTC的声学模型进行建模,以BLSTM为声学模型和CTC为目标函数,以音素作为基本建模单元,建立中文语音识别端到端系统。实验结果证明,本文算法相较于NAO机器人自身,取得了良好识别效果。  关键词: 语音识别; BLSTM-CTC; NAO  文章编号: 2095
为解决传统挖掘方法进行数据挖掘时,存在规定时间范围内数据挖掘量少,导致挖掘效率不高的问题,提出Apriori算法在无线网络数据智能挖掘中的应用研究.通过数据挖掘关联规则设
摘 要: 大数据分析旨在从大量复杂的数据中获取价值。查询驱动的数据分析是大数据分析中最主要的部分。由于数据量的庞大,在大数据上获取准确的分析结果将带来极大的存储和计算代价。为解决这一困难,大数据近似分析方法应运而生。本文将主要针对大数据近似分析中的频率估计问题、近似查询处理问题、查询选择性估计问题近十年的解决方法进行总结和归纳。不同于以往以数据库为主视角的分析方法的总结,本文中将涵盖近几年应用或结
鉴于当前的睡眠监测设备存在佩戴复杂、设备昂贵、功能单一和检测方法不合理等情况,设计了一种多传感器数据融合的睡眠监测系统.本系统以STM32F407ZGT6为核心主控芯片,通过可
摘 要: 突触滤波是神经元处理和传递信息的重要过程,有助于生物在复杂环境中获取所需信息。针对当前人工神经元模型中较少考虑到突触滤波机制,本文以FitzHugh-Nagumo(FHN)人工神经元模型为基础构建基于膜电势增量变化的神经元数学模型,在此基础上模拟突触滤波机制,从而提出一种改进FHN神经元滤波模型。而后,对该模型的稳定性条件、幅频响应进行了分析,并通过不同信噪比条件下的典型信号和语音信号实
摘 要: 本文研究了语音情感识别中的半监督特征选择问题,即如何利用未标记语音情感数据来帮助选择具有情感判别性的特征。为了解决这个问题,提出了一种新的基于图的半监督特征选择方法。其可以根据标签适应度和流形平滑度,在图上估计一个预测标签矩阵,从而有效地利用标记数据中的标签信息,以及标记数据和未标记数据中的流形结构信息。与现有的基于图的方法相比,该方法能同时进行特征选择和局部结构学习,从而自适应地确定图