汽车行业用户观点挖掘与分析

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:bbandd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,汽车行业发展迅猛,伴随互联网时代的迅猛发展产生了崭新的商业模式,广大用户习惯在网络中发表见解并生成了海量的评价文本。如何快速迭代汽车产品并分析用户观点至关重要,传统的调研手段因为样本量小、效率低等缺陷已经无法满足当前快速发展的市场环境,随着机器学习及人工智能的兴起使得高效分析并挖掘这些用户意见成为可能。本文根据以上背景,立足汽车行业利用人工智能方法展开汽车行业的用户观点挖掘,主要工作有以下四个方面:1.利用网络爬虫技术,针对各大汽车评论网站特点,设计了相应的爬取方案和策略,通过使用Python 3和Scrapy爬虫框架实现了用户在各大汽车网站的评论获取,构建了汽车用户评论观点数据集。2.提出了一种基于特征选择混合词嵌入的观点方面词抽取方法。其主要思想是将机器学习中特征选择方法和自然语言处理中词嵌入方法结合起来,通过嵌入式特征选择使模型在训练的过程中自发地寻找观点词汇,并利用词嵌入技术扩容这些词汇。最后,设计模型对比实验来验证所提出算法的有效性,实验结果表明,所提出的方法能很好地抽取用户文本评论中的观点方面词。3.构建了一种新型深度学习网络架构MAT(Multi-CNN hierarchical Attention Transformed embedding)模型,实现方面词级别的细粒度情感分析。该模型由双头词嵌入层、LSTM层和具有层级注意力机制的CNN特征抽取模块组成。首先,文本序列通过双头词向量得到文本表示,然后经过特征抽取模块获得文本全局信息和子特征,再由层级注意力筛选重要特征,接着通过参数调优实验确定了模型中超参数的最优值,最后设计了对照模型进行性能比较,实验结果表明所设计的模型在方面词级别情感分析任务中取得了较好的效果。4.设计并实现了基于RESTful API的汽车行业观点应用分析服务。首先通过本文提出的算法对汽车用户评论进行分析形成结构化数据,构建汽车行业观点数据库。其次,使用Flask框架结合Echarts技术搭建了汽车行业观点应用分析服务的Web系统。最后,针对不同汽车品牌观点数据进行可视化展示,可为消费者和企业的科学决策提供支持。
其他文献
本文是一篇英汉同声传译报告,选材于女王大学大卫·约翰斯顿教授在吉林大学所做题为“译员的职业道德”的英文讲座。本文作者担任了同传译员,记录并转写讲座内容。通过分析源
随着小型无人机武器的迅猛发展,单兵无人机武器成为了现代战争中极其重要的一类作战武器。国内已经具备了投弹打击的国产小型无人机武器,但是缺乏能够携载枪械定点打击的无人
针对具有光路、机械与电路等多个模块组成的复杂火工系统可靠性分析的问题,本文以由电路控制部分、激光光路传输部分及火工装置组成的半导体激光点火系统为研究对象,对系统的
融合基因(fusion gene)是指两个基因的一部分或者全部序列互相融合形成的一个新的基因,它们共用同一套调控序列(即启动子、增强子、终止子等)。形成融合基因最常见的机制是染
新一轮电力体制改革下产生的售电公司,如何利用庞大的数据信息,在电力市场竞争中获得最大利润,成为其关注的核心问题。获得利润大小的关键,在于售电公司的偏差考核机制。为了
作为美国当代文学的代言人,索尔·贝娄无疑对美国文学做出了突出的贡献,1976年瑞士评委会正式授予了他诺贝尔文学奖。他的代表作之一《赫索格》用生动的语言描述了一个内心充
各种无人机系统在民用领域得到了广泛使用,但不受有效监管的无人机“乱飞”、“黑飞”现象也带来了诸多问题,严重威胁到个人安全和社会治安,无人机反制技术和反制系统的研究具有非常重要的意义。无人机检测技术主要包括了基于雷达、射频、声学和光学技术几大类,其中光学检测技术又分为了可见光和红外成像两个方面,本文主要研究的是基于可见光成像的无人机目标检测。无人机目标检测的难点在于飞行背景复杂,在飞行时通常伴有干扰
第一部分下调RbAp48表达抑制肿瘤细胞增殖的机制研究目的:RbAp48属于WD蛋白家族,是一个存在于几乎所有真核生物中高度保守的蛋白。我们前期研究发现,下调RbAp48表达可诱导人
渤海湾CDX平台共设计有XX口井,井口间距1.8m,大部分井都为大位移井,造斜点浅,井斜角大,位垂比大,防碰要求高,国内的地质导向钻井受井底大位移的井眼摩阻影响,施加钻压困难,钻
防空反导定向战斗部能够大幅度提高防空导弹的终端毁伤效能,而定向战斗部最大毁伤效能的实现,必须以定向引信的目标脱靶方位准确识别与精确定向起爆控制为前提。论文基于圆柱