基于文本挖掘的新能源汽车评价研究

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:aspnet2002web
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了缓解城市化进程过快和能源消耗等问题,新能源汽车的发展受到了国家的大力支持,也必将成为未来汽车行业发展的导向和目标。虽然如今新能源汽车产业发展迅速,但在主流汽车市场中还处于摸索阶段。为了更好地提高新能源汽车市场的消费热情,挖掘并分析人们对于新能源汽车的看法和使用感受有着重要的现实意义。本文以汽车之家和懂车帝网站的新能源汽车口碑评论数据为研究对象展开探讨,首先利用网络爬虫技术获取所需要的口碑数据,根据购车价格以及车型的不同进行分类,对新能源汽车现状进行描述性统计分析。在此基础上对文本展开数据清洗及分词的处理工作,为使分词更为准确实施,特构建本文专属的汽车名称词典。使用词云图和语义网络对评论文本进行特征分析,将用户对新能源汽车的关注点可视化。接着把口碑评论数据中的满意维度标注为正向情感文本,不满意维度标注为负向情感文本。用机器学习模型朴素贝叶斯、XGBoost、SGD以及深度学习模型LSTM对已经标注好的评论文本进行模型训练,并用测试集对模型进行验证。通过对四种情感分类器的效果对比,选出了效果最优的LSTM分类器对未标注评论进行标注。然后对新能源汽车的内饰和性价比维度进行LDA主题特征提取,在此基础上对汽车的优劣势进行有锚定词汇的CorEx主题模型分析,以此锁定新能源汽车板块消费者的关注重点。最后,总结本文的研究成果,并指出研究可以进一步考虑的问题。通过研究主要得到以下结论:第一,新能源汽车的主要市场为经济发达的城市,10-20万的SUV以及轿车为新能源汽车消费市场的主力车型。第二,在新能源汽车口碑评论的情感分类任务中,深度学习模型LSTM在评论文本情感分类中预测准确率为97.43%,高于机器学习模型朴素贝叶斯、XGBoost和SGD。第三,现阶段的新能源汽车的优势是动力足、能耗少和外观好看,消费者对新能源汽车的主要不满表现在内饰和舒适性等软件方面。结合以上分析提出针对性建议:政府需要加强新能源汽车的充电基础设施建设,解决地区发展不平衡问题。厂商应关注消费者需求,除了关注新能源车的续航问题外,更应该重视消费者的乘车体验,解决内饰皮具异味及车辆减震问题。
其他文献
伴随着互联网领域技术不断的进步革新,各种互联网应用出现在人们的生活中,并逐渐变得不可缺少。而互联网广告依托互联网应用这个载体也就此诞生。能否精准地了解用户喜好并预测互联网广告的点击率成为了当前研究的热点之一。广告点击率通常是预测用户点击某条广告的概率。广告技术中最重要的算法之一就是通过对广告点击率的预测进而找出用户最有可能点击的那条广告。广告点击率关系着广告的排序以及相应的点击付费等方面内容,因此
学位
近年来随着各个城市基础设施的不断完善,地铁的建设和完善一直保持着增长的趋势并且地铁覆盖整个城市的各个地方。地铁周围新起的居民区、工业区、娱乐设施等更方便城市居民的出行,人们也可以通过搭乘地铁达到享受城市的便捷服务的目的。除此之外,地铁本身的准时性、便利性和安全性,使得地铁逐渐成为人们交通出行首选的工具。但地铁本身空间比较狭小,若遇上紧急情况很有可能因为客流量过于庞大而不好管理,严重的可能会导致交通
学位
2019年末新型冠状病毒的出现给人们的生命财产带来极大影响,在新冠疫情长期存在的背景下,新冠病毒疫苗的研制和上市成为战胜疫情的关键。只有全民接种疫苗形成群体免疫,才能有效抑制新冠病毒传播。在新冠病毒疫苗研制和接种过程中,新冠病毒疫苗的未知性,新冠疫情爆发的反复性,接种周期的长期性以及社交媒体传播信息的快速性,使得新冠病毒疫苗舆情变得更加复杂。新冠病毒疫苗作为普惠民众的公共卫生产品,需要政府及时干预
学位
国家科技创新能力的提高,离不开高校、科研院所与企业的投入和科研人员的辛苦付出,然而更需要合理的、积极的科技创新政策引导。因此,系统地梳理近十年我国科技创新政策的主题演化过程,运用文本挖掘、深度学习等大数据技术分析、评价现有的科技创新政策,提出改进建议。这是我们目前亟需完成的任务。把“科技创新”作为关键词在中国法律检索系统与中国政府网进行检索。对筛选后的政策分别按照时期与年份分类汇总。研究期内,我国
学位
2020年心冠肺炎疫情爆发之时,以在线直播互动式教学为特点的网课迅速普及。网课形式下会出现大量的交互记录,这些信息是在校上课过程中所无法存储的,这些数据也会带来一定的价值。提升教学质量是教育的一个重要目标,但是如何提升确是一个难题。老师和学生之间的交互会带来更好的教学质量,因此本文选择中国慕课平台上数学、计算机、外语三类课程的数据,重点挖掘学生对当前网课的一些负面评价的核心观点,并对不同类别课程的
学位
中小企业是推动我国经济发展的根本所在,同时也是提高我国就业质量和科技创新水平的重要支柱。然而长期以来,因为市场信息的不对称、中小企业自我运营管理状况和宏观经济制度环境变化等多种原因,中国中小企业普遍存在着融资过难、融资效益低下等困难,这些困难也是中小企业发展与经济社会可持续发展的主要障碍。因此探究解决中小企业融资难、贷款难并最大幅度地提高融资效率是十分有必要的,具有极大的理论意义和实际价值。数字普
学位
随着我国经济社会发展,居民收入增加,生活水平提升的同时,全国商品房价格也一直处于增长状态,并带动了住房租赁市场租金的增长。尤其是在一线和新一线城市,住房租赁市场规模增长迅速,但也存在很多问题亟待解决,如供求关系失衡导致住房租赁供不应求、租客和房东之间存在信息不对称导致租客在住房租金上蒙受损失、大量存在的房产中介使租房过程更加的不透明。为解决存在的问题,建立合理的住房租赁租金价格标准是关键,当下机器
学位
随着技术的成熟以及政策的倾斜,新能源汽车逐步走进大众的视野,我国新能源汽车市场销量从2013年的1.8万辆迅速增长至2021年的352.1万辆。在购买新能源汽车前,消费者都会在网上浏览新能源汽车的相关评论,了解不同新能源汽车的优劣,由此决定自己想要购买的车型。同时,挖掘并整理在线评论背后的信息对推动新能源汽车市场健康发展有着重要意义,新能源汽车厂家可以从这些评论数据中得到用户对具体车型的相关看法,
学位
随着我国社会经济的高速发展与居民超前消费观念的形成,借贷成为个体和企业处理自身经济问题的一个重要途径,国家也通过大力支持信贷产业和其他相关金融机构的发展来刺激消费者消费。然而,由于平台自身监管体系的的滞后性和贷款制度的不完善,用户的违约行为将引起平台坏账率增高,在大多数场景下,信贷违约数据都存在不平衡的特性,如何有效利用数据信息,对借款人的潜在违约风险进行有效评估和识别,在发放贷款前测算借款人违约
学位
近年来,在经济和科技飞速发展的背景下,金融科技正以其大数据、区块链、云计算等前沿技术推动着金融机构的转型升级,对传统金融行业的影响日益深化。商业银行作为金融业的重要组成部分,在金融科技的浪潮下,也面临着前所未有的机遇与挑战。一方面,传统商业银行主要依靠存贷款利差与中间业务收入盈利,而以余额宝为代表的第三方支付产品有效缓解了信息不对称,商业银行在支付结算方面的优势被弱化,面临金融脱媒压力。另一方面,
学位