基于京东平台的在线评论有用性识别——以轻薄型笔记本电脑为例

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:huxianding
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的高速发展,网上购物逐渐走入人们的视线并成为日常生活中不可或缺的一环。同时,由于在线评论的简便性,人们随时随地可以在网络上发表自己的看法,这也让越来越多的用户倾向于在网购后分享自己对于这些产品的看法。这些琐碎的评论信息中包含着巨大的研究价值,往往是其他用户在决策过程中的重要参考信息,但网络评论的数量极为庞大且对阅读者的有用性水平不一,单凭人力很难快速定位出高质量的评论,基于这一点,本文通过分析在线评论特征来达到自动识别有用信息的目标。本文以轻薄型笔记本电脑为例,通过网络爬虫的方式获取了包括华为、小米、苹果等品牌在内的8万多条京东在线评论,采集到的具体信息包括用户昵称、文字评论、图片数目、有无追评、回复条数等等。首先,对获取的文字评论进行数据预处理,如评论去重、去除评论中的特殊字符以及中文分词等,并且根据评论内容的质量差异,通过事先约定的有用性程度识别准则将其分别手动标注为高有用性、中等有用性、低有用性三类,为实证分析部分奠定基础;其次,文章结合word2vec模型,通过训练评论数据得到每个词语的向量形式,据此计算相似度对事先设定的初始词库进行扩展,分别构建出完备的商品特征词库和情感词库,从而在此基础上提取评论中的产品特征词、产品情感词数量,同其他影响评论有用性程度的因素一起作为在线评论特征;最后,选取ROF-LightGBM作为本文的多分类模型,同时针对其存在的参数复杂、手动调参不确定性大这一特点引入粒子群算法,将处理好的数据输入到ROF-PSOLightGBM模型中进行训练,找到最优的参数组合,并在测试集上评估分类效果,实现评论有用性程度的自动分类。实验结果显示:第一,word2vec算法能够高效地实现产品特征词以及情感词词库的构建,充分学习轻薄型笔记本电脑这一专业领域词汇;第二,粒子群算法保证了为每个基模型找到较优的参数组合,自动改善模型结构,提高原模型的分类准确性;第三,ROF-PSO-LightGBM相比ROF、LightGBM、ROF-LightGBM等模型在评论有用性识别问题上有着更好的表现,具备一定的可应用性。
其他文献
人工智能的发展开拓着一个又一个新的领域,经济水平的提高使得人们对健康服务的需求不断扩大。目前我国医疗资源存在着分布不平衡、卫生服务供不应求以及医患关系紧张的问题,这些问题在疫情期间体现尤为突出。在线医疗平台是解决我国卫生服务不平衡的一个重要方法,医疗问答社区平台是在线医疗中的一个主要存在形式,患者可以通过与医生以在线交流的方式了解病情,但患者提出问题的数量远大于医生数量,如何通过人工智能的方法推进
学位
建筑工程管理是项目作业中至关重要的一项工作,其能够优化作业安排、解决工程问题等,对提高工程作业的综合效益起到显著的促进作用。但传统建筑工程管理模式已难以适应当前建筑工程管理需求,不利于高质量建筑项目落地,在一定程度上影响建筑行业的健康发展。基于此,文章分析了建筑工程管理的现代化和精细化意义,探讨建筑工程管理过程中存在的问题,并提出了建筑工程管理现代化和精细化的实现途径,旨在全面提高建筑工程管理水平
期刊
为了推进我国法治社会的建设,满足公民日益增长的法律诉求,司法行业正在不遗余力地进行深化改革。由于以律师、法官等代表的法律机构以传统人工的方式处理海量的法律文本已不再现实、“同案不同判”等涉及到司法自由裁量权的现象也屡见不鲜,因此如何借助大数据技术优势,提高相关机构工作效率,维护行政处罚决策的公平性就显得尤为重要。本文旨在通过大数据技术处理海量的法律文本,借助时下热门的深度学习方法,提高行政处罚决策
学位
以某复杂老矿山地质环境保护与土地复垦方案编制为例,总结复杂老矿山编制工作的相关经验,对编制该类矿山地质环境保护与土地复垦方案的要点进行阐述。对于复杂老矿山,必须在彻底调查地质环境条件的基础上,针对长期开采遗留的治理难题,以安全性为重点开展现状评估工作;对于边坡等敏感设施,需要做出稳定性分析以及必要的治理;开展预测评估工作时以土地损毁为重点,为后续开展的环境保护和土地复垦工作提供切实可行的技术依据。
期刊
随着经济全球化的深入,各种突发事件如金融危机、恐怖主义等发生的频率也越来越大,突发事件对股票市场的影响已经不再是地域性的,而是对全世界的股票市场都会产生冲击。此次新冠肺炎疫情是一个典型的突发事件,在短期内对我国的经济产生了冲击,而股票市场是经济的晴雨表,能够在一定程度上反映此次疫情对我国经济产生的影响。同时随着疫情的全球化蔓延,对世界的股票市场也会产生一定的冲击。准确评估突发事件对我国股票市场风险
学位
由于概率图模型便于建模变量关系、概率推理以及知识发现,所以其思想在人工智能前进的浪潮中发挥了十分重要的作用,最近更是有一些神经网络结合概率图思想的研究在某些问题上取得了state-of-the-art的结果。另外,无论是计算机硬件不发达的上个世纪,还是大数据时代的到来,提高算法性能都至关重要,而这一点在并行程序设计理论中找到了不错的解决方案。作为一名统计学学生,本文在研究了大量计算机理论的基础上,
学位
近年来,伴随着互联网技术的高速发展以及人们生活水平的日益改善,人们开始热衷于在挑选在线旅行产品时通过浏览在线旅游网站或互联网旅游平台的产品点评或游记等内容来寻找适合自己的旅游景点。然而,由于各大网络旅游平台的用户量迅速增多,越来越多的消费者开始在旅游平台上分享自己的旅游体验和感受,各类评论内容也多样繁杂。这些信息一方面能够为其他消费者提供指引,另一方面也使得消费者在挑选旅游产品时难以获得优质、适合
学位
伴随着司法智慧化的广泛开展,人工智能技术可以辅助专业人士提高工作效率,提升群众法律意识。对于法律行业相关人员来说,各级法院在案件审判之后记录的裁判文书具有具有宝贵的研究意义。不论是群众在自身面对纠纷想要寻求专业帮助或是法官进行案件审判前进行参照时,过往类案都能起到参考辅助、有效解决量刑偏差的作用。因此从技术层面利用计算机自动查找出相似司法案件,减少人工成本和主观偏差具有很高的研究价值。为了保证类案
学位
中小企业的健康成长,关系到国计民生,在我国经济发展中具有重要的地位。而我国中小企业一直面临的融资难、融资贵等问题限制了其发展。近年来,以大数据、区块链、云计算等为技术支持的金融科技不断发展,一方面增加了企业的融资途径,缓解了其面临的融资约束;另一方面也使得金融服务机构利用技术手段降低了服务成本,提升了企业的融资效率,加速了中小企业的发展进程。本文从融资约束与技术创新两个视角,探讨金融科技对中小企业
学位
近年来,我国科技创新能力保持较快发展,取得了一系列的科技创新成就,但是发展过程中各区域的不均衡问题突出,对科技创新能力整体的提升起到了阻碍作用。因此对区域科技创新能力进行测度、探索区域科技创新能力空间关联性,有助于了解全国科技创新能力的发展水平与分布差异性,并在此基础上对症下药,对区域科技创新能力的提升具有重大意义。本文首先对相关文献进行了梳理,明确了研究内容与研究方法,从科技创新投入、科技创新环
学位