基于质量评估的产品评论主题监测应用研究

来源 :东北财经大学 | 被引量 : 0次 | 上传用户:zhanglicheng666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今,随着互联网技术越来越成熟,各电商平台迅速发展,人们在网上购物愈来愈多。在购买后大多数购买者都会对购买的产品发表评论,这些评论对于商家以及购买者都有至关重要的作用。但是因为数据规模大且数据复杂,商家以及购买者很难准确的从这些评论数据中获取信息。商家一方面希望从评论数据中获取购买者对自己产品的情感,是喜欢还是不喜欢,从而对产品进行改进;另一方面想从数据中了解消费者对产品的关注点的变化,调整销售策略。消费者在购买商品时都会看这些商品的评论,想从中获取到产品的信息,但是由于评论数据的良莠不齐,购买者很难做出正确的判断。为了满足商家以及消费者的需求,本文将从评论质量评估、评论主题挖掘以及评论主题热度预测三个方面进行研究。本文实证部分选取了亚马逊平台上吹风机、微波炉以及婴儿奶嘴三类产品的评论数据。首先通过TF-IDF对评论文本数据进行特征提取,对提取结果利用低方差滤波器和PCA进行两阶段降维,并与评论文本长度相结合作为输入变量;之后构建目标变量评论质量标签(label),通过XGBoost构造产品评论质量评估模型,并验证了 XGBoost模型对评论质量评估的模型效果优于随机森林和逻辑回归模型,以及对TF-IDF特征提取结果进行两阶段降维,有利于提升XGBoost产品评论质量评估精度,说明本文提出的基于两阶段降维的XGBoost产品评论质量评估模型适用于评论质量评估。其次,筛选出高质量的评论数据,以吹风机产品评论数据为例,利用LDA主题模型对产品评论文本数据进行评论主题挖掘,挖掘出12个产品评论主题,并验证了在高质量评论数据下挖掘产品评论主题能更准确地反映产品特征。最后,对产品评论主题热度进行预测,利用K-means聚类方法对12个产品评论主题进行聚类,得到产品性能主题、产品参数主题以及产品满意度主题3类产品评论主题。构建评论主题热度指标,基于时间维度下利用LSTM时间序列模型预测3类产品评论主题热度的变化趋势,并验证了LSTM时间序列模型在预测产品评论主题热度的效果优于随机森林模型和XGBoost模型,且对质量评估后的评论数据进行主题热度预测,对主题热度预测精度有所提升。说明LSTM时间序列模型适用于产品评论主题热度预测以及本文思想方法的上可取性。本文创新点:首先,在XGBoost对评论文本质量评估时,利用了低方差滤波器和PCA(主成分分析)相结合的两阶段特征提取方法对TF-IDF特征提取后的结果进行了降维,并将降维后的结果与评论文本的长度相结合作为输入变量,极大地减小了数据维度,节约了运行成本并提高了模型精度。其次,在对产品评论主题挖掘和产品评论主题热度时,考虑到了评论质量高低对研究结果的影响。提出基于高质量的产品评论数据,利用LDA主题模型对产品主题进行挖掘以及LSTM时间序列对产品评论主题热度进行预测,使研究结果更加准确地反映出产品信息。
其他文献
孤儿核受体Nur77在细胞存活与凋亡中发挥着重要的调控作用。在许多癌症中都能观察到Nur77的异常表达,因此在以靶向治疗和免疫治疗为趋势的时代,Nur77作为药理靶点已受到广泛的关注。本课题组在前期工作中以Nur77 B位点为靶点,借助计算机虚拟筛选的手段得到了化合物XS0561,相较于Nur77已被报道的配体,其骨架具有很好的新颖性。XS0561结合Nur77的Kd值为8.237 μM,在细胞和
学位
保障与改善民生是促进社会和谐稳定的重要抓手,也是对新时代中国的基本要求。随着“十四五”时期的到来,中国进入新的发展阶段,人民对美好生活的要求也不断提高,民生工作将面临更大的压力和挑战。为了在高质量发展中不断增进民生福祉,实现让全体人民共享改革发展成果,中国必须要在经济高质量发展的过程中持续落实好各项民生事业,发展好民生产业,在更深层次中不断增进民生福祉。特别是我国目前已经完成了消除绝对贫困的艰巨任
学位
当前,我国已转向高质量发展阶段,但发展不平衡问题仍然突出。发展不平衡问题是现阶段我国社会主要矛盾的一个重要内容,将贯穿今后相当长的一个历史时期。我国进入新发展阶段,解决地区发展不平衡的问题更加迫切。自国家开始重视区域经济的均衡发展以来,各个地区之间协调合作,使得区域经济朝着好的方向快速发展。那么,衡量各地区发展水平的指标是否合理?我国各地区发展水平差距是否缩小?影响各地区经济发展不平衡的主要原因是
学位
为了解决餐厨垃圾沼液的处理效率低、固液分离难等问题,采用高级氧化-絮凝组合工艺进行了沼液处理。在过硫酸盐氧化技术中,探究了Fe(Ⅱ)和S2O82-摩尔比、浓度、温度、反应时间参数对沼液氧化性能的影响,并进一步研究了高级氧化-絮凝组合工艺对沼液的预处理效率。结果表明:当n(Fe(Ⅱ)∶S2O82-)=1∶1、C(Fe(Ⅱ))=2 mmoL/L、C(S2O82-)=2 mmoL/L、室温、沼液原pH值
期刊
现阶段癌症依然是威胁人类健康的重大疾病。化学小分子水溶性差、半衰期短、易出现耐药性等缺点,大大降低了药物治疗效果。例如,临床常用的广谱抗癌药阿霉素,无肿瘤靶向特异性,存在严重毒副作用,也有可能诱发多药耐药等。因此,为提升纳米药物靶向肿瘤递送效率,提升药物在肿瘤部位的聚集,基于肿瘤微环境的主动靶向或智能响应型诊疗一体化纳米粒子深受研究人员的青睐,是肿瘤治疗的新策略、新方法。但是当前纳米载药系统存在载
学位
背景:糖尿病是一种以糖代谢紊乱、高血糖为主要特征的代谢性疾病,近年来糖尿病患病人数逐年增加,且日趋年轻化。目前,临床上治疗Ⅱ型糖尿病的药物包括双胍类降糖药、促胰岛素分泌剂、α-葡萄糖苷酶抑制剂、噻唑烷二酮类胰岛素增敏剂等。其中,α-葡萄糖苷酶抑制剂近年来在Ⅱ型糖尿病的治疗领域获得了广泛认可,代表药物为阿卡波糖,可通过降低小肠对碳水化合物的水解而降低病人的餐后血糖峰浓度,然而也存在着一定副作用,如恶
学位
光疗是治疗癌症的重要辅助手段,主要包括光热疗法(PTT)和光动力疗法(PDT)。然而,当前单一的光敏剂通常带有光热转换效率不足或活性氧(ROS)生产率不足的缺点,即光热性能好的光动力性能差,光动力性能好的光热性能差。此外,由于癌细胞中谷胱甘肽(GSH)的过度表达,而GSH会消耗ROS,从而限制了 PDT。为了克服这些问题,我们选择了具有出色光热能力的吲哚菁绿(ICG),其磺酸基可以与Cu2+配位获
学位
真菌性角膜炎是一种由致病真菌引起的致盲性角膜疾病。局部使用滴眼液制剂是治疗真菌性角膜炎的常用方法,但是滴眼液在临床上的治疗仍然存在许多限制。由于难溶性药物低的溶解性和眼部的眨眼、流泪、鼻泪管引流等清除机制,普通的药物容易快速从眼表清除,导致药物短的眼部作用时间和低的生物利用度。为了达到有效浓度,临床上常常使用高剂量、高频率的给药,导致患者不耐受和低的依从性。因此,有必要开发能够延长药物在眼部滞留的
学位
AIDS目前仍是全球亟待解决的重大疾病之一,虽然已有的逆转录病毒抑制剂可以抑制HIV-1病毒的复制,但不能根除潜伏期的HIV-1,潜伏期的HIV-1可以将其基因组整合到静息状态的T细胞中从而存活下来。因此,阐述HIV-1转录过程的潜伏机制对于彻底治愈HIV-1具有重要意义。已有的研究发现,蛋白酶体参与了基因的转录调控过程,下调或抑制蛋白酶体可以促进HIV-1基因转录激活,从而促进转录的高效进行。P
学位
近年来,随着以纳米颗粒为基础的药物载体的应用,使化疗药物在临床应用中具有更高的利用率和生物相容性。病毒样颗粒(virus like particles,VLPs)作为一种结构稳定,生物安全性高,容易被功能化修饰的蛋白纳米笼结构的纳米颗粒,在生物医学材料领域受到广泛关注。迄今为止,针对VLPs的应用研究都集中在疫苗领域,利用其本身的免疫原性作为抗原提呈载体,少数人也将其作为药物递送载体研究。将VLP
学位