基于LDA主题模型和偏序集的在线商品评论研究

来源 :情报探索 | 被引量 : 0次 | 上传用户:cdabcabc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]从大量在线商品评论中得到有价值的信息,为商家掌握顾客消费需求以及消费者选择商品提供依据.[方法/过程]以LDA主题模型和偏序集理论为基础,构建在线商品评论分析模型,并以天猫商城空调的在线评论文本为例进行实证分析.首先,利用八爪鱼采集器爬取商品评论文本;其次,利用LDA主题模型从在线商品评论文本中提取出影响顾客消费的因素;最后,基于偏序集理论对调查问卷收集的数据进行商品排序.[结果/结论]通过实证分析证明该模型可行有效,不仅能帮助商家掌握顾客消费需求和潜在倾向,也可以使消费者迅速筛选出心仪的商品.
其他文献
[目的 /意义]领域学术观点库构建的目的 在于实现领域内各学者、学派学术观点的集成,形成对领域知识更全面的认知.[方法/过程]从柏拉图知识观视角明确学术观点与相关概念区别,分析其与一般观点的特性.通过分析学术观点在学术活动中的作用明确领域学术观点库的功能.设计领域学术观点库系统的模块结构,探讨各个环节构建过程.[结果/结论]领域学术观点库构建可以分为文本获取、结构化表示、关联关系组织和应用服务四个模块.数据搜集需遵循全面性、相关性和及时性原则,结构化表示包括原子型拆解和元素抽取,学术观点间关系组织通过比较
[目的 /意义]量化分析研究美国科学基金会(NSF)资助项目的 学科交叉度演化规律及影响因素,从研究项目维度观察学科交叉发展规律和特点,为我国从项目资助角度促进学科交叉发展提供参考借鉴.[方法/过程]以NSF 2009-2018年资助的十大科学部共103819个项目为研究对象,从整体资助特征、学科交叉度分布情况、学科交叉度影响因素三个角度出发,首先分析各科学部资助项目数量与资助金额变化趋势及TOP10项目承担机构;其次对各科学部学科交叉度及其演化趋势进行分析,并使用交叉融合网络图可视化科学部间知识流动网络
[目的 /意义] 2016年后日本开启大刀阔斧的跨境数据流动治理,通过积极倡导跨境数据流动与安全理念,政策的不断推进,已经取得阶段性成效.研究日本跨境数据流动治理的主要理念与举措,有利于提升当前我国治理跨境数据流动理念认知,借鉴相关治理经验.[方法/过程]梳理日本跨境数据治理过程,聚焦其治理政策衍化,分析日本跨境数据流动治理基本框架与治理成效.[结果/结论]通过多年的治理,日本已经取得一定的全球跨境数据流动规则制定主导权并持续完善,中日在跨境数据流动治理上具有理念相通性,可以从日本治理中借鉴经验完善我国数
[目的 /意义]产品在线评论中既包含用户对产品的整体体验评估,又包含对产品的特定属性评估,通常超负荷、碎片化且价值密度低.文章旨在提出一种在线评论的主题图谱构建方法,试图将在线评论进行更有效的信息组织.[方法/过程]文章首先设计模式层三元组,然后提出数据层实例化的方法,该方法主要是结合线索利用理论明确主题结构,基于依存句法分析等自然语言处理技术抽取主题词、计算主题情感强度并发现主题的共现关系,而后利用统计分析方法计算主题共现的权重.将该方法应用于实际的在线评论中进行主题图谱的构建实验,最后将生成的主题图谱
[目的 /意义]对张薇研究员主编的《国家安全情报研究》一书进行解读评论,向情报学界推荐该书,供开展学术研究与服务工作使用参考.[方法/过程]从与国内外现有成果对比具有的内容与特点、在厘清对情报的认知、对情报研究与服务工作的促进作用等方面对该书进行了分析评论.[结果/结论]从该书的内容特色与看点、对中国未来的情报工作和情报学研究的独特价值、不足之处等方面进行了介绍和评论.
[目的/意义]旨在为政府部门及公共服务组织有针对性地提升舆情治理能力,提高公共服务质量提供参考.[方法/过程]基于COVID-19疫情期间42万量级的用户舆情大数据,提出一种主题挖掘与情感分类协同进行的分析框架;采用朴素贝叶斯算法,对用户舆情文本进行情感值评估;利用自建词典、Jieba分词改进高效的Single-Pass文本聚类算法,挖掘网络舆情热点主题、情感倾向及其时空演化特征;最后结合Gephi网络分析探究舆论的地域间传播特征.[结果/结论]虽疫情各阶段民众关注主题不同,但“通过网络媒体表达、发泄情绪
[目的/意义]旨在为相关部门或新媒体平台运营商对如何促进突发公共卫生事件相关信息的高效传播提供建议与指导.[方法/过程]以COVID-19为例,探究新媒体环境下用户突发公共卫生事件信息获取行为的影响因素,基于社会认知理论和综合信息搜寻模型,构建用户突发公共卫生事件信息获取行为影响因素的初始模型;利用问卷调查法收集相关数据,结合信度分析、效度分析、单因素方差分析、相关性分析、多元回归分析多种方法对初始模型进行验证并建立回归方程.[结果/结论]社会影响、感知新媒体平台疫情信息有用性、感知新媒体平台疫情信息可靠
[目的/意义]旨在为学术期刊评价提供参考.[方法/过程]采用模糊DEMATEL方法和Heronian算子对学术期刊进行综合评价,为了验证该模型的有效性与合理性,选取2019年版《中国学术期刊影响因子年报(人文社会科学)》提供的30种农业经济类期刊和9项评价指标进行实证分析.[结果/结论]该模型不仅可以充分考虑学术期刊评价指标之间的相互影响关系,还可以较好地消除评价指标之间的相关性,进而能够提高学术期刊评价结果的准确度,能够使得学术期刊排名更为可靠.
[目的/意义]分析不同类型群体的线上求助特征,旨在为线下救助机构实施精准服务提供依据.[方法/过程]采用Python技术抓取新浪微博“肺炎患者求助”超话中的原始数据,抽取25名患者做半结构化访谈,结合扎根理论提取病人线上求助的影响因素,并通过电话问卷调查方法进行样本采集,利用二阶聚类算法分出三类具有不同特征的用户群体.[结果/结论]基于线上求助病人用户画像特征属性,将病人分为备受关注型患者、普通大众型患者、风险敏感型患者3类.备受关注型患者主要为中年男性患者,所发布的求助微博热度高、转发量大,从感染或确诊
[目的 /意义]微博是网络舆情传播的重要平台之一,为了对海量微博中的突发舆情事件进行监控预警,并获取开源情报.[方法/过程]文章以短语作为兴趣词项,提出了基于突发短语挖掘的微博舆情事件检测方法.首先,利用自动短语挖掘方法AutoPhrase从微博文本中识别出具有潜在舆情价值的优质短语;然后,基于短语相关统计信息,识别出主题性、流行性、突发性均较大的高舆情价值的突发短语集合;最后,构建突发短语共现网络,利用模块度优化算法对短语聚类,从而得到不同的舆情事件.[结果/结论]基于推特数据的实验结果表明,与基于单词