家电产品竞争信息挖掘研究

来源 :西南科技大学 | 被引量 : 0次 | 上传用户:liyanhao1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来我国的电子商务行业蓬勃发展,其中以天猫、京东、苏宁易购、易迅等为代表的电子商务网站在在线家电零售上的表现尤其突出。它们深刻改变了我国家电销售方式以及用户的消费习惯,同时也极大地增加了家电生产商的竞争压力。家电产品用户对所购买产品的认知与评价、对产品属性的情感倾向以及家电产品之间的差异化程度都成为家电产品生产厂商重要的竞争信息。  如何挖掘竞争家电产品信息,如何挖掘用户对于产品的意见和建议,成为了家电生产企业深入了解用户的真实需求、提升产品竞争力的关键所在。本文旨在研究挖掘电子商务网站海量的销售记录以及用户评价,为家电产品生产商提供一个清晰的竞争产品对比、用户对产品某属性的情感倾向以及用户对产品客观评价的自动文摘,并提出构建家电产品竞争信息挖掘系统的方法。  首先,文本提出了如何在互联网上获取、存储大量产品信息以及用户评价信息。结合电子商务网站的特点,采用了自建爬虫获取大量的产品信息以及其对应的用户评论信息。并使用分词工具FudanNLP等,分别对数据进行抽取、清洗、转换、装载和分词。  其次,本文在产品抽取的属性基础上构建了动态的家电产品信息库,并在Jena本体映射的基础上构建了基于本体的家电产品查询方式,并且提出了基于家电产品的本体相似度算法。通过该算法可以对不同的家电产品进行属性对比,获取家电产品本体的属性演变以及竞争产品之间的差异化情况。  再次,本文根据得到的用户评论信息做基于用户评价的产品属性倾向性研究。在前面本体建模的基础上,本文主要研究基于用户评论的短文本情况下用户对产品属性的倾向性意见。  然后,本文提出了基于用户评价的产品摘要算法与实现。该算法是在完全稀疏主题模型(Fully Sparse Topic Model,FSTM)的基础上进行的,该算法主要目的在于研究根据用户对产品的评价自动获得用户群体对于特定家电产品客观真实的评价。  最后,本文对家电产品竞争信息挖掘系统的构建提出了解决办法和具体的实施方案,并构建出了家电产品竞争信息挖掘系统的原型。
其他文献
图像的边缘细节信息直接影响图像的视觉质量。传统的超分辨算法会出现边缘模糊和锯齿等现象,本课题分析了国内外的成果,把张量能保持图像局部结构信息的特征引入到超分辨中,根据
无线传感器网络(Wireless Sensor Network-WSN)作为物联网的“末梢神经”,是一种综合数据感知与采集、融合处理和信息传输功能于一体的无线自组织智能群体型网络信息系统,其
随着信息技术的不断发展,信息获取能力的不断提高,人们往往需要分析和处理各种高维数据,如:海量web数据、遥感图像、微阵列数据等等。这些高维数据通常会导致机器学习算法的计算
频繁模式挖掘是数据挖掘领域的重要算法。频繁模式挖掘在事务数据库、时间序列数据库和许多其他类型数据库的挖掘研究中都得到了广泛的应用。然而,传统的Frequent-patternGrow
近年来,大量研究表明,脑网络在结构和功能上具有一定的拓扑结构和组织特征,并能够提供稳定的生物标记,这为人们理解大脑机制提供了新的视角。因此,针对脑网络的研究吸引了大量学者
MapReduce是Google开发的一种并行分布式计算模型,已在搜索和处理海量数据领域得到了广泛的应用,Hadoop是它的开源实现。MapReduce编程模型因为其良好的可扩展性、高可用性以及
针对聚合签名系统中的密钥泄漏问题,本文将密钥隔离机制引入到聚合签名系统中,提出了三种不同的密钥隔离聚合签名方案。取得的研究成果如下:1.提出了密钥隔离聚合签名的概念,
群体异常行为检测与识别技术是指通过分析视频中的群体行为实现自动检测群体异常行为并识别出其类型的过程。本文在研究和分析了现有的群体异常行为识别关键技术的基础上,对群
前mRNA剪接是一种复杂且无处不在的核过程,它是基因表达中引起致癌错误的天然来源。此外,过去20年来的许多研究报道了在没有基因组突变的情况下癌症特异性的选择性剪接。受影响
随着信息技术的发展,计算机局域网络的规模不断扩大,局域网内的设备与应用系统数量越来越多,网络结构也越来越复杂。如何保证网内设备与应用系统的安全运行,需要依靠相应的监控系