基于语义理解的观点评论挖掘研究

被引量 : 0次 | 上传用户:YX19781987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅速发展,网上文本数量呈指数级增长,如何从这些海量的文本中挖掘有用的信息成为当前研究的重要课题。文本挖掘是指以计算语言学、统计数理分析为理论基础,结合机器学习和信息检索技术从大量文本数据中抽取事先未知的、可理解的、最终可用的知识的过程,同时运用这些知识更好地组织信息以便将来参考。本文就是立足于文本挖掘技术的研究,结合当前电子商务和网上评论的盛行,从商品的观点评论中挖掘信息,反馈给商家和消费者。本文第一部分详细地介绍了文本挖掘和观点评论挖掘的发展概况和相关技术,随后在第二部分系统地分析了文本挖掘所采用的技术及算法。同时,对文本挖掘中的重要分支——文本分类做了深入的研究,探讨了文本分类的一般过程,以及目前比较流行的分类方法。在文章的第三部分对前人所做的工作做了一些改进,分为两个方法,第一由于传统粗糙集规则匹配方法过于复杂,设计了一种简化算法的分类方法;第二是基于词共现概念的文本分类方法,弥补了传统向量空间模型中特征项的独立性,用词共现的概念特征体现了文档中的语义。两种方法虽然都提高了分类结果,但所面对的问题不一样,第一种是为了优化算法复杂度,而第二种是侧重于语义概念的。本文的后三部分鉴于网络评论的流行,结合一些文本挖掘的思想,对网络商品评论的挖掘做了一些研究。借助于国外一些学者的研究成果,设计了两种商品评论挖掘算法。第一种算法为基于关联规则和语义理解的商品特征挖掘,思想主要侧重于挖掘商品评论中的特征,整体思想比较简单,但过分依赖于统计的方法,缺乏深入的语义分析;第二种算法是在第一种方法的缺陷上做了一定改进,利用依存关系定位观点词,同时将语义相似度的思想引入中文的商品评论中,结合中文和英文的区别,正确率和召回率均有所提高,但总体来说,由于网络评论的自由性,召回率不如正确率。
其他文献
网络以其资源的丰富和即时,让地球成为一个“村落”;以其开放性、互动性,使学生自主化个性化的学习成为可能。校园网络的出现为小学生的学习提供了一个全新的舞台,作为一种传播手
生物教学应重视科学探究的内容和方法,让学生多观察多动手养成习惯习得能力,需要教师在教学中多加引导正确的评价,从而提高学生的生物科学素养。
根据虚拟现实技术在焊接培训中的优势和焊接国际化培训方案,探讨制定合适于职业焊接教育及培训的低碳发展模式和教学培养方案,提升焊接培训机构的竞争优势和毕业生的就业优势
养老保障是我国人口老龄化过程中面I临的最大挑战。随着人口年龄结构的变动和农村劳动力的转移,农村人口的老龄化速度已经超过城市。而农村养老方式仍然处在转型阶段,传统的
心理学中的暗示效应与我们每一个人都是息息相关的,它总能影响着我们的生活,工作和心情。积极的暗示效应能给我们传达正面的力量,使我们心情愉悦从而提高我们的生活质量。消
采用仿真计算方法,对汽车转向系液压阻尼减振器消减一种国产微型汽车独立悬架转向轮摆振的效果进行了分析。建立了该车转向系的五自由度集总参数摆振分析模型,并确定了模型的
随着我国公路工程的快速发展,在软岩状况下修建的公路隧道越来越多,新奥法施工在软岩隧道修建中具有很大的优势,其认为围岩具有一定的承载能力,能够和支护结构协同工作,形成共同的
上个世纪90年代以来,随着我国经济的发展、生活水平的提高,人们开始注重精神生活的品质,文化旅游逐渐地兴盛起来,且覆盖面积越来越广、规模越来越大、形式越来越新,参与的游客也越
根据实际应用的需要,钢管应进行平端面加工,用于焊接的钢管还应进行倒焊接坡口的加工。倒棱机是钢管端面加工的专用设备。目前传统倒棱机的加工质量仍无法满足市场要求,而进口倒
柏拉图的对话是研究西方哲学最丰富的宝藏之一,今天我们所研究的诸多哲学问题几乎在那里都可以找到颇有启迪的看法,即便是发轫于上世纪几乎覆盖了现当代西方哲学主要著作的语