基于图书评论大数据的语义好评度计算方法研究

来源 :东北师范大学 | 被引量 : 2次 | 上传用户:anlanyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图书是人的精神食粮,作为传递人类智慧,传播大众知识的产物是我们人类社会不可或缺的必要性产品。然而,由于现有图书数量过于庞大,种类的繁多,以及找不到同类图书中较好的图书,加之质量的良莠不齐,使得人们在购买图书以及阅读时,常常出现选择困难,甚至无法对图书的优劣做出一个合理的判断。因此,若能为图书的使用者,提供一个辨别图书“好坏”的方法,将能够解决“选择困难和良莠难辨”的困惑,让图书出品人出好书、销售商卖好书、读书人读好书。为了更加客观的评价“图书质量”,本文提出了“语义好评度”的概念,并且基于图书评论大数据给出了语义好评度计算模型。该模型首先,以图书销售网站中的大量图书评价信息为基础,通过定义语料切分词规则,标注语料词性,提取核心关键词来实现图书语料的抽取,经过过滤和去重,保留有利用价值的评价文本。然后,在此基础上构建主题分类词典,并且对于不同的主题类构建图书评价倾向性词典,包括情感词典,程度词典,否定词典。为了实现动态更新,采用数据驱动的方法计算不同词典的权重值。为了提高语料的利用效率,设计了将图书评论按照不同主题进行语料聚集。最后针对不同类别的主题评论,通过单句级、用户级、图书级逐级语义好评度计算方法的设计,实现基于规则与统计的图书语义好评度计算算法,该算法能够对图书的不同主题进行语义好评度计算。本文设计并实现了一个基于图书评论大数据的语义好评度计算模型,并且根据图书销售网站评论语料进行实验验证,实验结果表明该计算方法能够很好的反应图书的受欢迎程度,从而为读者挑选图书提供更好的参考指标。
其他文献
中国心理学本土化的提出和发展源于文化人类学的冲击、建设现代化的需要及世界心理学的呼唤。中国心理学本土化的方法:一要以辨证唯物主义为指导思想,二要以中国文化和古代心理
物联网是继计算机、互联网之后的第三次世界信息产业革命浪潮,是未来科技发展的大趋势。通过分析现行农产品物流配送模式下,物流配送过程中存在的信息不对称、技术设备落后、
香草酸(4-羟基-3-甲氧基苯甲酸)广泛存在于胡黄连、高丽参、蜂胶等中药材中。它具有较强的抗氧化、抗菌活性,是良好的混合型酪氨酸酶抑制剂。闫军等通过实验证明具有C6结构且对
<正>无论是必修还是选修教材的编写都更有利于学生自主学习,从而也迫使教师的教学方式发生了根本改变,更多的课堂教学摒弃了单纯的知识传授,取而代之的是学生积极参与的探究
本文指出了克拉斯纳以行为学标准界定国际机制概念所存在的循环推理的方法论问题,论证了以形式学标准的概念界定方式的合理性,并以这一标准重新界定了国际机制概念。在此基础
介绍了在漂石及孤石地层中钻孔桩的施工工艺,并对成孔过程中事故的处理及事故的预防方法进行了探讨。
伴随时代的不断发展,改革开放的不断深入,我国企业经济发展模式逐渐发生变化,并且向越来越科学化的运作模式转型。构建完善的财务共享服务中心,能够成功促进我国企业在经济收
本文解读美猴王之美,认为其根源于中国猴文化,经历了从鄙猴到灵猴的悄然蜕变;内在精神为滑稽玩世,是狂士传统、道家玩世主义与猴文化结合变异的新产物;美学表现主要为狂傲美,
新中国成立后,中国共产党领导全国各族人民坚定不移地开展反腐败斗争,大力推进制度建设。毛泽东主要是以群众运动的方武反腐败,对制度建设进行了初步的探索;邓小平提出“两个手段
髌骨内脱(medial patellar luxation)是犬常见的膝关节疾病,多发于小型犬。该病病因不清,在人医骨科,已经证实高位髌骨与复发性髌骨脱位、髌骨半脱位、软骨软化以及膝关节前侧疼痛