英文短文本相似性研究及在图书推荐中的应用

来源 :北京林业大学 | 被引量 : 0次 | 上传用户:ymlazy62
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,顾客和商家对电子商务推荐系统的需求日益强烈。然而当前的电子商务推荐系统大多是采用以用户为基础进行构建的。同时,由于系统建立之初,顾客对系统的访问量较少,这些系统往往遭遇了“冷启动”的问题,不能有效发挥推荐系统应有的作用。而基于内容的推荐系统以商品自身属性为出发点,不依靠顾客行为,可以有效解决这一问题。基于内容的推荐系统通常以文本相似性研究为基础,但是由于在推荐中涉及的往往是短文本的相似性问题,而长文本的推荐算法不能很好的应用于短文本相似性比较。本文以计算机图书推荐为例,提出一种实现短文本相似性比较的方法。该方法从互联网中获取了计算机图书的语料库,通过分词、去停止词等预处理,按照基于规则和基于统计的方法提取了计算机领域术语,并进行实验验证。之后,基于提取的计算机领域术语构建了计算机领域语的层次结构,并结合了短文本语义比较的方法,最终形成计算机图书的推荐。同时,基于提出的理论,结合实际,构建出电子商务推荐系统。该系统充分考虑用户需求,对实际的运行方式进行合理设计,为构建电子商务推荐系统提供了一条新的思路。
其他文献
在面向层次管理的科学计算网格环境下,高性能计算机通过本地账号的方式为网格提供资源,网格用户通过应用的方式使用资源。基于该背景,本文对资源组织、用户权限管理、可用计算资
传统的机器学习技术假设所有的错误代价相同。然而在真实世界的问题中,不同的错误往往会带来显著不同的损失。代价敏感学习试图降低总体代价而非简单的减少错误次数。由于此类
公路绿化不仅可以美化路容、净化环境,同时也是保障交通安全的重要条件之一因此,对于公路绿化评价也显得极其重要。而现阶段,对于公路绿化的评价仅仅停留在手工与纸质阶段,完
随着网络的广泛应用,各种应用系统的日益增多,保证整个信息系统的稳定、高效运行就显得极其重要。要实现这一点,除了依靠设备和应用系统自身的可靠性,还必须依靠一套有效的监
学位
地铁作为城市最重要的公共交通工具,承载着大量的旅客,确保地铁的安全运营至关重要。特别是近年来随着我国各大城市建设和运营规模的不断扩大,地铁面临的安全形势日益严峻,对
随着集成电路设计复杂度的不断增加,设计错误的数量也在呈上升趋势。由于速度及模型正确性的约束,硅前验证已经不能保证没有设计错误遗留到硅后阶段。而且随着工艺的发展,硅片中
共享式数据中心利用虚拟化技术在满足各个应用对资源动态需求的同时也提高了资源的利用率,解决了数据中心由于资源浪费带来的一系列问题。服务部署系统利用资源模块化和资源的
云计算是继并行计算、网格计算和分布式计算后的又一新式的商业计算模型。它展示出五种新颖特征:快速弹性伸缩、资源池、按需自助获取服务、广泛的网络接入、可度量服务,这些
随着互联网的不断发展,网页木马这一新形态的恶意代码已经成为互联网上最主要的安全威胁之一。由于其具有被动传播、可利用浏览器提供的客户端执行能力等有别于传统恶意代码
科学计算网格(ScGrid)的开发源于建设“中国科学院超级计算环境建设与应用”,希望建立一个能够把各学科计算应用集成到统一的网格环境,推动超级计算应用水平的提高,为科研信息化