大数据环境下基于本体的协同过滤推荐算法改进研究

来源 :南京工业大学 | 被引量 : 0次 | 上传用户:wxhex2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着世界经济的发展,技术创新成为推动生产力发展的重要因素,如何将技术快速转化为生产力,成为世界各国研究的重要课题。技术创新平台在信息化手段的支撑下,整合产学研力量,促进科技成果转化、产业化和战略性新兴产业发展,推动技术创新和技术对接转移。由于技术创新平台应用的推广,技术创新平台的技术项目和供需用户越来越多,数据量爆发式增长,供需用户要在海量信息中快速找到合适的技术对接项目极其困难。技术推荐系统能够对用户进行个性化的技术推荐,提高技术对接的成功率。但是在技术创新平台和用户数量快速增长的今天,海量繁杂、多源异构的大数据,自然语言表达的、潜在的用户需求成为技术推荐系统快速有效地产生准确推荐结果的瓶颈所在。本文在此大数据环境下,结合本体论、现代智能推荐算法、大数据解决方法等思想,以提高大数据环境下技术推荐的精度和速度。本文首先分析了技术创新平台和技术推荐系统的特点、目标和研究现状,分析用户的需求,发现了目前技术推荐系统在大数据环境下存在的问题。结合技术推荐系统的大数据特点,在分析现有技术推荐系统应用现状的基础上,选择了对于数据要求较低、应用较为成功的协同过滤推荐算法。大数据环境下应用协同过滤算法对于自然语言表达的用户需求、用户潜在需求难以处理,影响了推荐精度。本文针对这一缺陷,考虑引入本体改进技术推荐模型,建立领域本体知识库,将语义相似度结合到传统的协同过滤算法中。一方面提高了推荐精度,可以挖掘动态潜在的用户需求,另一方面将文本表达的用户需求转化为本体知识库中的位置信息,提高了推荐速度。为了测试改进算法的有效性,通过相关算例测试结果表明,改进后的算法能在一定程度上提高推荐效率和推荐质量。但是对于海量繁杂的大数据,引入本体优化后的协同过滤算法的推荐速度还是有所欠缺,本文通过分析比较现有的大数据处理方法,结合技术推荐系统的大数据特点,选择了较为简单方便的MapReduce进行算法的进一步优化以提高技术推荐系统的推荐速度。算例测试结果表明,通过MapReduce优化后的基于本体的协同过滤算法的运算速度得到进一步提高。本文针对技术创新平台的大数据特点提出了基于本体和协同过滤算法的技术推荐系统,并引入了MapReduce处理技术,对技术创新平台和技术推荐系统未来的发展和应用有一定的价值。
其他文献
<正> 说话已是十多年前的事了。1965年4月间,“北京日报”编委会根据当时党中央要求加强越南战争的报道,决定加强国际部的评论工作。组织上决定把我从文艺部抽调到国际部去。记得是5月中旬的一天,我到国际部不过一个月,文艺部的老同志希望我能就美帝出兵侵占多米尼加问题支援他们一篇杂文。那天晚上,我翻阅着近期的国际剪报和我自己读报时信手记下的札记开始构思文章。起初我写了篇《怒吼吧,多米尼加人!》。
随着经济的发展,技术不断提高,知识产业规模的发展已经达到了一定的高度,但是,知识产业普遍存在着因为结构的不合理而造成的知识流强度较弱,知识转换成产品的效率不高的问题。为此
随着电子通信技术的日新月异,报纸的发行水平,也在相应地不断提高。利用卫星传递版样以扩大发行网,已成为今后十余年内报纸的发展方向。去年创刊的《今日美国》,利用卫星传
有歧义的句子,时有所见。所谓歧义,即一个句子表示出两种不同的意思,使人无所适从。为了避免歧义的产生,首先要研究产生歧义的原因。然而原因又是多种多样、极为复杂的。本
长期以来,我省栽培茶树,很不注意生态条件,园地周围也很少林木间植。特别是三十年来采取集中连片辟种茶园,更是这样。然而茶树原生于亚热带林区,形成喜温好湿,耐荫忌强风暴
计划和调度是生产管理系统中最为重要的两个子系统。传统的生产管理系统存在如下几个问题:一,将计划和调度分为串行的两个阶段即先制定计划再进行调度,这种工作方式由于两者不
本文以提高水稻品种IR24等对白叶枯病的抗性为材料,初步测定白叶枯病的抗性是由一对主效基因控制的。从不同亲本配组、正反交的结果看,子一代的抗性表现一般为显性或不完全显
起源普遍小麦的21个染色体都有两个臂,但单价体在减数分裂时发生错分裂,可以产生一个臂的染色体,称为端着丝点染色体(译者注:简称端体)也可以产生两臂相同的等臂染色体(译者
近些年,关于满意度的研究越来越得到学者和业界人士的重视,客户是企业的上帝,客户的满意度直接决定着企业的未来。在某种程度上,高等学校和学生也是一种生产者与消费者的关系,相比
近几十年来,在我国的很多地区很多领域内,特许经营模式被逐渐引入到基础设施的建设领域内。在众多的特许经营模式中,PPP(Public-Private-Partnerships)模式以其减轻政府财政压力、