聚合阅读应用的设计与实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:coldcoffee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在科技经济高速发展的数字时代,人们的工作生活已经离不开各种各样的信息。及时有效的信息不仅能帮助人们提高知识技能,还能帮助他们解决生活工作的问题。为获取信息,人们每天浏览大量的网站,阅读感兴趣的文章所花费的时间仅次于花在社交网络的时间。聚合阅读应用创建的初衷就是让人们高效方便及时地阅读他们感兴趣的信息。聚合阅读应用自动收集各大网站的信息,通过提取和分析,按照用户的阅读偏好和设置,把热门信息和用户感兴趣的信息推送给用户。聚合阅读应用(并非基于RSS协议的阅读器)强大的“整合”能力和优秀的阅读体验,不仅提高用户的阅读效率,还提高用户的阅读质量。聚合阅读应用虽然是一个新概念,但是聚合阅读应用有着广泛的市场,而且涉及的技术也用在相关的阅读应用中。然而目前并没有系统性的论文和文章讨论聚合阅读应用的实现,而聚合阅读应用所涉及到大量的算法和技术是普通互联网应用很少涉及的。本文较全面地阐述了聚合阅读应用的所涉及的主要算法,并且说明这些算法在应用中的作用和影响。在这些算法的基础上,本文提出了聚合阅读应用的设计与实现方案。应用主要包括3个模块——爬虫模块、分析模块和应用模块。针对爬虫模块,本文介绍聚合阅读应用的爬虫如何在算法上优化更新效率,设计和实现单机可扩展的高性能定向爬虫,理论上完全能满足聚合阅读应用的负载。针对分析模块,本文介绍了有效的网页信息提取算法和初步的个性化推荐算法,并且设计了完整的提取和分析架构,实现了主要算法。针对应用模块,本文介绍了兼容多个客户端平台的MVVM模式,并且基于Nodejs的Express框架设计了MVVM模式的应用模块架构。针对应用的数据存储基于NOSQL的Key-Value数据库解决方案,本文也为这种数据库设计了合适的数据结构。本文设计的各模块可以单独用于不同的场景,也可以整体上稍作修改以适合不同类型的阅读应用。
其他文献
新课程改革强调引导学生建立解决复杂问题的思维框架,并通过适当的方式外显学生的思维过程。优质的问题能够激活思维,而将一个个独立的问题相互连接,构成一条符合学生认知发展规律的问题链,能够促进学生进行深层次的学习。然而,当前问题链设计仍存在一些不足之处,例如问题之间缺乏逻辑性,且不能有效激发学生的认知冲突和深层次思考。SOLO分类理论是一种质性评价方法,在教学实践中运用该理论,可外显学生的思维过程,有利
随着移动智能终端的普及、无线通信网络的发展,移动商务在人们的生活、工作、学习中发挥着越来越重要的作用。然而,移动商务在给人们的生活带来便利的同时,也面临多种安全威
近两年来,计算机多媒体领域发展迅速,从3D电影的流行到虚拟现实(VR)的火爆,无一不表明了人们在蓬勃发展的大娱乐时代对于视觉感官享受的不断追求。立体视频通过同时向人的左
视频分割是指依据视频的低级或高级特征进行分析,并按照一定的分割准则提取出视频中的感兴趣区域。随着互联网技术的发展,计算机视觉相关的技术得到了极速的发展,而视频分割
电力工业是国家在能源领域的重大基础性行业,更是国民经济的命脉。随着我国经济的不断发展,我国电力建设也不断加强。然而在电网的不断发展与建设过程中,电力系统负荷的变化
为了实现“两个一百年”奋斗目标,长江经济带发展作为三大战略之一,其战略地位和重要性不可或缺,其发展前景至关重要。与此同时,生态环境的压力也逐步加重,为了长远利益考虑,我们不能为了发展经济水平而彻底牺牲我们的美好家园,习近平总书记指出长江经济带的开发要科学、绿色、可持续发展。本文根据长江经济带可持续发展立意,(1)阐述了长江流域的生态环境状况和各城市圈的发展情况,不同城市圈发展差别较大;环境方面结果
背景:肿瘤细胞“干性”的获得在许多类型的肿瘤中均被证实参与了包括鼻咽癌在内的多种肿瘤的侵袭和转移过程,目前研究表明,肿瘤细胞“干性”的获得与上皮-间质转化有密切关系
课程文化的建构,是对当下学校课程发展的深层次的思考。课程文化作为一种特殊的文化,是对文化选择、整理和提炼而形成的一种课程观念和课程活动形态。建构基于中国传统文化教育的学校课程文化,是学校实施传统文化教育的重要途径。通过学校课程文化的建构,培育学生对民族文化的认同感,培养学生对中国传统文化的自觉意识,提升文化自信,由此发挥中华优秀传统文化与课程间的积极作用。本研究以W小学为个案,通过课堂观察、教师访
污水再生利用是解决水资源短缺问题的有效对策,纳滤技术是生产高品质再生水的重要方法之一。然而,膜污染现象限制了纳滤工艺的广泛应用。针对已有研究对实际纳滤膜污染的动态
移动互联网的兴起推动了多核嵌入式系统的快速发展,应用程序对多核嵌入式系统的性能和续航要求越来越高。传统的静态随机访问存储器,因其集成密度低、功耗泄漏大等问题,限制