类纸阅读器在线读物系统设计与实现研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:hxr906646527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的快速发展,随时随地进行网络在线阅读已经成为现实。特别是以起点中文为首的在线读物网站为阅读爱好者提供了数以百万计的网络原创文学读物,丰富了文学爱好者的阅读需求。而类纸阅读器凭借其无闪烁、无辐射、阅读不耗电等特性,成为手持阅读器中的一个主要分支。但是,拥有移动互联网接入功能的类纸阅读器,在网络原创文学读物阅读功能的支持上,存在排版与网络延时的问题,使得读者难以使用类纸阅读器进行阅读。   本文研究并实现类纸阅读器的在线读物系统,通过基于启发式规则的Web信息抽取技术实现对在线读物网页的重新排版,通过基于用户阅读历史的动态网络预取算法实现对网络数据的预取,完成对原创文学读物阅读功能的有效支持,使用户获得与本地阅读相同的阅读体验。   针对在线读物网站的特点,本文提出了基于启发式规则的抽取算法,根据网页的区域化特征以及动态技术网页衔接的相似性特征,应用区域抽取和停用词抽取的方法,将得到的目标数据块进行分层次抽取,获得带有附加意义的结构化数据。   针对无线网络的不稳定性的问题,本文提出了动态预取算法,能有效地避免由于网络固有延时给用户带来的阅读等待。通过网络预取,可以使用户在连网时获得缓冲阅读的功能;通过网络缓存,可以使用户在断网时获得离线阅读功能。   通过在某款类纸阅读器上的实验验证,表明本文所提出的在线读物系统具有较高实用价值。
其他文献
嵌入式系统的功耗随着芯片密度、性能要求的大幅增加呈指数增长,以电池供电的便携式设备的能耗问题尤为突出,随之而来的芯片散热成本增加、芯片稳定性下降等问题严重制约了嵌
随着企业信息化进程的推进和技术的不断革新,激烈的竞争和日益复杂多变的市场环境,让企业面临的不确定因素急剧增加,向企业的生存和发展提出了严峻的挑战。企业是一个复杂的系统
语音识别和人工神经网络模型长期以来都是学术界研究的重点,前者是方便计算机和人类交互的一种手段;后者使用数学方法对于人脑工作机制进行抽象和建模。本文将二者结合,使用人工
二十一世纪,网上购物已经成为人们主要的购物方式。随着互联网用户井喷式的增长趋势,电子商务网站每天不得不面临巨大的访问量。面对海量数据存储以及高并发读写,关系型数据
物联网是未来网络发展的方向,它的核心就是现在的互联网。无线传感器网络是一种低功耗低速率的短距离无线网络通信技术,也是物联网的重要组成部分之一,因此解决无线传感器网络与
随着国内金融市场的不断发展和完善,信用卡业务的增长为银行带来大量利润,信用卡客户的分析和研究也受到更多的重视。目前我国对客户价值的评价系统还比较简单,方法还比较单一,如
近年来,随着互联网+时代的来临,以及智能手机的普及,移动互联网越来越参与并辅助人们的生活。同时社会正面临严重的人口老龄化问题,日益增多的空巢老人数量,带来一系列的社会
随着经济发展,信息不对称、大量信息孤岛存在、客户数据无法统一等问题,增加了高科技企业信息管理工作的动态性和复杂性。本文从当前搜索引擎发展的背景和趋势出发,利用Microsof
传统的双语词汇词典,一般由人工整理、编辑,具有权威度高、词条质量高的特点,但是其编制需要花费大量的人力、物力和时间。与此同时,随着互联网的发展和社会的发展,各种各样
由通用机器组成的大规模集群作为并行计算的有效途径之一,广泛应用于科学及工程中的计算模拟、海量数据处理等复杂问题中。并行编程模型是并行计算及开发并行软件的基础,是决定