论文部分内容阅读
随着互联网技术和计算机技术的发展,特别是第三代移动通信技术的应用和推广,人们的阅读习惯也发生了改变,大家迫切地希望能在任何时间地点场合通过无线网络使用移动设备方便地浏览web获取信息。校园中更是如此,拥有大量移动设备使用人群的学校里,这种无线上网的需要更是迫切。而移动设备有着很多PC机等完全不同的特点,使得原来的HTML网页无法在移动设备上良好地运作,这给移动网站的开发带来了机遇。基于以上问题,本文从分析校园网站移动现状开始,提出了基于新闻采集的校园新闻网站移动化的解决方案。本文主要研究和解决两个问题,一个是如何从现有学校新闻网站提取信息,存储到数据库中,另外一个则是如何把这些信息方便有效的展现在用户的移动设备上。本系统采用基于规则的方式来实现采集,通过http协议获得网页信息,然后通过DOM树利用系统和用户定制好的规则萃取页面的有效信息到服务器并储存在数据库。另外编写一个数据处理的模块处理采集回来的数据,该模块统一了访问控制,并通过json和web页面两种形式传给客户端原生应用程序及手机浏览器,其中web页面会根据客户端的不同而使用不同的页面模板。这两种形式可以满足不同客户对系统的不同要求。目前该系统已经作为移动校园的其中一部分应用到广东第二师范学院的移动应用中。本系统的主要特色在于:其一,使用采集方式获取旧网站系统数据,不同于其他的移动网站直接在旧系统上进行改造的开发方式,能更够快速广泛的与旧系统结合;其二,同时提供web app页面和原生应用系统使用的接口,更广泛的支持各种设备,也能够最大限度的满足部分客户对性能的要求;其三,系统采用中间件的形式,能够和旧系统分开部署,能够使得服务器部署更加灵活。