论文部分内容阅读
Web应用分为前端和后端。对Web应用的前端进行优化能提高Web应用的性能以及提升用户体验。而对Web应用后端日志文件进行分析能够帮助开发人员和系统维护人员及时发现系统问题,辅助他们开展对系统后端的维护及优化工作。近几年针对Web应用前端CSS文件的自动分析优化研究以及针对Web应用后端的日志分析特别是对云环境下Hadoop日志分析的研究,逐渐成为Web应用优化领域的研究热点。本文在研究分析目前该领域几个具有代表性技术存在不足的基础上,提出了相应的改进方法,具体研究内容如下:第一,本文首先介绍了Web应用前端优化相关技术,然后研究了一种用于前端优化的自动分析CSS的方法-CILLA,研究发现该方法在分析带伪类选择器的CSS、带属性选择器的CSS、在页面元素属性内部声明的CSS以及动态生成的CSS时误报率较高。本文通过深入分析CILLA方法,找出了导致其误报率较高的原因,并提出了一种改进的方法,设计实现了用来处理带伪类以及属性选择器的CSS的PA(Pseudo class and Attribute)-Match算法以及用来提取在页面元素属性内部声明和动态生成的CSS的I(Inline)-Search算法,降低了分析误报率。本文接着使用改进前后的针对Web应用CSS优化的方法进行对比实验,实验结果表明改进后的方法比原来的方法能够平均降低20%的误报率,新方法能更好的对Web应用前端进行CSS优化处理。第二,本文还研究了云环境下Web应用后端Hadoop日志分析技术,介绍了目前比较流行的方法SALSA,分析并指出该方法中存在未对JobTracker Log进行分析、从日志中获取的信息量少以及将信息图形化展示时界面不友好等一些不足。本文基于SALSA技术提出使用关键Token从日志文件中提取出数据流(Data-Flow)和控制流(Control-Flow)信息的思想实现了一种改进的轻量级架构、用户界面良好的Hadoop日志分析系统-HLAS。该系统可用来帮助程序开发人员监控和分析云计算环境下Web应用后端运行状态,指导他们进行后端的优化及故障排查工作。实验表明,该系统能提供丰富的日志分析信息,能很好地指导程序开发人员开展优化工作,以及帮助其更容易的进行错误跟踪和故障排查工作。