论文部分内容阅读
随着网络技术的不断发展,传统的公告栏式的网站已经渐渐不适应当前时代的发展。用户参与的增加,网站流量的不断增大,使网站在日常运行中积累了大量的点击流,这些用户的点击和操作数据是极其宝贵的资源,但是很多网站却没有对这些数据加以利用。为了解决这个问题,越来越多的学者开始研究网站智能优化的问题,希望通过挖掘网络日志的方式,使越来越多的人能够获得个性化的服务,改善用户体验;同时也使网站能够进行针对性的营销活动,提高网站服务的效益,获得更好的经济效益。 本文结合Web的发展历程,论证了网站开发必需与智能技术相结合的道理,同时这个结合应该建立在网络日志挖掘的基础之上,好好利用这些珍贵的点击数据。本文在全面综合分析国内外关于智能网站的研究基础上,提出了智能网站的定义,并论述了经过网站智能优化之后的网站特点以及它与传统网站的不同。智能优化技术是对网站开发技术的极大改良,这主要表现在以下的一些功能上,例如:智能推荐引擎能够根据用户的使用情况推荐有用的信息给其他用户。网页信息自动抽取技术,能够根据用户来访情况,分析用户需求,进而丰富网站内容。智能预测技术,能够预测网站来客,分析出什么样的用户最可能成为网站的注册用户,从而对其进行重点关注。本文的特点是将高端复杂的算法原理,用简单易懂的例子来进行介绍,智能算法的功能和使用可以迅速用于实际开发中来。文章分析了如何对数据进行预处理,如何根据共同协作的方式来构建推荐引擎,介绍了编辑距离的计算,还有聚类技术在网页信息抽取中的应用,以及决策树算法在网站日志挖掘中的应用。通过各种算法的组合,网站设计者可以根据自身需求设计出属于自己的推荐系统、信息抽取系统、智能预测系统等等。本文不仅介绍重要算法和技术,在最后一章还通过一个网站的实际开发例子来介绍网站智能优化技术的实际应用。垃圾信息一直给交互性网站带来的巨大困扰,本文针对这一问题,应用基于网络日志的智能技术很好的给出了解决方案,运用贝叶斯分类技术过滤掉了广告用户,并且给出了实际代码,这些代码可以很好的应用在针对中文的垃圾信息识别中来。最后,文章进行了总结和对今后工作的展望。