论文部分内容阅读
热门网络论坛信息更新极快,讨论热点转换迅速,在论坛快速更新的帖子中找到近期的热点,需要人为不停地刷新查看论坛。本文以百度贴吧为例,采用基于python的爬虫技术实时收集并分析出当前的贴吧热帖数据,按照一定时间内回复增量进行排序。最后采用Django框架构建一个热帖查看系统,解决人为查找热帖费时费力的问题。