论文部分内容阅读
本文阐述了一种爬取指定CSDN账号的所有博文进行内容提并批量合并成PDF的方法,对该方法给出了Python语言的实现方式。实验结果证明,该方法具有可操作性和实用性。引言:在实际工作中常常需要对感兴趣的CSDN博文保存成电子书,从而可以达到多设备、无网络的情况下进行阅读。本文介绍了如何使用Chrome浏览器和Python语言将目标博客内容爬取后进行信息提取,然后合并成PDF格式的方法。除Python自带的标准库外,所用到的Python库为BeautifulSoup、pdfkit、PyPDF2。本文一个主要成