论文部分内容阅读
随着数据挖掘在银行中的推广应用,大量、多样的数据作为数据挖掘的基石变得愈发重要,它能产生更大的价值,并为业务部门的决策提供强有力的支持。中国邮政储蓄银行江苏省分行基于Selenium开发了一套定向网络爬虫,通过定义的流程自动化地采集指定网页的数据,并利用Tesseract-OCR对简单的验证码进行识别。