基于Scrapy和Kettle的对标城市政策文件库建设

来源 :电子技术与软件工程 | 被引量 : 0次 | 上传用户:ah20090907
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文设计开发了一套政策文件采集、整理、检索系统。采用Scrapy框架实现对众多异构政府网站的信息采集及增量抽取、异常处理、日志记录、多任务等操作。基于Kettle对政策文件数据进行关键信息补充、去重、信息整合等数据清洗操作。数据应用提供了多维度的信息查询及检索服务。通过对17个政府网站政策文件的采集、整理入库,为政策对比研究、对标城市政策监测提供了有力工具。
其他文献
提出了一种计算多相合金电导率的数值模拟方法,采用有限元技术模拟电流流过导体时具有分布特征的电流场,各单元的组分随机产生以模拟实际的合金,通过计算全部单元中的总损耗
1案例某女,32岁,某酒店员工,单身,住单位宿舍.某日上午未上班,同事见其房门反锁,呼之不应,遂撞开房门,发现其已死亡.现场情况:单间宿舍,摆设较整齐,窗户关闭,门锁已撞坏.尸体
笔者根据自身的工作,对外墙外保温工程火灾的成因以及防护措施进行了具体的分析和探讨,为相关部门的防火工作提供了参考。