【摘 要】
:
近年来,我国经济持续快速发展,经济决策对一个城市甚至国家的发展起到了至关重要的作用。而随着海量数据时代的到来,关键性的经济信息以数据化的形式存储、传播,合理利用数据分析技术能够简化信息提取步骤,促进对当前经济格局的全面了解,提高预测经济发展趋势的准确性,从而进行良好的经济决策。由于经济发展的多样化及海量数据的不断产生,目前现有的经济分析平台面临以下三点挑战:数据量增长速度过快,且互联网中充斥着大量
论文部分内容阅读
近年来,我国经济持续快速发展,经济决策对一个城市甚至国家的发展起到了至关重要的作用。而随着海量数据时代的到来,关键性的经济信息以数据化的形式存储、传播,合理利用数据分析技术能够简化信息提取步骤,促进对当前经济格局的全面了解,提高预测经济发展趋势的准确性,从而进行良好的经济决策。由于经济发展的多样化及海量数据的不断产生,目前现有的经济分析平台面临以下三点挑战:数据量增长速度过快,且互联网中充斥着大量无用或虚假的数据,较大地影响了工作效率及生活质量;用户的消费需求与数据分析技术具有互相促进的闭环关系,更加复杂、多变的消费需求提高了对分析技术及平台的功能要求;数据之间存在日益复杂的关联关系,错误的分析结果可能会造成信息误导,甚至导致巨大的经济损失。当前全国正在进行经济结构的深入调整,供给侧结构性改革,在海量数据环境下开展的城市经济统计调查可以为改革提供全方位的信息支持,进而保证城市快速适应经济发展中由于改革带来的新变化。因此,根据当前国内经济形势及现有经济分析平台面临的挑战,如何合理利用数据分析及相关技术提供一个完善的信息管理、研判平台是至关重要的问题。针对上述内容,本文在对某经济研究所的项目需求进行充分调研的基础上,设计开发了城市经济统计数据智能分析平台。平台采用Spring框架,同时使用网络爬虫技术对新闻进行采集,利用Open CV以及Tesseract-OCR技术对图片进行识别,从图片中提取经济指标的具体数据。本文主要工作内容为:需求分析,对平台中涉及的用户角色进行分析分类,详细描述平台的关键流程,利用用例图及数据流图对平台进行建模,说明管理员、普通用户与平台的交互流程,同时结合平台的具体使用场景分析所需的非功能性需求;设计与实现,将平台划分为新闻采集、数据采集及信息管理三个主要模块,利用流程图、类图、时序图对三个模块的设计与实现进行了详细描述,利用Web Magic技术从网站中提取经济类新闻,Jieba分词技术对新闻进行分词,结合词语在文中的位置,提取文章关键词,对经济类新闻进行筛选过滤,根据用户的浏览记录为用户推荐定制化新闻。利用Open CV对图片进行预处理操作,结合Tesseract-OCR技术从图片中提取经济指标的具体数据;平台测试,完成具体设计及编码实现后,根据功能性及非功能性需求编写测试用例,并在实际环境中进行测试,在满足非功能性需求的情况下,保证平台的功能的完整性。该平台在测试通过后投入生产环境中运行,从运行结果来看,城市经济统计数据智能分析平台达到了预期效果,大大节省了经济研究所人员进行数据采集、分析的时间,同时为用户定制化推荐经济类新闻,辅助经济研究所人员做出正确的经济决策。
其他文献
人口的增长以及工业的迅猛发展,淡水资源日益枯竭,开发可持续的淡水资源日渐重要,膜分离技术已经被广泛应用在淡水资源的开发。鉴于分离膜的本征结构特点以及材料的化学性质,
管理会计是基于价值创造的管理活动,是银行精细化管理的重要工具。近年来,各大银行陆续开始对管理会计应用进行探索与研究。国有商业银行率先成立了专门部门来研究管理会计系
在改革开放后至今40年间,随着改革的深入,全国经济实现高速增长,而包括了上海市、江苏省、浙江省、安徽省的长三角地区增速尤为突出,增长率始终保持全国领先,逐渐成为了我国核心经济圈。2011年以后,我国为实现经济转型,向创新型经济发展,经济增长速度有所减缓,长三角地区也不例外。新的转型期内,找到持续健康的增长方式刻不容缓。本文将总结与人力资本相关的理论概念,以及学者们关于人力资本的研究成果,接着根据选
近年来,随着世界各国对于海洋权益的竞争愈加激烈,海洋的战略地位日益凸显。水声成像技术,作为海洋探测技术的重中之重,其发展需求显得日益迫切。然而,传统水声成像技术存在着设备成本较高、探测效率低下等一系列不足,尤其在部分领域(如军事目标探测、水下搜救等领域)不能满足实际作业的需求。针对这一现状,本文创造性地提出了一种利用无指向性的脉冲声源作为发射声源的水声成像方案。利用脉冲声源本身具有的高能量,低成本
《诗经》是诗歌艺术的典范,也是中国民族文化精神的渊薮。作为“诗”,她是先民心灵的传递,是上古文化诗歌艺术的升华。作为“经”,她是礼乐文化的传承,肩负着构建精神家园的
无产阶级革命的战略策略思想是科学社会主义理论的重要内容,马克思恩格斯一生都非常关注这个问题。在无产阶级革命的战略思想方面,马克思恩格斯历来强调无产阶级的最终目标是
渤海湾盆地黄骅坳陷石炭-二叠系具有丰富的油气资源,是重要的潜山油气增储领域。在渤海湾盆地区域构造背景及石炭-二叠系沉积特征与演化过程的基础上,探究构造演化对煤系烃源岩生烃规律、优质储层发育、潜山圈闭形成等潜山油气成藏条件的控制作用是潜山油气成藏研究的重点,对油气增储上产具有一定的实际意义。本文以黄骅坳陷上古生界潜山为研究对象,基于野外露头及井震资料,整理并总结前人研究成果,探究构造演化对石炭-二叠
人体姿态估计作为处理人类活动的关键步骤,其主要内容是让计算机从图像或视频中定位出人物的关节点。人体姿态估计可分为传统的图模型方法和基于深度学习的方法。图模型方法过于依赖先验知识,难以应付复杂的姿态变换;基于深度学习的方法不依赖模型先验知识,并能取得更好的效果。人体姿态估计按维度可分为二维和三维两种,因为使用二维姿态估计进行推理可以得到三维估计,所以二维姿态估计有着重要的研究价值。现有的一些基于深度
复杂构造区的重力密度界面反演一直是地球物理反演问题的重要部分,密度界面的起伏对研究区域地质构造的分布以及构造运动有重要意义。复杂构造区地质情况复杂,地下密度横纵向分布不均匀,不适合用常密度反演法去进行反演,经典的频率域密度反演法通过改变密度函数可以在纵向上实现变密度反演,但在横向上不能根据空间上不同构造的分布情况进行变密度反演。针对这种情况,本文研究了可以兼顾横向和纵向密度变化的空间域三次多项式变
转向架是高速动车组的不可缺少的大型零件,转向架的生产也是整个高铁列车制造的关键环节。加工中心根据转向架类型自动选择不同加工程序,为避免引发安全事故,必须在加工前对转向架进行识别。目前,转向架识别主要依靠人工识别和射频识别,人工识别不利于自动化生产,射频识别准确率低。近年来,机器视觉技术飞速发展,使用机器视觉技术进行转向架识别,不仅可以减少人工干预实现自动化生产,提高识别效率和准确率,还能提高车间的