基于Internet的智能信息挖掘系统建模及关键技术研究

来源 :西北工业大学 | 被引量 : 0次 | 上传用户:tta86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决互联网应用水平低,制造领域企业基于数据仓库的决策支持系统数据来源缺乏问题,在研究了互联网智能搜索、互联网信息提取、数据仓库、基于数据仓库的分析挖掘、分布式组件等技术的基础上,提出以互联网为数据来源,建立基于数据仓库应用的面向制造领域企业的知识挖掘和决策分析支持系统。确定了以面向主题的聚焦搜索器从互联网搜索与主题相关的网页文档,由分类提取器(Wrapper)从搜索结果中提取主题相关信息保存到本地数据库系统,基于数据仓库的消费系统从本地数据库中装载信息并进行优化存储,最终通过查询、报表、联机分析处理、数据挖掘等形式展现数据中知识的系统设计思想。 论文主要内容包括: 系统的功能模型和结构模型研究,提出了系统的总体功能模型和相应的功能模块划分;提出了系统的基于分布式组件框架的总体结构模型和各模块的结构模型。 对其中的关键技术、方法和算法的研究。着重分析了面向主题的互联网聚焦搜索、网页信息提取、基于ODS的数据仓库体系、“四库一体”的智能决策支持系统等技术及其实现的方法和算法。 以成都飞机公司企业内部数据为基础设计开发了一个数据仓库应用实例—综合信息获取系统,具体实施验证了所研究系统中数据仓库及“四库一体”决策系统模型。 本系统能够填补基于Internet的深度挖掘应用空白,为企业开发基于Internet的应用开辟新的领域,为企业信息集成提供新的方案。系统模型可扩展应用到金融、证券、电信、政府、能源、交通、零售、银行、医疗、教育等领域,并将为互联网信息应用,基于互联网进行决策来加快发展提供参考。 通过理论研究和实践验证,系统具有一定的可行性,但由于互联网网页文档本身的复杂性,使得从互联网自动提取信息比较困难,不过随着互联网信息表示技术的发展,下一代互联网环境下信息提取问题会得到很好解决。
其他文献
该文在论证中认为,工程教育认证是国际通行的工程教育质量保证制度,是针对高等教育本科工程类专业开展的一种合格评价。在工程教育专业认证的背景下,通过电气系统稳态分析及
针对新一代非嵌入式系统及嵌入式系统对数据通信传输能力需求的进一步提高,高速串行总线技术应时而生,高速串行总线中应用最为广泛的三种为以太网总线、PCIe总线及RapidIO总
本文通过对我国投资银行在后金融危机时期的宏观经济环境、证券市场环境以及监管环境的分析,找出我国投资银行在新阶段的发展趋势,以期为我匡投资银行的发展提供指导。
在科学技术快速发展的背景下,人工智能技术也获得了新的机遇,发展得越来越强大。因此,如何在电气自动化控制中合理运用人工智能技术受到了社会各界人士的重视。人工智能技术
本文在煤矿区可持续发展分析的基础上,从“社会——经济——自然”复合生态系统的视角,运用定性与定量研究相结合的方法,对煤矿区可持续发展的评价进行了研究,并就神经网络方法在
胶原、明胶具有优良的理化特性,已成为重要的生物工程材料,主要用于药物载体和组织工程领域。本课题通过系统研究胶原、明胶与稀土元素铈的反应,制备出具有抑菌功能的新型生
城市化发展带来现代文明生活的同时也不同程度造成空气污染,不仅城市发展对空气质量产生影响,天气气候在城市大气污染中也起着一定的主导作用[4]。目前大都是分别研究城市发
随着计算机和互联网技术的飞速发展,情报工作也变得越来越重要,如何进行更精确、更有效的情报服务,就需要对情报服务进行相应的研究。文章以事实型数据为基石,以浙江省示范院
针对大型场馆等楼宇自动化控制的需求,结合MCU系列芯片的优势,提出一种用于大型场馆的楼宇自动化控制系统。根据大型场馆建筑复杂的特点,提出采用分布式控制方法,以RS485总线
表外业务在发达国家的商业银行中已有几十年的发展历史,较为成熟。但在中国的商业银行中才刚刚起步,发展相对滞后。现有的文献中,对表外业务的理解有广义和狭义之分,本文的研究对