多源信息融合软件的设计与实现

来源 :无线互联科技 | 被引量 : 0次 | 上传用户:geng20516136
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:针对多源信息类型不一致影响信息利用效率的问题,文章在分析传统多源数据融合模型的基础上,研究了多源信息融合软件的架构及相关技术,设计并开发的软件具有较高的实用价值。
  关键词:多源信息;信息融合;软件开发
  多源信息融合是通过将多种信源在空间上和时间上的互补与冗余信息依据某种优化准则组合起来,产生对特点对象的一致性解释与描述。数据融合技术是指利用计算机对获得的信息,在一定准则下加以自动分析、综合,以完成所需决策和评估任务而进行的信息处理技术。主要包括对各类信息源给出有用信息的采集、传输、综合、过滤、相关及合成,以便辅助人们进行态势/环境判定、规划、探测、验证。
  数据格式统一是进行数据处理的前提。由于信息的来源多,数据格式类别差异较大,对于数据处理带来不便。多源信息融合软件能够实现多源异构数据信息整合,对于充分利用信息资源、提高数据处理系统性能具有实用价值。
  1 多源数据融合模型
  根据对输入信息的抽象或融合输出结果的不同,可以将信息融合分为不同的3级,包括数据级融合、特征级融合及决策级融合。
  作为数据级的多源数据融合模型的结构如图1所示。多源数据经过数据清理、数据集成、数据变换,形成有效数据,通过数据处理形成数据挖掘分析等处理工作的有效数据。
  数据清理是指去除源数据集中的噪声数据和无关数据,处理遗留数据和清洗脏数据,去除数据域的知识背景上的白噪声,考虑时间顺序和数据变化等。主要包括处理噪声数据,处理空值,纠正不一致数据等。
  数据集成就是将多文件或多数据库运行环境中的异构数据进行合并处理,将多个数据源中的数据结合起来存放在一个一致的数据存储中。
  数据变换就是将数据变换成统一的适合处理的形式。数据变换主要包括平滑、聚集、属性构造、数据泛化和规范化等内容。
  2 多源信息融合软件设计
  2.1 软件架构
  多源信息融合软件的技术要求是实现多源异构数据向指定关系数据库进行可靠转换。就是按照指定关系数据库的表结构要求,实现多源异构数据的数据导入及格式转换问题。软件的组成框图如图2所示。软件主要包括2个主要模块,多源数据预处理模块和数据导入模块。数据预处理模块主要进行数据清理及格式转换,实现常用的数据(txt、xls、关系数据库等数据)转换为目标数据库支持的数据格式。数据导入实现指定类型数据转换为指定结构数据。




  2.2 关键技术
  为了保证多源信息软件的可靠运行,需解决数据类型的适应性和扩展性问题,以及数据转换的可靠性、可预制性、数据转换过程的可监督性问题。
  2.2.1 基于模块化设计的类型转换
  模块化设计是指在对一定范围内的不同功能或相同功能不同性能、不同规格的产品进行功能分析的基础上,划分并设计出一系列功能模块,通过模块的选择和组合可以构成不同的产品,以满足市场的不同需求的设计方法。
  虽然目前主流数据库管理系统都支持数据转换功能,但数据库管理系统支持的数据类型有限,对于新增类型数据,只能通过升级或更换数据库解决。即使对于支持类型的数据,有些情况不能实现正确转换,例如文本文件只能识别典型分隔符(制表符、空格等),不具有按指定分隔符实现转换功能。存在数据库版本问题,高版本数据不能直接转换低版本数据库数据。使用数据库系统的数据转换功能需有管理员权限,但为了保证数据库管理系统安全,不便于开放管理员权限,影响数据转换。
  模块化设计思想在类型转换中的运用就是通过建立统一的类型转换输入接口,对于新增类型数据的转换问题,只要将新增类型转换模块按照标准格式定义接口,就能实现新增模块的可靠增加,减少系统二次开发成本,有效提高系统的适应性及扩展性。
  2.2.2 多线程编程技术
  多线程机制是指在单个程序中同时运行多个线程完成不同的工作,每个线程与其他线程并发执行。多线程适合执行占用大量时间的操作,执行区分不同优先级的任务,能够满足用户界面在将时间分配给后台任务时仍能快速做出响应的需求。
  由于需转换的数据量较大,使得数据转换时间较长,如数据不一致或不完整等问题将出现转换中断或数据遗漏等情况,所以及时了解转换进度以及实现异常快速响应对于保证有效转换具有重要意义。
  软件采用多线程技术解决数据处理进度、过程可见性以及及时进行异常处理等问题。软件通过实时显示转换进度及转换状态,有利于实现转换进度和状态的有效监督。对于数据转换异常,能够及时终止转换进程或者调整转换策略,保证数据转换的有效性。
  2.2.3 基于任务的数据导入
  数据预处理获得的数据还需转换为数据处理所需格式的数据,即将转换的源数据可靠导入到指定格式的目的数据表。数据的可靠导入不只是在系统正常运行时保证大量数据的导入,更主要是保证在人为终止、系统故障等情况引起异常的情况下,有效实现断点续导。
  基于任务管理的数据导入的思想是将数据导入分成导入任务创建、导入任务管理、导入进度监督、导入异常处理4个部分。其中导入任务创建就是确定源数据表导入字段与目的数据表相关字段的对应关系;导入任务管理就是实现任务名称,对应关系等任务相关数据源信息管理;导入进度监督就是展示导入任务的完成情况,即通过已导入的数据量与源数据总记录数量的比较,确定任务完成情况,有利于指导后期导入工作;导入异常处理就是根据导入任务异常结束情况,进行无效信息处理,保证有效进行可靠导入。基于任务管理的数据导入,保证了数据导入的完整性和可靠性。   3 软件性能及主要界面
  多源信息融合软件能够实现如下功能:(1)实现多源异构数据向指定数据库的数据导入,有效地实现数据集成。(2)实现数据清理及有效信息提取。(3)实现断点续导,提高数据导入的可靠性。(4)方便新增类型数据转换模块添加,提高系统扩展性。
  系统的主要工作界面如图3-5所示。
  通过设置文本文件的分隔符,实现文本信息的有效分割,方便文本数据向数据库格式转换(见图3)。


  利用多线程技术,实时观察及控制数据导入和转换进度,保证可靠运行(见图4)。


  任务管理由于确定导入关系,保证导入进程可靠有序实施(见图5)。


  4 结语
  未经处理的多源异构信息,严重影响数据利用效率。多源信息融合软件运用数据融合思想并结合实际需求,有效解决处理信息途径庞杂、资源分散、数据处理效率不高的问题,对于提升数据处理能力具有一定的应用价值。
  [参考文献]
  [1]韩崇昭,朱洪艳,段战胜.多源信息融合[M].北京:清华大学出版社,2006.
  [2]何友,薛培信,王国宏.一种新的信息融合功能模型[J].海军航空工程学院学报,2008(3):241-244.
  [3]纪希禹.数据挖掘技术应用实例[M].北京:机械工业出版社,2009.
  Design and Implementation of Multi-source Information Integration Software
  Zhang Yunfeng, Lu Canju, Li Chao
  (Electronic Engineering Institute, Hefei 230037, China)
  Abstract: Multi-source information is almost incoherence. This problem affects information utilization. Based on the analysis of multisource information fusion model, information integration software is designed and developed. The software has certain practical value.
  Key words: multi-source information; information integration; software development
其他文献
患者女,25岁,体重62kg,ASAⅡ级,足月妊娠,先兆子痫,宫颈水肿,胎膜早破,急诊入院,拟在硬膜外麻醉下行子宫下段剖腹产手术。入手术室前,T38.1℃.BP185/130mmHg。胎心148次/min,静滴25%MgSO4。术
稀土发光材料主要应用稀土发光材料是指利用稀土元素独特的电子层结构、采用不同激发方式而使其发光的稀土功能材料,俗称稀土荧光粉。
目的:探讨胆胃胶囊对大鼠胆汁反流性胃炎癌基因蛋白表达的调控作用。方法:先将大鼠造成胆汁反流性胃炎模型,再分为胆胃胶囊大、中、小剂量组,对照组使用药物达喜,并用免疫组化法检
化学危险品是指具有易燃、易爆、腐蚀、毒害、放射性等危险性质,并在一定条件下能引起燃烧、爆炸和导致人体灼伤、死亡等事故的化学品及放射性物品。化学危险品在生产、使用
运用热平衡积分法(HBIM)和改进的热平衡积分法(RIM)求解了一维两相融化问题,根据精确解比较了2种方法所得融化参数的相对误差,结果表明:在固定温度边界条件下选取二次函数近似时,热
2012年4月22日,夜。成都的夜以热辣香浓的火锅香气迎接了我们全体人员的到来,热热闹闹熙来攘往的场景让我们彼此不再陌生,今后半个月的时间里我们就是彼此照应的一个大家庭了,干
摘要:刀具半径补偿作为数控加工工艺中的一种特殊技术,在实际生产应用中具有重要的意义。在数控加工过程中,根据工件轮廓轨迹以及刀具的半径值能够合理地计算出刀具的运动轨迹路线,大大简便了数控程序的编写。文章介绍了刀具半径补偿的概念、方法和过程等内容。引入刀具半径补偿后,就可以忽略掉不同刀具加工的实际半径差异,用相同的程序加工工件,既简化了程序,又节省了生产时间,提高了加工效率。  关键词:数控加工;刀具
目的:观察40例鼻腔鼻窦内翻乳头状瘤的手术治疗效果。方法:两组患者共40例分别采用传统术式和鼻内镜下手术操作。结果:经x^2检验,传统术式复发率高(P〈0.05),鼻内镜下手术操作损伤较
计算机网络已经是我们生活中的一部分,网络安全越来越受到关注。在互联网的时代,我们基本上办任何事情,都要通过网络。因此不管是个人信息、企业信息还是国家信息都存在安全
从厦门海关获悉,2011年1~10月,厦门海关共出口稀土及稀土制品86.5吨,同比增长8倍;价值1122万美元,增长21倍。其中,出口日本60吨,增长16倍,占同期该关区出口总额的69.4%;出口东盟14.3吨,去年