【摘 要】
:
数据仓库在数据综合、归类并进行分析上具有很好的处理能力。因此,用数据仓库集成元器件生命周期中的质量数据可以为元器件选型提供支持。但是建立元器件全生命周期质量数据仓库存在以下问题:一、对数据的统一表示困难。由于元器件的生命周期中存在很多部门,分散的数据组成要素不全,缺乏统一的数据表示模型,多源数据之间无法进行数据传递和交换。二、对实例数据的转化困难。由于各个部门的数据具有语义异构、海量的特点,所以转
论文部分内容阅读
数据仓库在数据综合、归类并进行分析上具有很好的处理能力。因此,用数据仓库集成元器件生命周期中的质量数据可以为元器件选型提供支持。但是建立元器件全生命周期质量数据仓库存在以下问题:一、对数据的统一表示困难。由于元器件的生命周期中存在很多部门,分散的数据组成要素不全,缺乏统一的数据表示模型,多源数据之间无法进行数据传递和交换。二、对实例数据的转化困难。由于各个部门的数据具有语义异构、海量的特点,所以转化到数据表示模型之前需要采用语义技术进行消歧,同时针对海量数据需要采用高效率的转化方法。针对上述问题,本文提出了基于语义的数据仓库构建方法。本方法旨在通过语义技术构建数据元模型,将各部门的元器件数据进行统一表示。然后结合语义技术将元器件全生命周期的实例数据高效地抽取、清洗、加载到数据仓库中。在进行设计选型时,为设计师提供可靠的元器件相关质量信息,通过参数匹配、智能分析等,动态地提供设计师所需的元器件,从而避免选型中可能存在的质量风险。本文的主要研究工作包括:一、基于语义的数据仓库构建方法框架研究本文提出了基于语义的数据仓库构建方法框架,该方法框架包括数据元模型构建模块、数据仓库构建模块和应用模块。分别实现了数据仓库建模,数据仓库实例数据导入和元器件选型推荐应用。二、面向元器件全生命周期的数据元模型构建本文提出了构建面向元器件全生命周期的数据元模型,从概念层面消除了元器件部门数据表示的语义异构,解决了数据的统一表示困难问题。首先从元器件全生命周期的业务表单中抽取出业务概念及关系,经过语义融合,得到元数据,然后进行基于元数据的数据仓库维度建模,形成数据仓库元模型。三、基于语义的数据仓库构建本文对数据抽取、清洗与转换、加载和元模型更新进行了研究。本文的主要工作包括两方面:一方面,解决了数据语义异构问题。采用基于同义词字典+规则的数据清洗与转换方法,从实例层面解决了数据语义异构等质量问题。采用基于子节点匹配的数据仓库元模型概念更新方法,通过更新数据仓库元模型,解决数据仓库在数据源变更时产生的概念层面的语义异构问题。另一方面,解决了海量数据转化到数据仓库中的效率问题。采用基于时间戳和日志的增量式抽取方法,解决了数据仓库在海量数据抽取时的效率问题。采用面向实时查询的数据仓库加载方法,解决了数据仓库在海量数据加载时速度慢和实时查询的效率低的问题。最后,基于星环大数据平台构建元器件质量数据仓库,通过元器件选型推荐应用验证,阐明了本文方法的有效性。
其他文献
本文为中国作家陈苍《地下三尺》第一章节的中译英翻译及该翻译分析。笔者翻译特定文化项目时将异化和归化理论应用于实践并提出熟悉性原则,作为一种解决不均衡和找到两者之间平衡的方法。结合中国文化的“走出去”和翻译的全球化趋势,进行了翻译分析。希望通过上述方法的适应,中国文化能够在西方得到进一步的弘扬。
随着大数据、物联网等平台的兴起,人们对于信息存储分析的需求井喷式增长,研发低功耗、低成本、高密度、高速的存储器迫在眉睫。阻变存储器因具有器件结构简单,存储读取速度快,尺寸小,功耗低,可三维集成等优势,是新型存储器的代表之一。本论文采用Ta2O5基阻变存储器进行研究。在传统的导电机制中,人们更多的关注点在Ta/Ta2O5界面。Ta/Ta2O5界面处因电激励产生的氧空位是导电细丝的主要组成。但在本论文
随着互联网和自媒体的发展,在线新闻的规模与传播范围得到了极大的扩展。面对海量的在线新闻文本,如何根据其描述的内容对其进行划分和聚集,以实现新闻事件识别,是一个值得研究的问题。这一技术不仅有利于各种组织机构及时、准确地发现新闻事件,而且是把握热点舆情、分析开源情报等自然语言处理任务的基础步骤。从技术层面看,部分现有的新闻事件识别算法仅考虑了语料的统计特征,却忽略了实体信息、同义词、一词多义等语义知识
目的探索酶催化合成方法,制备兼具抗菌和再矿化作用的银掺杂的磷酸钙材料新体系,并研究其在早期龋的防治中的效果及存在的作用机制,为安全有效的多功能磷酸钙类新型生物材料的构建及其在早期龋防治方面的进一步应用研究提供新方向和实验基础。方法以磷酸钙为主体材料,通过酶催化反应和抗菌金属离子掺杂结合的制备新策略,合成出具有银掺杂的无定形相纳米结构磷酸钙。首先,通过透射电子显微镜、傅里叶红外光谱、X射线衍射等方法
目的:出血性转化是急性脑梗死血管内治疗后最严重的并发症,会严重影响患者的预后。因此,许多研究者试图通过多种影像学或者临床资料预测脑梗死患者治疗后出血的风险。本研究试图根据急性缺血性卒中患者CT图像(CTA和NCCT)的纹理分析进行HT预测,并与传统临床评分方法进行预测效能比较。方法:收集141例急性缺血性脑卒中(AIS)患者,其中血管内治疗(EVT)73例,保守治疗(CST)68例。我们将研究对象
命名实体识别(Named Entity Recognition,NER)技术是对文本中的命名实体进行探测和分类的技术,是信息抽取(Information Extraction)技术中十分重要的组成部分。相对于传统的NER方法如条件随机场、支持向量机等模型,基于深度学习框架的NER方法逐渐成为了NER领域的主流。基于深度学习的NER方法利用文本序列中文字的词或字嵌入特征(word/char embe
文学作品的翻译一直是翻译中的重要组成部分。随着中外文化交流的不断深入,文学作品的翻译量与日俱增。小说由一组组事件构成,一个小句表达的是一个事件。本文从体识解的角度出发,先阐述体和体识解的定义及类型,再以短篇英文小说The Siege at Whale Cay的汉译为例,针对译文中事件语义截取的不同阶段进行实例分类和剖析,归纳出英汉翻译中事件体的截取特征,具体分类为:零度再截取和事件体再截取。其中事
模态指代事物发生的方式或是事物被体验的方式[1],多模态是两个或者两个以上模态各种形式的组合,当一个数据集或者研究中包含多个模态的时候,该研究即称为多模学习。在单模态研究的时代,学者们借助不同任务所提供的单模态信息进行模型构建,如推荐领域过去的研究使用用户对物品的打分构建推荐模型进行推荐,但随着多模态学习的兴起,推荐领域物品图片信息和用户评论信息的加入使得推荐效果取得的重大突破。多模态学习逐渐成为
近年来,嵌合抗原受体T细胞(Chimeric Antigen Receptor-T cell,CAR-T细胞)在B细胞白血病治疗方面已经取得了巨大的成就,但在B细胞淋巴瘤和实体瘤的治疗方面仍存在一定的局限性。优化CAR的结构从而提高CAR-T细胞的持续性和细胞毒性是CAR-T免疫治疗的新焦点。共刺激信号域是CAR-T细胞的重要组成部分,整合了CD28共刺激分子的CAR-T细胞能够快速增殖,但持续性
随着移动互联网的高速发展、移动电子设备的硬件性能不断提升、网络基础设施日趋完善,从传统的2G、3G时代逐渐过渡到4G、5G时代,这些都给视频会议系统的移动化、智能化提供了更好的硬件基础。同时随着商业全球化的大发展,对移动端视频会议的多样化需求也在不断提高。移动端视频会议相对于传统视频会议在硬件设备、网络状况以及环境更为复杂,所以对移动端视频会议研究与实现逐渐成为热点。目前尽管商业视频会议厂商众多,