海量存储系统中的元数据分级索引算法

来源 :计算机应用研究 | 被引量 : 8次 | 上传用户:yinjie340
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
海量存储系统中,高效的元数据索引是减少查找元数据所需时间与空间开销的重要手段。针对现有元数据管理方法存在查找元数据所需时间与空间开销大和性能波动大等问题,设计了元数据分级索引算法。依据元数据的生命周期,将元数据分为活跃和非活跃两级;使用Bloom Fliter对均衡的活跃元数据分区生成摘要串,并使用B-树建立活跃元数据分区的索引;使用类似的方法对非活跃元数据分区,并为每个分区选择各自的哈希函数。从查找元数据所需时间与空间开销、适应能力两方面对元数据分级索引算法进行了分析,并与现有元数据管理算法进行了
其他文献
为了研究大城市私家车出行选择对物流配送方案生成的影响,综合考虑私家车驾驶者出行知识、获取的出行信息,建立了考虑自身风险规避、自身后悔规避与相对风险规避、相对后悔规
新闻网页和书签的推荐被认为是单类协调过滤问题。通常这类数据是相当稀疏的,仅仅一小部分数据是正例,在非正例数据中负例和没有标记的正例是混合在一起的,难以区分开来,因此,就如何解释非正例数据出现了歧义。为了解决该问题,提出了一种加权的带正则化的基于迭代最小二乘法的单类协同过滤算法。即通过对正例赋予权值1,负例赋予一个较小的正实数权值来反映数据的正负置信度。在两个真实的实验数据集上验证了该算法在性能上均
针对软实时任务的服务质量(QoS)控制问题,提出一种采用核密度估计预测控制的资源自适应调整方法。该方法首先结合资源预留策略建立软实时任务的服务质量模型,并采用核密度估计方法,在无法预知和假设具体作业执行时间分布的前提下通过滑动窗口样本预测当前作业的执行时间概率分布,反馈控制器基于预测值和上一个作业完成时获得的服务质量动态调整资源以保证当前作业服务质量。仿真实验结果表明,采用核密度估计的预测控制能有
针对组合测试用例生成问题的具体特点,结合组织进化思想及粒子群优化算法,设计了适合问题求解的编码方式及操作算子等,提出了一种基于组织进化粒子群优化的测试用例自动生成算法。该方法用于选择当前局部优化覆盖的测试用例,在此基础上构建满足两两覆盖的测试用例集。仿真实验表明,该方法能有效地降低测试用例数目。
为了探测视频高层复杂事件,架构了一个视频事件分析框架,采用本体和Petri网进行推理从而获取复合事件;运用视频语义本体标注算法分析低层视频语义,在高层构建一个视频事件分析本体,将低层本体映射到事件分析本体表示高层视频事件;通过本体和扩展Petri网结合的方法对监控视频中的事件进行图形化异步事件推理;最后用semantic Web rule language(SWRL)规则表示视频监控事件的探测。实
针对评分数据稀疏的情况下传统相似性计算的不足,提出了一种基于项目之间相似性的协同过滤算法。该算法结合用户对项目的评分和项目之间的兴趣度进行项目之间的相似性计算,在一定程度上减小了评分数据稀疏的负面影响。实验结果表明,该算法在评分数据稀疏的情况下,能使推荐系统的推荐质量明显提高。
结合信息增益,提出了一种新的自适应主题爬行策略。利用维基百科的分类树和主题描述文档构建主题向量T,并在爬行过程中不断地进行自动学习,反馈更新主题向量空间中每个概念的权重,完善主题描述。实验结果表明,该方法具有增量爬行的能力,并在信息量总和上明显优于基于the interest ratio的自适应策略;且前者所爬取的网页更接近于与主题相关。
针对复杂不确定环境下的联合采购决策难题,用三角模糊数表示不确定的次要订货费用、库存持有费用和资金约束条件,用梯形模糊数表示不确定的存储空间约束,构建了模糊联合采购模型,并采用两种方法对模糊总成本进行去模糊化处理。进而在对差分进化(DE)算法改进并借助典型函数测试性能的基础上,给出了基于改进DE的模糊联合采购模型求解流程,算例证明所设计的DE算法能较好地解决模糊联合采购问题。
为了克服传统多目标演化算法在进化后期遗传操作可能失效使算法性能降低以及基于概率建模的多目标算法在演化初期由于种群分布尚未呈现一定规律,采样产生的新个体的搜索方向同目标方向存在差异,提出一种基于熵值的多目标演化算法(entropy based multi-objective evolutionary algorithm,EB-MOEA)。算法利用种群进化过程中,个体分布存在从无序到有序的现象,设计了
针对多条跑道环境下离港飞机调度问题,提出了一种基于多目标、两阶段算法。算法第一阶段以飞机重量类型为主要分解参数,生成离港飞机序列。该参数在跑道调度计划问题上比其他参数更具影响力和稳定性。算法第二阶段从离港飞机队列池中选取可用序列,将特殊航班指配到目标类型序列中,生成优化的飞行航班时刻表。实验表明,采用两阶段跑道调度计划算法进行多跑道离港飞机调度比采用先来先服务算法调度在跑道总吞吐量上有明显改善,能