MongoDB在期刊数据库日志管理应用的探析r——以上海图书馆《全国报刊索引》全文库为例

来源 :现代计算机 | 被引量 : 0次 | 上传用户:appleandtzf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着读者访问民国全文数据库的快速增长和下载量的增大,后台的日志数据量和并发量也急剧增长,需要找到适宜的日志数据库系统来进行管理.本文通过对非关系性数据库MongoDB与关系型数据库MySQL在海量日志数据管理上的比较分析,最终选取MongoDB数据库,在上海图书馆的《全国报刊索引》平台民国全文数据库建立了一套日志管理系统.该系统建立运行后,取得了良好的效果,极大的提高了平台日志数据管理效率和分析应用水平,为民国全文数据库的日志管理提供一种解决方案.
其他文献
在当前的机器人机构动力分析方法以及相关仿真工作中,仅能对机器人的单一运动方向进行仿真,若变换方向则需重新建立模型,导致其仿真精度低、效率差.因此,文中提出基于Matlab的并联机器人机构动力分析与动态仿真.首先建立并联机器人的数学模型,以确定机器人运动机构的运动初始位置及其坐标;其次根据拉格朗日方程获得机器人的动力平台相关参数,并对其进行动力平台分析,根据获取的参数分析结果进行机器人的运动描述.最后将上述内容作为仿真基础,导入Matlab软件中,实现动态仿真.为了验证设计方法的可行性,使用该方法对某型号的
随着自动驾驶技术的不断发展,传统的真实路测方法已经不能满足自动驾驶测试的需求,无法在充分性、全面性、效率性等各个方面达到要求.利用自动驾驶仿真测试场景库进行测试可以大大缩短测试时间和成本,可以提高测试的安全性和可靠性,是助力自动驾驶领域发展的重要工具,已成为目前自动驾驶研究领域的一个重大研究方向.本文在调研分析大量自动驾驶仿真测试场景库研究成果的基础上,首先针对场景作为自动驾驶仿真测试场景库的主体进行一系列的分析,梳理了场景的定义、场景的元素、场景的数据来源;其次,总结了常见场景数据处理,主要包括数据预处
最大间隔相关滤波器(maximum margin correlation filter,MMCF)结合了支持向量机(support vector machine,SVM)和相关滤波器,提高了相关滤波器的鉴别能力.但是,SVM未利用样本结构信息,训练不充分的缺点也被MMCF继承下来.针对这一问题,提出基于数据分布信息的相关滤波器算法,引入样本类内散度及类内局部保留散度进行训练,并进行目标检测和识别实验,从实验结果来看,所提算法是有效的.
针对特定业务分类的需求,无从下手设计深度神经网络模型的问题,提出一种基于多参数融合逐步优化深度神经网络的设计方法.先通过分析样本和类别确定初始的无隐层神经网络模型,然后在初始神经网络的基础上逐步增加隐层,构建多参数融合优化的深度神经网络.基于TensorFlow框架,以手写体数字识别为例,逐步设计一个深度神经网络模型,整个实验过程中不断调整网络结构、激活函数、损失函数、优化器、学习率和样本批次大小,最终设计出多参数融合优化的具有较高准确率的深度神经网络模型,为构建神经网络提供了一种有效的思路.
遥感影像数据的不确定性及其处理方法的局限性,严重影响着遥感影像地物分类的可靠性.本文从遥感数据的获取、处理、转换和传播等方面分析遥感影像分类中的不确定性因素,并对不确定性的处理方法进行归纳.旨在为后续研究遥感影像数据不确定性建模和分类方法提供有效参考,以提高遥感影像分类精度和自动化程度.
电子产品及数码设备的普及,使得电子多媒体成为现阶段最为广泛的媒体格式,数字压缩技术在将大容量图片等媒体压缩的前提下,也为声像电子数据司法鉴定提供了重要的科学判断依据;结合使用最为广泛的JPEG压缩技术的原理及框架,对图像的真实性加以鉴别,增强底层数据结构研究分析,以真实案件为例,从JPEG文件总体结构、DQT量化表、原图级别检测、压缩签名等各方面分析,最后辅以多种鉴别手段保证司法鉴定技术的有效、严谨.
针对目标跟踪过程中的遮挡引起的精度下降、跟踪漂移、目标丢失等问题,提出一种基于多算法融合思想的抗遮挡算法,将卡尔曼滤波、Mean Shift算法和SVM分类器融合.当目标正常运动或局部遮挡时,采用卡尔曼滤波结合前一帧目标位置信息预测目标当前帧目标所在位置,作为均值漂移的迭代初始点,可以缩短迭代初始点与目标实际位置之间的距离,从而减小迭代次数,提高算法的计算量.用SVM检测器在目标被严重遮挡后辅助算法定位,可以在脱离长时间严重遮挡时或者目标丢失后捕捉到目标位置,将重检测到的目标位置作为Mean Shift算
随着保险业务的快速发展,每天都有大量的保险数据产生,传统的保险业务系统内新增和变化的数据不能实时地体现到业务人员的客户端上,一定程度上影响了业务人员的工作效率,不能满足当下保险系统的实时应用需求.为此,系统通过采用分布式流计算技术,实现一个流式大宽表数据系统,提升保单数据的计算性能.同时采用MPP数据库,提高了对海量数据的分析处理和并行数据计算能力,让业务人员能够即时知晓最新保单和汇总数据的变化情况.实验证明,该设计确实可以实现让数据实时同步到客户端上,有极高的可用性和可扩展性,并已应用于实际系统.
随着信息化教育的改革,大规模开放课程(MOOC)作为一种在线学习方式备受关注,充分利用网络学习资源将会给大学生带来很多益处.然而,很多大学生在MOOC学习中的投入度不高、完成率低.本研究基于文献的研究,提出3个问题:①MOOC学习投入是否与性别有关?②MOOC学习投入是否与年级有关?③MOOC学习投入的四个变量是否相互影响?并利用在线学习投入量表,以哈尔滨三所高校本科生作为调查对象,并将调查的数据进行描述性分析、独立样本T检验和相关分析.最后发现MOOC学习投入与性别、年级有关,并且变量之间是相互影响的.
本章从开课前的教学准备、混合教学模式下的教学设计和多维考核体系的构建三方面探讨如何提高留学生全英文教学质量的实践举措,提出线上课程资源的优化需要注意的问题,分析在线下课堂中运用讨论式教学、激励式教学等多样化的教学方法对提高课堂魅力、激发学生学习兴趣的促进作用,并提出强化过程考核以建立完善的多维考核体系也是提高留学生培养质量的重要因素.