基于TPC-DS基准的性能测试工具的设计与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lanying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为评估作为决策支持系统底层支撑的数据库管理系统的性能,事务处理性能委员会组织提出了TPC-DS基准。在该基准所提供的工具包的基础上,设计和实现了一个适应实际需求的测试工具,对开展数据库管理系统在TPC-DS基准符合程度方面的评测工作具有重要意义。从业务模型、数据模型、测试流程、性能指标、工具包内容等方面对TPC-DS基准进行了分析,设计和实现了一个面向决策支持系统的数据库管理系统性能测试工具,包含基础功能和扩展功能两大部分。基础功能完成所有测试流程,包含测试连接模块,脚本生成模块,资格验证模块,负载发生模块和结果处理模块。脚本生成模块依据用户配置的命令模板来生成数据库在命令行环境下进行登录、数据导入和执行结构化查询语句(Structured Query Language,SQL)的脚本,并将这些脚本和测试所需文件发送到被测端;资格验证模块负责在测试前建立临时数据库并导入数据以完成SQL语句的检查;负载发生模块通过远程执行脚本的方式来完成测试。扩展功能包括方言模块、SQL辅助修改模块和自定义测试模块。方言模块用于解决测试工具的通用性问题,通过在SQL模板中增加占位符,向方言文件中增加相应键值对,使生成的SQL语句能表达更多种类的语法格式,提高了SQL模板的通用性;对方言文件进行拆分来提高SQL语句生成效率。SQL辅助修改模块根据资格验证过程中数据库的报错信息来定位SQL语句对应的方言文件中的错误文本,并通过对比其他已验证方言文件中的类似文本,给出对错误SQL语句进行修改的建议。自定义测试模块通过定期采集被测端处理器、内存、磁盘输入/输出的状态信息并绘制实时曲线,以反映被测数据库在指定测试计划下的资源占用特点。通过在Gbase上进行完整测试,验证了测试工具在基础功能上的可用性。以My SQL,Oracle,Gbase作为被测数据库,通过设置对照实验,模拟SQL出错的场景,验证了测试工具在主要扩展功能上的可用性。
其他文献
近年来,移动互联网技术与共享经济的发展和以智能手机为代表的智能终端设备的普及与应用推动了空间众包的出现和发展。与传统基于Web众包相同,空间众包具有工人、用户和平台三者。用户是众包任务的发起者,工人是任务实际完成者,平台连接工人和用户。不同的是,空间众包处理与位置相关的任务,众包工人需要移动到用户处来为用户提供众包服务。现有空间众包研究在建模上往往忽略了工人与用户的动态性和众包应用的经济性,在任务
学位
近年来,随着深度学习研究与技术的迅猛发展,有标签分类任务在很多领域已经取得了巨大成功,例如在图像分类、目标检测、文本识别、语音识别、视频识别等领域。性能优异的分类模型的训练往往需要借助大量有标签数据来完成。然而,在一些领域,获取有标签数据是极其困难甚至不可能的任务,比如医疗影像、军工数据等。这种训练样本稀缺的机器学习场景就是小样本学习,其目标是在当前任务中仅使用有限数量的训练数据来训练得到性能优异
学位
新时代推动农村教育高质量发展,既是实现高质量教育公平的核心内容,也是适应我国社会主要矛盾变化的客观要求;既是培育高素质高技能乡村振兴人才的主要渠道,也是促进城乡共同富裕的基础前提。以新发展理念为引领,基于大农村教育观和宏观教育质量观视阈来衡量农村教育高质量发展,则以其发展目标是否提质保量、发展动力是否创新驱动、发展形态是否协调均衡和发展指向是否开放共享为主要指标。新时代推进农村教育高质量发展的基本
期刊
随着大数据平台的发展,大数据平台的性能测试对半结构及非结构化数据的复杂度和多样性要求也越来越高。现有数据生成器无法同时支持生成XML、JSON和Web服务器日志格式的数据,且无法同时针对常用的测试场景生成半结构化与非结构化数据;而且已有的XML数据生成器和JSON数据生成器生成数据集的规模以及生成速率无法满足大数据平台性能测试的需求。因此设计并实现一款能够实现快速数据生成的半结构化及非结构化数据生
学位
随着Linux被越来越多的人使用并逐渐成为信息社会的基础设施,Linux的系统资源分配与利用功能的有效性与可靠性就成为了人们眼中日益重要的研究课题。与此同时,随着我国对信息安全的日益重视和信息系统安全标准的日趋完善,一些国家标准对操作系统的资源利用安全功能提出了测试要求,如操作系统应具备对系统资源的管理、分配和限额功能,对用户和用户组占用的系统资源的控制功能,系统资源低于某阈值时的检测和报警功能等
学位
多标签文本分类(Multi-Label Text Classification,MLTC)任务是自然语言处理的核心任务之一,其目标是根据文档与标签的关联程度为文档找到一个或多个最相关的系列标签。MLTC由于其大规模的标签集合,相比于单标签文本分类问题,面临着更加复杂的挑战。现有的MLTC方法在提取局部语义信息、学习标签相关性和解决标签数据不平衡问题方面仍然存在问题。基于对多标签文本分类问题难点的分
学位
中华优秀传统文化融入高职大学语文教学有助于提高大学生的语文综合素养,塑造大学生健全人格与优良人品。学校可通过锤炼高职大学语文教师队伍、提升融入质量,创新高职大学语文教学模式拓宽融入渠道,加强高职大学语文教学内容建设深化融入力度等方式,使中华优秀传统文化有机融入高职大学语文教学。
期刊
随着测试基准的不断发展,对测试数据集的要求也越来越高。对于各种测试数据集,存在不少相对应的数据生成器。这些数据生成器多为利用真实数据集作为源数据或利用公式、建立数据模型进行计算。但并不存在一款通用的灵活的数据生成器,能根据数据集的不同,灵活定义数据集的需求,快速高效的生成数据。因此充分利用字典的灵活性设计并实现一个通用数据生成器是十分有必要的。首先,剖析了数据生成领域中对于通用数据生成器的一般要求
学位
零件几何测量是智能制造中的一个重要支撑技术,它保证了制造出来的零件精度在设计所允许的误差范围内。当前,大多数零件几何测量系统中交互式显示系统都采用的是一般的图形系统,交互能力存在较大局限性,尤其是其中搭载软件多以国外软件为主,由此产生卡脖子、可用性、安全性等问题。针对以上原因,为了达到更好的交互显示目标,选择用虚拟引擎作为交互式显示的支撑平台,由此所设计的交互式显示系统,提供了一种直观、形象、精确
学位
随着电力网络基础设施建设不断加快,保证输电线路的安全与稳定显得尤为重要。目前,输电线路故障检测平台存在以下问题:1.计算任务集中在云端,导致网络通道压力过大;2.不支持隐患识别能力进行自学习迭代提升。因此,平台需要借助云边协同技术和自学习机制,重新设计总体架构,充分发挥云边协同能力,提升故障检测效果。基于云边协同的输电线路故障检测平台由边缘端和云端两大部分构成。其中,边缘端包括隐患识别模块和雷电数
学位