论文部分内容阅读
摘要:近年来,放射源辐射安全监管范围不断扩大,监管要求不断完善,任务不断增加。导致我国核技术利用辐射安全监管系统的数据成为了海量数据,进而放射源溯源安全监管人员难以快捷的掌握放射源流转的动态信息,难以有效和安全地监测放射源。区块链技术是完全去中心化、匿名参与的不可控网络,网络中的所有节点都参与数据的记录。但在放射源溯源信息中,由于记录放射源溯源的数据是海量數据,在传统的区块链技术下,网络中单节点的性能较低、同时数据存储采用链式本地存储导致无法平行扩展的问题。本文将结合放射源流转数据的特点,研究分层多链的切分存储方式,提高节点处理放射源流转数据存储的性能。
关键词:区块链;存储;溯源系统;区块链溯源模型;分片存储
中图分类号:TP391.1 文献标识码:A
Research on Radioactive Source Logistics Traceability Data Storage Algorithms Based on Block Chain Technology
Zi Xian-guo1,2,3,4,Zuo Min1,3,4,Zhang Qing-chuan1,3,4
(1. School of Computer and Information Engineering,Beijing Technology and Business University
2. nuclear and radiation safety center
3.National Engineering Laboratory for Agri-product Quality Traceability
4. Beijing Key Laboratory of Big Data Technology for Food Safety Beijing,100048)
ABSTRACT:In recent years,the scope of radiation safety supervision of radioactive sources has been expanding,regulatory requirements have been refined and tasks have been aggravated. As a result,the data of radiation safety supervision system used by nuclear technology in our country has become a mass of data. Therefore,it is difficult for radioactive source traceability safety supervisors to quickly grasp the dynamic information of radiation source flow and to effectively monitor the safety of radioactive sources. Block chain technology is a completely decentralized and anonymous uncontrollable network in which all nodes participate in data recording. However,in radioactive source traceability information,because the data recorded from radioactive source traceability are massive data,the performance of single node in the network is low under the traditional block chain technology,and the use of chain local storage for data storage leads to the problem that parallel expansion cannot be achieved. Based on the characteristics of the radioactive source flow data,this paper will study the hierarchical multi-chain segmented storage method to improve the performance of the node processing the radioactive source flow data.
KEYWORDS:Block Chain;Storage;Traceability System;Block Chain Traceability Model;Piecewise Storage
1 引言
随着放射源应用企业不断增多,放射源流转数据信息也随着成为了海量的数据。当前中国放射源的流转溯源管理研究处于探索阶段,溯源系统的更新换代较为频繁,海量数据等待筛选、分析,为传统数据存储系统造成了前所未有的挑战。今天的放射源可追溯信息与以前完全不同:一方面,这些溯源数据信息来源涉及到的相关企业过于庞杂;另一方面,放射源的数据结构差异较大,数据中包含放射源基本信息、流转信息、回收信息等。而区块链技术恰好适用于对复杂数据进行溯源分析处理,放射源溯源技术技术被认为是继大数据、云计算之后的颠覆式创新,各行业均对此予以高度关注,区块链技术的发展已成为不可逆转的趋势。 2 放射源在区块链技术下的溯源存储模型
在放射源溯源数据存储区块链中,放射源监管部门针对放射源在流转网络中的生产,转让,异地使用,回收,收贮等数据信息进行实时的采集监控,了解放射源的流转状况,从而防止放射源事故的发生,加强对放射源的监督。
放射源溯源数据存储链是建立在放射源监管部门的监管系统中的,在放射源溯源链中有一个重要的数据保障过程——共識过程,监管部门中的监管体系有权控制共识流程并竞争编写数据的资格,进而获得奖励。
放射源区块链溯源存储模型(以下称简称BCSM)包括以下成分:
1)放射源溯源区块链中的节点区块。BCSM中,所有的放射源溯源数据都将被监管部门审核,再存储到区块节点中,从而将数据在区块网络中传播,由于区块节点的运算以及存储能力有限,所以本文中节点无需直接独自存储全部数据,而是将一条完整的数据切分存储到一个由若干区块节点构成的一个节点组中进行存储。区块中的存储内容主要包含以下三部分:放射源流转行为信息和前一个区块节点形成的哈希散列、随机数。放射源流转行为信息是区块节点需要记录的任务数据,具体包括每次放射源作出流转行为时企业双方的私钥、放射源的数量、放射源交易双方信息等;前一个区块形成的哈希散列用来将区块节点连接起来,实现过往交易的顺序排列(图1)。
2)智能合约。在 BCSM中的节点区块的职责是存放放射源溯源数据,与历史数据库中的数据,并且在一个区块组中的区块之间进行数据传输即溯源数据共享,而在区块之间传输数据的过程中节点区块通过智能合约建立不同区块之间的信任机制,从而来保证数据的一致性。从根本上说,智能合约是一组以数字形式定义的承诺,也可以理解为可以在不同区块之间发生的承诺协议。智能合约系统的主体是进入智能合约的数据流转事件,经过智能合约处理后,出来的也是应该是数据流转事件。
3)工作量证明机制(Proof-of-Work,PoW)。通常只能从BCSM中不同区块之间的应用的最终效果来证明,因为检测其工作过程通常是繁琐且低效的。工作量证明顾名思义,就是一份证明,用来证明你做过一定的工作。在BCSM中的工作量证明机制类似于比特币,新的放射源溯源数据加入区块链之前,BCSM在某个时间段内溯源数据的记账权(即数据录入的权利)需要在预选的区块组之间进行竞争记录。即每个区块组相互竞争寻找有效的Nonce最快找到有效Nonce的区块组将获得一定的奖励,负责记录放射源溯源数据,并将数据切分存储使其成为新的数据节点区块,从而融入获得奖励的区块组内。
3放射源溯源数据存储链切分存储算法的比较与选取
记录放射源溯源信息的数据是海量数据,在现有区块链技术下,网络中单节点的性能较低、同时数据存储采用链式本地存储导致无法平行扩展。放射源从生产到回收后安全信息不再更改。因此,本文结合放射源流转数据的特点,研究分层多链的切分存储方式,提高节点处理放射源流转相关数据的性能。
3.1 切分存储算法种类
分层多链:通过放射源监管部门即数据存储器将整个监测区域按照省,市,县等级去划分。
切分存储:数据切分是分布式数据库系统的最基本功能。切分数据的方法有很多种,通常由具体的应用程序特征决定。根据实际应用中常用的数据切分方法,数据切分算法可分为范围分割算法,枚举分割算法,简单散列分割算法,一致性散列算法和组合算法。其中,组合算法是各种基本算法的组合。
范围切分算法:范围分割算法基于分割字段的范围来分割数据。通常,拆分字段是实数类型,例如整数,浮点数等。它可以进一步扩展到可以比较的所有类型的数据,例如日期。当分段数据被均匀地划分为多个范围间隔时,性能最佳。
枚举切分算法:枚举切分算法根据数据分割字段的枚举值对数据进行划分。这种类型的分段特别适用于用户分布广泛的应用程序,因此可以按区域对数据进行分段。当数据可以被枚举值均分时,性能最好,但这种情况比较少见,而且对应不同枚举值的数据甚至很宽。因此,这种类型的算法通常需要与其他算法结合使用。
简单哈希算法:数据通常能够更均匀地分段。如果从负载平衡的角度考虑,该算法是性能最佳的分割算法。但是它同时也存在一个巨大的缺陷:迁移成本太高。一旦数据节点数量发生变化,每个节点都需要进行数据迁移。如果数据节点保持稳定,则算法仍然是首选算法。
一致性哈希算法:该算法既可以解决"热点"问题(系统读写集中在新创建的节点上,负载不平衡),又降低了数据扩容的成本,因此在数据切分领域应用广泛。
3.2切分算法的比较分析
分布式系统的两个最重要的指标是负载平衡和可伸缩性。范围分割和枚举分割之间存在负载平衡问题,新添加的数据节点负担过重;简单的哈希算法解决了这个问题,但是存在迁移成本高,可扩展性差的问题。一致的哈希算法在这两个方面更加平衡,这就是它可以被广泛使用的原因。但是,一致性哈希算法仍然存在一些缺点。因为哈希函数用于处理数据,所以它不具有控制数据大小的灵活性,如范围分段和枚举分段。虽然数据迁移成本降低,但仍然需要迁移某些数据,特别是当数据总量很大时,迁移成本仍然相对较大。
3.3切分算法的选取
通过深入分析各种算法的优缺点,本文拟采用一种新的组合算法:分组哈希分区算法。该算法结合了范围分割算法,简单哈希算法和数据库分区,并集成了两种算法的优点。
分组哈希分区算法首先对分组执行范围分割算法,以使系统获得更好的可扩展性;然后在组内执行简单哈希算法,使数据均匀分布于组内节点上,以避免负载不均匀。全局上,数据按增量间隔进行分段,分段的段不分布在一个数据节点中,而是分布在一个节点组中;在本地,即在节点组内,片段以简单的散列方式均匀地分布到组中的每个数据节点。
5 结论与展望
本文围绕放射源溯源数据在区块链中的存储问题,做了两方面的工作。一是提出了一个基于联盟区块链的安全存储(BCSM)模型,该模型借助于区块链“去中心化”的性质。二是分析了各种切分算法的优缺点,并提出了一种在性能和可扩展性上均表现良好的沮合算法,弥补了现有算法的不足。在未来的研究中我们将根据不同的需求来评估和改进我们放射源溯源模型。 参考文献
[1]肖洁.网络数据安全存储优化管理研究[J].计算机仿真,2016,33(12):436-439.
[2]Jin S,Zhang Y,Xu Y. Amount of information and the willingness of consumers to pay for food traceability in China[J]. Food Control,2017,77:163-170.
[3]Kim Y G,Woo E. Consumer acceptance of a quick response(QR)code for the food traceability system:Application of an extendedtechnology acceptance model(TAM)[J]. Food Research International,2016,85:266-272.
[4]缪祎晟,吴华瑞,朱华吉,黄锋.城市食品安全体系智能溯源终端设计[J].计算机工程与设计,2015,36(03):641-646.
[5]王志迁.基于物联网标识服务的溯源技术研究与应用[D].重庆邮电大学,2017.
[6]姚迎乐,张志华.面向大数据的并行数据分布式备份存储仿真[J].计算机仿真,2018,35(08):401-404+409.
[7]涂俊英,张学敏.云计算中数据信息加密安全存储仿真研究[J].计算机仿真,2017,34(12):431-434.
[8]孙志国,李秀峰,王文生,冀智强.区块链技术在食品安全领域的应用展望[J].农业网络信息,2016(12):30-31.
[9]赵阔,邢永恒.区块链技术驱动下的物联网安全研究综述[J].信息网络安全,2017(05):1-6.
[10]Tse,D.,Zhang,B.,Yang,Y.,Cheng,C.,Mu,H.:Blockchain application in food supply information security. In:IEEE International Conference on Industrial Engineering and Engineering Management(IEEM),ISSN:2157-362X,pp. 1357–1361(2018)
[11]Feng Tian,"A supply chain traceability system for food safety based on HACCP,blockchain & Internet of things," 2017 International Conference on Service Systems and Service Management,Dalian,2017,pp. 1-6.
[12]林延昌. 基于區块链的食品安全追溯技术研究与实现[D].广西大学,2017.
[13]汪登,曾小珊,白倩兰,孙耀杰.基于区块链的食品安全溯源技术[J/OL].食品科学:1-9[2018-06-24].
作者简介:郭子贤(1994-),男(汉族)河北省廊坊市人,硕士研究生,主要研究领域为智慧物流,人工智能。
左敏(1973-),男(汉族),北京市海淀区人,教授,硕士研究生导师,主要研究领域智能管理和人工智能。
张青川(1982-),男(汉族),北京市海淀区人,博士研究生,讲师,主要研究领域为智能软件,分布式计算和人工智能
基金项目:国家重点研发计划(2016YFD0401205)
(作者单位:1.北京工商大学计算机与信息工程学院;
2. 环境保护部核与辐射安全中心;
3.农产品食品安全追溯技术及应用国家工程实验室;
4.食品安全大数据技术北京市重点实验室)
关键词:区块链;存储;溯源系统;区块链溯源模型;分片存储
中图分类号:TP391.1 文献标识码:A
Research on Radioactive Source Logistics Traceability Data Storage Algorithms Based on Block Chain Technology
Zi Xian-guo1,2,3,4,Zuo Min1,3,4,Zhang Qing-chuan1,3,4
(1. School of Computer and Information Engineering,Beijing Technology and Business University
2. nuclear and radiation safety center
3.National Engineering Laboratory for Agri-product Quality Traceability
4. Beijing Key Laboratory of Big Data Technology for Food Safety Beijing,100048)
ABSTRACT:In recent years,the scope of radiation safety supervision of radioactive sources has been expanding,regulatory requirements have been refined and tasks have been aggravated. As a result,the data of radiation safety supervision system used by nuclear technology in our country has become a mass of data. Therefore,it is difficult for radioactive source traceability safety supervisors to quickly grasp the dynamic information of radiation source flow and to effectively monitor the safety of radioactive sources. Block chain technology is a completely decentralized and anonymous uncontrollable network in which all nodes participate in data recording. However,in radioactive source traceability information,because the data recorded from radioactive source traceability are massive data,the performance of single node in the network is low under the traditional block chain technology,and the use of chain local storage for data storage leads to the problem that parallel expansion cannot be achieved. Based on the characteristics of the radioactive source flow data,this paper will study the hierarchical multi-chain segmented storage method to improve the performance of the node processing the radioactive source flow data.
KEYWORDS:Block Chain;Storage;Traceability System;Block Chain Traceability Model;Piecewise Storage
1 引言
随着放射源应用企业不断增多,放射源流转数据信息也随着成为了海量的数据。当前中国放射源的流转溯源管理研究处于探索阶段,溯源系统的更新换代较为频繁,海量数据等待筛选、分析,为传统数据存储系统造成了前所未有的挑战。今天的放射源可追溯信息与以前完全不同:一方面,这些溯源数据信息来源涉及到的相关企业过于庞杂;另一方面,放射源的数据结构差异较大,数据中包含放射源基本信息、流转信息、回收信息等。而区块链技术恰好适用于对复杂数据进行溯源分析处理,放射源溯源技术技术被认为是继大数据、云计算之后的颠覆式创新,各行业均对此予以高度关注,区块链技术的发展已成为不可逆转的趋势。 2 放射源在区块链技术下的溯源存储模型
在放射源溯源数据存储区块链中,放射源监管部门针对放射源在流转网络中的生产,转让,异地使用,回收,收贮等数据信息进行实时的采集监控,了解放射源的流转状况,从而防止放射源事故的发生,加强对放射源的监督。
放射源溯源数据存储链是建立在放射源监管部门的监管系统中的,在放射源溯源链中有一个重要的数据保障过程——共識过程,监管部门中的监管体系有权控制共识流程并竞争编写数据的资格,进而获得奖励。
放射源区块链溯源存储模型(以下称简称BCSM)包括以下成分:
1)放射源溯源区块链中的节点区块。BCSM中,所有的放射源溯源数据都将被监管部门审核,再存储到区块节点中,从而将数据在区块网络中传播,由于区块节点的运算以及存储能力有限,所以本文中节点无需直接独自存储全部数据,而是将一条完整的数据切分存储到一个由若干区块节点构成的一个节点组中进行存储。区块中的存储内容主要包含以下三部分:放射源流转行为信息和前一个区块节点形成的哈希散列、随机数。放射源流转行为信息是区块节点需要记录的任务数据,具体包括每次放射源作出流转行为时企业双方的私钥、放射源的数量、放射源交易双方信息等;前一个区块形成的哈希散列用来将区块节点连接起来,实现过往交易的顺序排列(图1)。
2)智能合约。在 BCSM中的节点区块的职责是存放放射源溯源数据,与历史数据库中的数据,并且在一个区块组中的区块之间进行数据传输即溯源数据共享,而在区块之间传输数据的过程中节点区块通过智能合约建立不同区块之间的信任机制,从而来保证数据的一致性。从根本上说,智能合约是一组以数字形式定义的承诺,也可以理解为可以在不同区块之间发生的承诺协议。智能合约系统的主体是进入智能合约的数据流转事件,经过智能合约处理后,出来的也是应该是数据流转事件。
3)工作量证明机制(Proof-of-Work,PoW)。通常只能从BCSM中不同区块之间的应用的最终效果来证明,因为检测其工作过程通常是繁琐且低效的。工作量证明顾名思义,就是一份证明,用来证明你做过一定的工作。在BCSM中的工作量证明机制类似于比特币,新的放射源溯源数据加入区块链之前,BCSM在某个时间段内溯源数据的记账权(即数据录入的权利)需要在预选的区块组之间进行竞争记录。即每个区块组相互竞争寻找有效的Nonce最快找到有效Nonce的区块组将获得一定的奖励,负责记录放射源溯源数据,并将数据切分存储使其成为新的数据节点区块,从而融入获得奖励的区块组内。
3放射源溯源数据存储链切分存储算法的比较与选取
记录放射源溯源信息的数据是海量数据,在现有区块链技术下,网络中单节点的性能较低、同时数据存储采用链式本地存储导致无法平行扩展。放射源从生产到回收后安全信息不再更改。因此,本文结合放射源流转数据的特点,研究分层多链的切分存储方式,提高节点处理放射源流转相关数据的性能。
3.1 切分存储算法种类
分层多链:通过放射源监管部门即数据存储器将整个监测区域按照省,市,县等级去划分。
切分存储:数据切分是分布式数据库系统的最基本功能。切分数据的方法有很多种,通常由具体的应用程序特征决定。根据实际应用中常用的数据切分方法,数据切分算法可分为范围分割算法,枚举分割算法,简单散列分割算法,一致性散列算法和组合算法。其中,组合算法是各种基本算法的组合。
范围切分算法:范围分割算法基于分割字段的范围来分割数据。通常,拆分字段是实数类型,例如整数,浮点数等。它可以进一步扩展到可以比较的所有类型的数据,例如日期。当分段数据被均匀地划分为多个范围间隔时,性能最佳。
枚举切分算法:枚举切分算法根据数据分割字段的枚举值对数据进行划分。这种类型的分段特别适用于用户分布广泛的应用程序,因此可以按区域对数据进行分段。当数据可以被枚举值均分时,性能最好,但这种情况比较少见,而且对应不同枚举值的数据甚至很宽。因此,这种类型的算法通常需要与其他算法结合使用。
简单哈希算法:数据通常能够更均匀地分段。如果从负载平衡的角度考虑,该算法是性能最佳的分割算法。但是它同时也存在一个巨大的缺陷:迁移成本太高。一旦数据节点数量发生变化,每个节点都需要进行数据迁移。如果数据节点保持稳定,则算法仍然是首选算法。
一致性哈希算法:该算法既可以解决"热点"问题(系统读写集中在新创建的节点上,负载不平衡),又降低了数据扩容的成本,因此在数据切分领域应用广泛。
3.2切分算法的比较分析
分布式系统的两个最重要的指标是负载平衡和可伸缩性。范围分割和枚举分割之间存在负载平衡问题,新添加的数据节点负担过重;简单的哈希算法解决了这个问题,但是存在迁移成本高,可扩展性差的问题。一致的哈希算法在这两个方面更加平衡,这就是它可以被广泛使用的原因。但是,一致性哈希算法仍然存在一些缺点。因为哈希函数用于处理数据,所以它不具有控制数据大小的灵活性,如范围分段和枚举分段。虽然数据迁移成本降低,但仍然需要迁移某些数据,特别是当数据总量很大时,迁移成本仍然相对较大。
3.3切分算法的选取
通过深入分析各种算法的优缺点,本文拟采用一种新的组合算法:分组哈希分区算法。该算法结合了范围分割算法,简单哈希算法和数据库分区,并集成了两种算法的优点。
分组哈希分区算法首先对分组执行范围分割算法,以使系统获得更好的可扩展性;然后在组内执行简单哈希算法,使数据均匀分布于组内节点上,以避免负载不均匀。全局上,数据按增量间隔进行分段,分段的段不分布在一个数据节点中,而是分布在一个节点组中;在本地,即在节点组内,片段以简单的散列方式均匀地分布到组中的每个数据节点。
5 结论与展望
本文围绕放射源溯源数据在区块链中的存储问题,做了两方面的工作。一是提出了一个基于联盟区块链的安全存储(BCSM)模型,该模型借助于区块链“去中心化”的性质。二是分析了各种切分算法的优缺点,并提出了一种在性能和可扩展性上均表现良好的沮合算法,弥补了现有算法的不足。在未来的研究中我们将根据不同的需求来评估和改进我们放射源溯源模型。 参考文献
[1]肖洁.网络数据安全存储优化管理研究[J].计算机仿真,2016,33(12):436-439.
[2]Jin S,Zhang Y,Xu Y. Amount of information and the willingness of consumers to pay for food traceability in China[J]. Food Control,2017,77:163-170.
[3]Kim Y G,Woo E. Consumer acceptance of a quick response(QR)code for the food traceability system:Application of an extendedtechnology acceptance model(TAM)[J]. Food Research International,2016,85:266-272.
[4]缪祎晟,吴华瑞,朱华吉,黄锋.城市食品安全体系智能溯源终端设计[J].计算机工程与设计,2015,36(03):641-646.
[5]王志迁.基于物联网标识服务的溯源技术研究与应用[D].重庆邮电大学,2017.
[6]姚迎乐,张志华.面向大数据的并行数据分布式备份存储仿真[J].计算机仿真,2018,35(08):401-404+409.
[7]涂俊英,张学敏.云计算中数据信息加密安全存储仿真研究[J].计算机仿真,2017,34(12):431-434.
[8]孙志国,李秀峰,王文生,冀智强.区块链技术在食品安全领域的应用展望[J].农业网络信息,2016(12):30-31.
[9]赵阔,邢永恒.区块链技术驱动下的物联网安全研究综述[J].信息网络安全,2017(05):1-6.
[10]Tse,D.,Zhang,B.,Yang,Y.,Cheng,C.,Mu,H.:Blockchain application in food supply information security. In:IEEE International Conference on Industrial Engineering and Engineering Management(IEEM),ISSN:2157-362X,pp. 1357–1361(2018)
[11]Feng Tian,"A supply chain traceability system for food safety based on HACCP,blockchain & Internet of things," 2017 International Conference on Service Systems and Service Management,Dalian,2017,pp. 1-6.
[12]林延昌. 基于區块链的食品安全追溯技术研究与实现[D].广西大学,2017.
[13]汪登,曾小珊,白倩兰,孙耀杰.基于区块链的食品安全溯源技术[J/OL].食品科学:1-9[2018-06-24].
作者简介:郭子贤(1994-),男(汉族)河北省廊坊市人,硕士研究生,主要研究领域为智慧物流,人工智能。
左敏(1973-),男(汉族),北京市海淀区人,教授,硕士研究生导师,主要研究领域智能管理和人工智能。
张青川(1982-),男(汉族),北京市海淀区人,博士研究生,讲师,主要研究领域为智能软件,分布式计算和人工智能
基金项目:国家重点研发计划(2016YFD0401205)
(作者单位:1.北京工商大学计算机与信息工程学院;
2. 环境保护部核与辐射安全中心;
3.农产品食品安全追溯技术及应用国家工程实验室;
4.食品安全大数据技术北京市重点实验室)