【摘 要】
:
随着信息技术的快速发展,产生了刻画信息资源的新概念——大数据,大数据已经成为近年来频率最高的词汇之一,它不仅是一个学术词汇,而且已经逐渐变成了一个商品名称。无论从学
论文部分内容阅读
随着信息技术的快速发展,产生了刻画信息资源的新概念——大数据,大数据已经成为近年来频率最高的词汇之一,它不仅是一个学术词汇,而且已经逐渐变成了一个商品名称。无论从学术研究角度,还是数据交易需求,如何评价大数据集的可用性和大数据商业价值都是一个新的问题。为了解决以上问题,本文进行了理论研究和实验分析,提出大数据可用性评价模型和大数据估价评价模型,为学术和流通领域提供参考。结合大数据的4V(Volume、Variety、Velocity、Value,简称4V)特性,分段统计抽样数据的4V特性分布,从而给出基于分段分布的大数据特性概率模型、大数据集的可用性加权评价模型以及大数据价值估算评价模型。提出了实现大数据分块抽样的算法、大数据集可用性评价模型中各个特性加权系数的求解算法,以及大数据价值估计算法。对上述提出的算法给出了实验分析结果,又结合视频大数据分析中的数据可用性评价需求,给出了算法的应用示范和实际案例应用,大数据可用性评价模型可以用于数据科学实验的数据评价,也可以用于大数据交易市场的数据集定价。
其他文献
大气污染问题日益严峻且复杂多变。作为大气污染的主要构成部分,挥发性有机物(Volatile Organic Compounds)的有效降解处理引起了社会的广泛关注。甲胺是常见的一类含氮污染物,且对大气环境与人的身体健康均有重大影响。甲胺的光催化降解情况对其它的VOCs,尤其是有机胺的降解存在重大意义。而光催化技术是解决VOCs污染的一类经济环保的方法。在众多光催化剂中,TiO_2因其光催化性能优、
概率模型由于其灵活的表达形式成为当前广泛使用的密度估计和聚类工具之一。目前,随着因特网技术的快速发展,信息化数据呈现出爆炸式增长,如何将概率模型应用于大规模数据集
人们开发了多种匿名工具来保护自身隐私,然而,由于其卓越的匿名性,这些匿名工具也成为了不法分子犯罪的温床,给网络安全带来了极大威胁。己有多种研究致力于识别匿名用户身份
目前中国已建成约7000座大型储罐,石油储罐单罐容量最大可达到20×10~4m~3。危险品储存的容量越大,危险程度越高。预防大型储罐火灾和爆炸事故的发生是储油罐区安全工作的重
在高等教育由大众化向普及化迈进的时代背景下,大学治趋势逐渐由行政主导转向民主与多元。并且随着大学治理能力现代化改革的不断推进,学生参与大学内部治理成为当下一个热点
金属氧化物气敏传感器是以金属氧化物材料为气敏元件的传感器,其气敏性能与材料的形貌、结构和组成等密切相关。金属有机骨架化合物(MOFs)具有孔径可调、比表面积大等优点,以其为模板可控制合成多孔金属氧化物材料,同时为气体在材料中的扩散与传输及电子传导提供通道,增强其气敏性能。本论文以Zn-MOFs为模板,可控合成系列ZnO多孔材料,以Fe-MOFs为模板合成了系列ZnO/α-Fe2O3多孔纳米棒异质结
软件缺陷是软件在正常运行过程中,由于异常的输入或外部条件等影响,出现了不正确的、意料之外的输出,从而影响整个系统的现象。严重的软件缺陷可能导致设备陷入瘫痪,造成人员
随着人类社会的发展,化石能源不断枯竭,能源危机日益严重,人们迫切的寻找可再生能源代替化石能源,如光能,水能,太阳能等。生物质能源作为一种新型、可再生能源备受关注,而微藻因其繁殖速度快、培养方式简单、富含大量三酰甘油(TAG)、可以进行光合作用等特点被认为是未来生物柴油工业化生产的主要原料。然而,发展以微藻为原料的生物柴油存在以下缺点:如何选育出含油量较高的藻种以及提高油脂提取效率。研究表明,微藻经
水力旋流器作为一种快速机械分离设备,具有结构简单、操作方便、占用空间小等优点,被广泛应用于油田生产。但由于内部运动规律复杂,对被分离介质物性参数十分敏感,水力旋流器
电磁超材料(Metamaterial)是一种人工复合的具有特殊性质的人造材料。超材料的几何形状、大小、方向和排列方式赋予其改变入射电磁波的振幅、相位、极化方式、传播模式等特性