大力推进数据治理技术与系统的学术研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:lizheng124128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据治理是组织机构数字转型和数据管理的基础.如何有效利用计算机科学与技术推动数据治理实践,进而提升数据治理活动的智能水平是一个值得研究的新课题.在技术层面,智能数据治理需要解决大数据质量的实时分析与控制、数据治理模型和算法的可解释性、数据驱动型大数据治理技术、大数据治理中的实时分析与洞察、面向智能数据治理的知识图谱自动生成与动态维护、数据交换及共享、数据规整化及数据准备、数据集成与融合以及大数据的安全保障与隐私保护等核心问题.然而,现阶段的大数据治理技术尚未成熟,亟待在上述问题的研究中取得突破性进展.
其他文献
内陆湖泊水华现象的频繁爆发,严重影响着地表水环境安全,严重阻碍了我国的生态文明建设。充分发挥合成孔径雷达(Synthetic Aperture Radar,SAR)遥感技术全天时、全天候的优势,可实现大尺度、周期性的水华识别与监测工作,对于地表水生态环境的保护与监管具有重大的现实意义。立足于SAR遥感目标识别技术的研究与应用,文中提出了一种基于特征优化的水华识别方法。该方法基于对水华SAR图像特征的深入分析与提取,应用ReliefF特征优化算法对全部的22个水华特征进行筛选与优化,得到包含10个特征的最优
文中提出一种融合深度典型相关分析和对抗学习的跨模态检索方法(DCCA-ACMR),该方法提高了无标签样本的利用率,能够学习到更有力的特征投影模型,进而提升了跨模态检索准确率。具体而言,在DCGAN框架下:1)在图像与文本两个单模态的表示层间增加深度典型相关分析约束,构建图文特征投影模型,充分挖掘样本对的语义关联性;2)以图文特征投影模型作为生成器,以模态特征分类模型作为判别器共同构成图文跨模态检索模型;3)利用有标签样本和无标签样本,在生成器和判别器的相互对抗中学习到样本的公共子空间表示。在Wikiped
随着移动互联技术的不断发展,社交媒体成为了公众分享观点和抒发情感的主要平台,在重大社会事件下对社交媒体文本进行情感分析能够有效监控舆情。针对现有中文社交媒体情感分析算法的准确性能和运行效率较低的问题,提出了一种基于Spark分布式系统的集成情感大数据分析方法(Spark Feature Weighted Stacking,S-FWS)。该方法首先基于Jieba库预分词和PMI关联度完成新词发现;然后考虑词语重要度混合提取文本特征,并使用Lasso进行特征选择;最后改进传统Stacking框架忽略特征重要度
传统的大数据工具一般为专业数据分析人员打造,具有难以上手、操作交互性差以及不够智能化等特点。而智能交互向导系统是针对大数据交互式分析系统目前存在的问题而研制的一套大数据分析辅助工具。系统既研发了用户意图理解、数据抽样及列推荐、可视化推荐、分析方法推荐等核心关键技术,也拥有良好的图形化界面与人性化的智能交互体验。在满足用户多种交互式分析需求的同时,还具有极高的响应速度。不仅可以随时回溯到分析流程任意一步重新选择方法的执行流程,还可以通过接口与各种分析应用快速集成以部署应用于不同场景。经过实验测试,系统的平均
基于光谱重建约束的非负矩阵分解,提出了一种高光谱与全色图像的有效解混方法。首先在高光谱图像的非负矩阵分解中引入光谱重建误差最小化的正则项,通过多目标寻优寻找最佳的正则项参数,以鼓励分解的光谱特征矩阵包含更真实的光谱特征;然后对全色图像进行非负矩阵分解,以获得描述图像细节的丰度矩阵;最后利用光谱特征矩阵和丰度矩阵重建得到融合结果。实验仿真结果表明,所提方法的融合结果能在较好地保留全色图像细节的同时,
异质信息网络(Heterogeneous Information Network,HIN)嵌入将复杂的异质信息映射到低维稠密的向量空间,有利于网络数据的计算和存储。现有的基于多视图的HIN嵌入方法考虑了节点之间的多种语义关系,但忽略了视图的不完整性。大多数视图存在数据缺失,直接融合多个不完整的视图会导致嵌入效果不佳。为此,文中提出了一种融合不完整多视图的HIN嵌入方法(Incomplete Multi-view Fusion Based HIN Embedding,IMHE)。IMHE的关键思想是聚合其他
行人重识别旨在跨摄像头条件下,从目标数据库中检索出特定的行人目标,其在视频监控领域有重要的应用价值。目前其研究难点为样本图像类内差异大、类间差异小,因此如何设计并训练深度神经网络对行人图片提取一个判别力更强的特征成为了其关键。针对以往研究只单独进行全局特征或局部特征学习的不足,提出了一种联合全局特征和局部特征学习的网络结构,该结构能够同时提取全局特征和具有较强区分力的局部细节特征;针对每部分局部特
随着人工智能的发展,自动驾驶领域的研究也日益壮大。深度强化学习(Deep Reinforcement Learning,DRL)方法是该领域的主要研究方法之一。其中,安全探索问题是该领域的一个研究热点。然而,大部分DRL算法为了提高样本的覆盖率并没有对探索方法进行安全限制,使无人车探索时会陷入某些危险状态,从而导致学习失败。针对该问题,提出了一种基于动作约束的软行动者-评论家算法(Constrained Soft Actor-critic,CSAC),该方法首先对环境奖赏进行了合理限制。无人车动作转角过大
针对立体匹配中不适定区域视差边缘模糊、视差不平滑、单个物体视差不连续、存在空洞的问题,提出了一种轻量化的实时双目深度估计算法,将场景图、通过语义分割得到的语义标签图和通过边缘检测得到的边缘细节图作为辅助损失,以地面真值图为主要损失,构造了联合损失函数,以更好地监督视差图的生成。此外,构造了一个轻量化的特征提取模块,以降低特征提取模块的冗余性,从而更好地简化特征提取步骤,提高了网络的实时性和轻量性。
SLAM(Simultaneous Localization and Mapping),即同时定位与地图构建,目前被广泛应用于机器人领域。SLAM算法使得机器人处于陌生环境时,能够通过自身搭载的传感器来感知环境信息并建立环境地图,并完成对自身位姿的计算,从而能够在未知环境中进行移动。随着研究者们对SLAM问题的深入研究,SLAM领域相关成果已非常丰富,但是有关室内场景SLAM的论述还不够系统。通过