【摘 要】
:
大数据时代的到来催生了一门新的学科——数据科学。首先,探讨了数据科学的内涵、发展简史、学科地位及知识体系等基本问题,并提出了专业数据科学与专业中的数据科学之间的区
【机 构】
:
数据工程与知识工程教育部重点实验室(中国人民大学),中国人民大学信息资源管理学院,清华大学计算机科学与技术系,清华大学信息技术研究院,清华信息科学与技术国家实验室(筹)
【基金项目】
:
国家自然科学基金项目(91646202,71103020);国家社会科学基金(15BTQ054,12&ZD220)资助
论文部分内容阅读
大数据时代的到来催生了一门新的学科——数据科学。首先,探讨了数据科学的内涵、发展简史、学科地位及知识体系等基本问题,并提出了专业数据科学与专业中的数据科学之间的区别与联系。其次,分析现阶段数据科学的研究特点,并分别提出了专业数据科学、专业中的数据科学及大数据生态系统中的相对热门话题。接着,探讨了数据科学研究中的10个争议及挑战:思维模式的转变(知识范式还是数据范式)、对数据的认识(主动属性还是被动属性)、对智能的认识(更好的算法还是更多的数据)、主要瓶颈(数据密集型还是计算密集型)、数据准备(数据预处理还是数据加工)、服务质量(精准度还是用户体验)、数据分析(解释性分析还是预测性分析)、算法评价(复杂度还是扩展性)、研究范式(第三范式还是第四范式)、人才培养(数据工程师还是数据科学家)。然后,提出了数据科学研究的10个发展趋势:预测模型及相关分析的重视,模型集成及元分析的兴起,数据在先、模式在后或无模式的出现,数据一致性及现实主义的回归,多副本技术及靠近数据原则的广泛应用,多样化技术及一体化应用并存,简单计算及实用主义占据主导地位,数据产品开发及数据科学的嵌入式应用,专家余及公众数据科学的兴起,数据科学家与人才培养的探讨。最后,结合文中工作,对数据科学研究者给出了几点建议和注意事项。
其他文献
为提高果园风送式喷雾机的作业性能,设计了一种采用蠕动泵和静态混合器进行农药精量控制的实时混药系统。运用FLUENT软件,采用SIMPLEC算法对SK、SX和SD型3种静态混合器进行模
繁盛于南朝时期的江南吴歌是中国文学史上的艺术瑰宝,《乌夜啼》便是江南吴歌中最有代表性的歌曲曲牌之一。李白、李煜和陆游都曾以《乌夜啼》曲牌写过诗句,其中最经典的是李
目的:调查五年制高职护生对老年人态度和老化知识认知以及从事老年护理意愿的现状,并分析其影响因素,为老年护理专业教育提供参考。方法:量性研究:采取分层随机抽样法,抽取某高
食物过敏是儿童常见的过敏性疾病,发病率逐年增高,故其诊断尤为重要,目前诊断方法包括皮肤点刺试验,特异性IgE检测,组分过敏原测试及过敏原激发试验,本文对上述试验方法进行
本文简要地对带式输送机的心脏即托辊的结构特点进行了分析,提出了改进托辊内部结构的技术方案。改进后托辊的使用寿命大大的提高,降低了带式输送机的运行成本,提高了声场效
食物变态反应是临床上最常见、最重要的变态反应疾病之一。其发病机制主要为IgE介导的Ⅰ型变态反应,Ⅱ、Ⅲ、Ⅳ型亦均可涉及。临床表现可分为速发型和迟发型两型,其中速发型
《汗水》是佐拉·尼尔·赫斯顿早期的一则优秀短篇小说,作品描述了一对黑人夫妇之间的冲突。小说不仅叙述了在父权社会统治下一位黑人女性的自我觉醒、反抗和胜利,更加反映了
随着国民经济的不断增长,科学技术的不断创新,我国装备制造业发展得到了质的飞跃。基于低碳经济理念下,要想确保我国装备制造业稳定持续地发展,创造出更多的社会经济效益,企
目的:探讨使用多素茶碱片联合噻托溴铵粉治疗慢性阻塞性肺疾病对改善患者肺功能的效果。方法:将2017年5月至2018年7月期间重庆市合川区人民医院收治的77例慢性阻塞性肺疾病患
目的:通过对中药保留灌肠治疗急性胰腺炎随机对照试验(RCT)进行临床疗效评价,客观的评价中药保留灌肠在急性胰腺炎治疗上的优势,为中医药治疗急性胰腺炎提供循证医学证据。将