【摘 要】
:
石油工业早已进入大数据时代,数据挖掘是充分利用数据资产价值的有效途径,而数据顸处理是数据挖掘研究的热点之一。分析了数据挖掘以及数据预处理的意义及其现状,提出了在石油工
【机 构】
:
中国石油勘探开发研究院,大庆油田有限责任公司勘探开发研究院
【基金项目】
:
国家油气重大科技专项“全球剩余油气资源研究及油气资产快速评价技术”(2011ZX050)
论文部分内容阅读
石油工业早已进入大数据时代,数据挖掘是充分利用数据资产价值的有效途径,而数据顸处理是数据挖掘研究的热点之一。分析了数据挖掘以及数据预处理的意义及其现状,提出了在石油工业进行数据挖掘的基本思路;以某国际石油勘探开发技术服务与咨询公司研制的全球典型油气田数据库为例,以“采收率”为挖掘对象,详细解析了各种常用的数据挖掘预处理方法和具体做法,主要包括数据获取、属性选择、数据清理、数据集成、数据变换、数据规约和数据消密;提出了源数据的“5C”标准,即Correctness(正确性)、Currency(适时性)、Co
其他文献
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
黄土高原是中华民族的发祥地.由于自然和人为因素的影响,使其成为水土流失最严重、生态环境问题最为严峻的地区之一.笔者阐述了黄土高原的生态现状及其自然地理特征,分析了影
随着经济的发展,水下沟槽爆破已广泛应用于经济建设的多个领域。由于水下爆破的复杂性,使得水下爆破成本很高、危害难以控制。对3m水深某过江水下沟槽爆破施工的钻孔方法、孔网
随着我国信息技术的不断发展,它在农业方面的贡献日益突出。农业生产中,传统农业在技术手段与管理模式上已明显落后。农业生产在产量、规模和管理等方面具有较强的多变性与依
传统针对文本数据的分析,往往基于词频、词频逆文本统计量作为文本的表示特征.这类方法往往只反映了文本的部分信息,忽略了文本的内在语义特征.本文研究了中文词语衔接的概率
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
教科研工作是中职学校的一项重要工作内容,是提升学校竞争力,提高职业教育质量的重要途径。但中职学校存在科研意识淡薄、科研力量薄弱、科研人员工作积极性缺失、管理不到位等
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
我院自1979年9月至2003年6月共收治卵巢畸胎瘤721例,其中未成熟畸胎瘤105例,畸胎瘤恶变(MCTMT)27例,占成熟畸胎瘤的4·4%。27例MCTMT均经手术治疗和病理证实。年龄(46·6±4
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技