矿产资源定量评价中文本数据挖掘研究

来源 :物探化探计算技术 | 被引量 : 0次 | 上传用户:ming_yue_zhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
矿产资源定量评价工作的目的是从试验、观测、收集到的大量的各类专题数据中,提取相对应的专题信息。长期的地质工作积累了大量的原始数据,其中文本型的定性数据在地质数据中占了很大的分量,但是在常规的地质定量评价工作中针对这类数据的处理方法却很有限。文本型数据挖掘是现今数据挖掘的热点问题之一,为了充分利用前人所积累的文档报告,并有效地从中提取各类信息,这里提出了一种矿产地质数据库中文本数据挖掘的方法。在数据挖掘过程中,空间数据属性的小规模文本数据挖掘主要分四步进行,即数据挖掘相关的预处理;基于关键字的属性分解;属性归纳和关联规则分析。其中,挖掘关联规则问题可以分解为以下两个问题:1找出存在于数据库D中的所有频繁项集(或物品集)。频繁项集的支持度support应不小于用户或领域专家给定的最小支持度minsup阈值;2利用频繁项集生成强关联规则。根据定义,这些规则必须满足最小支持度minsup和最小可信度(置信度)minconf。对于每个频繁项集A,如BA,B,且Confidenceminconf,则构成关联规则B(A-B)。在文本的研究工作中开发了相应的软件系统,取得了较好的应用效果。属性数据是空间数据库的重要组成部分,它所荷载的专业方面的信息量是常规型数值数据所无法比拟的。如果能够进一步实现深层次属性数据挖掘,那么常规的信息源将得到极大的扩充,地质数据分析的层次也将会提升到一定的高度。
其他文献
语文新课标指出:写作是运用语言文字进行书面表达和交流的重要方式,是认识世界,认识自我,进行创造性表述的过程。写作教学应着重培养学生的观察能力、想象能力和表达能力,重视发展
当今社会,各种文化交融、冲击,很多人的思想、行动趋向实用、功利,知足与不知足的定位取舍,成为衡量一个人观念、人格高下的重要分水岭。在素质教育的新形势下,教学的主要目的是培
氟苯尼考是一种新型的动物专用氯霉素类广谱抗生素,在国内外畜牧业和水产养殖业中有着广泛应用。本文就氟苯尼考的理化性质、生产用途、代谢、毒性以及残留检测方法等几个方
当前中学作文教学改革已不是什么新鲜话题, 各种研究成果和实验项目层出不穷, 百花齐放, 给作文教学注入了新的活力, 推动作文教学改革不断向前发展。然而总观作文教学现状, 学生的作文构思平庸、人文苍白、文理不通、词不达意、书写潦草、应用文体格式不规范等现象,表明了学生作文从习惯到能力都还需要加强训练; 而教师的作文教学行为大多混乱无序, 训练效率低下。不断涌现的作文教法、作文科学训练法、快速作文法、
本着“让每个学生都进步,让每位家长都满意,让社会各界都认可”、“没有差生,只有差异”的原则,近几年来,我每天都在和同事们一起努力做好一件事,那就是让每个学生都学有进步,尤其是
本文以《纽约时报》为研究突破口,采用内容分析的量化研究方法,选取《纽约时报》2001-2015年的15年间342篇涉藏报道作为研究样本,基于美国学者甘姆森提出的框架理论的“界限
目的探讨关节镜下滑膜切除术联合放疗治疗膝关节弥漫性色素沉着绒毛结节性滑膜炎的临床疗效。方法选择2010年7月至2011年12月应用关节镜下滑膜切除术联合放疗治疗膝关节弥漫
本文通过文献分析和内容分析方法,对搜狐"数字之道"、网易"数读"、新华网"数据新闻"、腾讯"新闻百科"、财新网"数字说"这五大数据新闻专栏以及新浪网所制作的25篇雾霾类数据新闻进行分
叙利亚难民的重新安置问题在奥巴马政府时期引起美国媒体 和民众层面比较广泛的关注和讨论.本研究以美国国家层面的报纸《纽约 时报》和地方报《印第安纳波利斯星报》为考察
近两年,有关微商的研究逐渐增多,研究议题主要集中在现状分析、前景发展以及发展策略等宏观方面,对微观研究不足。本文以微商1在微信朋友圈的营销为研究对象,以模因理论作为