混合属性数据集分布一致性度量的新方法

来源 :深圳大学学报:理工版 | 被引量 : 0次 | 上传用户:artec1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据分布一致性的度量是大数据随机样本划分生成过程中的一个关键问题,如何针对混合属性的数据集进行合理有效的分布一致性度量是目前随机样本划分技术研究的重点.提出一种新的基于深度编码和最大平均差异的混合属性数据集分布一致性度量方法,不直接对两个不同的原始数据集进行分布一致性的度量,而是首先对混合属性中的离散属性进行独热编码,得到独热编码数据集;之后对独热编码数据集进行自编码处理,得到深度编码数据集;最后基于最大均值差异指标对两个不同的深度编码数据集进行分布一致性的度量.在Adult、Australian、CRX
其他文献
背景与目的:溶质载体家族6成员3(solute carrier family 6 member 3,SLC6A3)在肾透明细胞癌患者中呈高表达,但SLC6A3对肾透明细胞癌细胞转移的影响及分子机制尚不明确。探讨S
为分析玄武岩纤维对水泥土抗渗性能的影响,在水泥土中掺入质量分数分别为0、0.5%、1.0%和1.5%的玄武岩纤维,通过渗透性试验和抗氯离子渗透性试验得到玄武岩纤维水泥土的渗透
目的观察虚拟现实技术在肝胆胰外科术后患者疼痛控制中的效果。方法将102例患者按患者自身意愿分为对照组51例及观察组51例。对照组采用传统疼痛控制管理,观察组采用虚拟现实
为提高材料的延展性,经常在水泥基材料中加入橡胶,但橡胶-水泥界面会产生更多的初始缺陷,由X射线微观层析成像技术得到的三维图像更加复杂,导致以全阈值法为主的传统方法不再
摘要:论著、调查与分析类文章须附中、英文摘要,专科护理、护理管理、护理教育类文章须附中文摘要。摘要必须包括目的、方法、结果(应给出主要数据)、结论四部分,采用第三人
“同课异构”从概念上理解是同一节课由不同的老师进行设计,其实质是打开教学思路,彰显教学个性,实现资源共享,优势互补。本文将“同课异构”引入到课堂教学中,首先介绍了同
随着我国计划生育政策的放开,各地政府纷纷增设幼儿园以容纳更多的学前幼儿,幼儿教师的供需出现断链局面。中职校学前教育专业就是培养幼儿教师的主要渠道之一。在培养未来幼
目的了解D型人格在2型糖尿病患者中的分布,探讨其与社会支持水平的关系。方法采用便利抽样法选取196例住院2型糖尿病患者为研究对象,采用一般资料调查表、D型人格量表、领悟
目的调查心力衰竭患者30 d内再入院的现状,分析影响因素。方法选取3129例心力衰竭患者作为调查对象,对其入院一般情况及出院出院30 d内情况进行随访调查,并应用单因素分析与L
目的通过可视化图谱挖掘国内老年康复护理的研究热点和研究趋势。方法以中国知网数据库为检索平台,运用CiteSpace软件对建库至2019年12月15日收录的老年康复护理相关文献进行