【摘 要】
:
为了解决具有不完备、分类型矩阵数据集的聚类问题,同时考虑样本和类簇间的不确定关系,提出了一种面向不完备分类型矩阵数据的集对k-modes聚类算法.首先,基于集对信息粒的相
【机 构】
:
华北理工大学 理学院,河北 唐山063210;河北省数据科学与应用重点实验室,河北 唐山063210;华北理工大学 理学院,河北 唐山063210;华北理工大学 迁安学院,河北 唐山063210
论文部分内容阅读
为了解决具有不完备、分类型矩阵数据集的聚类问题,同时考虑样本和类簇间的不确定关系,提出了一种面向不完备分类型矩阵数据的集对k-modes聚类算法.首先,基于集对信息粒的相关理论,定义了不完备矩阵样本间的集对距离度量方法;其次,考虑样本和类簇间的不确定关系,给出了类内平均距离的定义和判断样本是否属于多个类簇的阈值计算公式,进而形成包含正同域,边界域和负反域的集对聚类结果;最后,通过选取的3个矩阵数据集与四个对比算法进行实验评价,实验结果表明集对k-modes聚类算法可以有效处理不完备分类型矩阵数据集,并且在准确率、召回率、调整兰德系数和标准化互信息等指标上均有良好的聚类性能.
其他文献
以高效率调度车间作业程序为目标,提出基于改进布谷鸟搜索算法的车间作业调度优化算法.首先构建车间作业调度优化数学模型,设置约束条件,根据约束条件,将加工耗时最短的目标
对复杂问题的处理一直是开放域问答(Open Domain Question Answering,ODQA)的一个难点,回答复杂问题需要分析问题及其相关的词法、句法和语义内容,该过程需要同时建模命名实
引文推荐旨在根据指定查询信息从海量数据中挖掘出与之最相关的若干文献,是一件有重要意义且极具挑战性的工作.引文推荐不但与文献的内容相关,文献间的引文关系、文献和出版社关系、文献和作者关系等,在引文推荐中也起重要作用.本文提出一种基于异质信息网络表示学习的引文推荐算法.首先,利用文献的内容信息,以及文献中的不同类型节点之间的相互关系构建异质信息网络;接着,对每个论文节点进行采样,对其先后进行元路径游走和随机游走,生成混合随机游走序列;最后,使用skip-gram模型获得节点的嵌入向量,计算相似性获得相应的文献
研究建立了苯系物7种组分(苯、甲苯、乙苯、对二甲苯、间二甲苯、邻二甲苯、苯乙烯)及内标氟苯的气相色谱-三重四极杆串联质谱仪分析方法的多级反应监测(MRM)模式。在确定前级离子的条件下,采用产物离子扫描模式对苯系物的定性及定量产物离子进行筛选,并对各离子对的碰撞能量进行优化,得到了丰度较高、特异性好的产物离子及最适碰撞能量。优化得到的MRM模式对苯系物进行分析时,具有较高的灵敏度和稳定性,能更准确地对苯系物进行定性及定量,为今后开发复杂基质中苯系物残留的日常检测方法奠定了基础。
目前,汉语并列结构的研究对标注语料的依赖较强,无法利用未标注语料中的语义信息,且未引入半监督学习方法.该文以条件随机场为基本框架,提出了一种基于半监督学习的并列结构
旨在明确塔里木裂腹鱼体长、体质量的关系,为塔里木裂腹鱼的合理利用及保护提供理论支持。本文根据2018年5月塔里木河流域拖网调查资料,在实验室中收集塔里木裂腹鱼体长、体质量数据,运用预报性回归法拟合体长-体质量幂函数表达式,并进一步计算肥满度,分析雌、雄两个群体间差异的显著性。结果显示:雌性群体体长、体质量均小于雄性群体,且两个群体体长分布均符合正态分布,两个群体之间差异不显著,运用Fulton状态指数K表示塔里木裂腹鱼肥满度,雄性肥满度高于雌性,且两者之间差异显著,塔里木裂腹鱼的体长、性别与肥满度之间的相
工业革命以来,由于人类生产活动影响的急剧增加,水生生态系统富营养化状况加剧,与富营养化密切相关的赤潮在世界范围内频发,其已然成为了一种全球性的海洋灾害问题。赤潮的发生会破坏海洋生态系统,并且对水产养殖业构成极大的威胁。尽管目前已有物理和化学方法用于赤潮的治理,但是其投入成本巨大,且可能会对环境造成不利的影响,因此,迫切需要寻找更有效的方法来预防赤潮的发生和减少赤潮带来的不利影响。研究发现,某些细菌具有抑制藻类生长甚至杀死藻类的功能,在防治赤潮方面表现出巨大的潜力。近年来,越来越多具有杀藻功能的细菌被分离鉴
利用负压供水装置,研究不同负压灌溉对茄子养分吸收、土壤有效养分含量和土壤酶活性的影响,以期筛选出适宜茄子生长的供水压力。在遮雨大棚内采用盆栽试验,供试土壤为草甸黑钙土,试验设3个不同供水压力(-3、-8、-15 kPa)及人工浇水(CK)共4个处理,在生育期测定茄子植株氮、磷、钾养分吸收量、土壤有效养分含量及土壤酶活性。结果表明:与CK处理相比,-3 kPa供水压力能显著提高茄子茎、叶和果实器官中氮、磷、钾的吸收量,促进了氮、磷、钾向果实中转移,有利于产量提高;与CK处理相比,-3 kPa供水压力下,茄子
【目的】开展水稻种子TTC染色试验条件及最佳组合筛选,探讨水稻种子萌发过程中主要生理指标的变化规律,对于完善水稻种子质量检测具有重要指导意义。【方法】应用单因素试验和正交试验设计比较种子吸水时间、TTC浓度、染色温度和染色时间4个因素对染色效果的影响,并筛选最佳的TTC染色试验组合;应用分光光度法测定不同萌发条件下水稻种胚内的淀粉酶活性和可溶性糖含量。【结果】被TTC染色的水稻种胚分为5种情况:整个胚染色较深,整个胚染色较浅,胚根被染色,胚芽被染色,盾片被染色。4个因素对水稻种子生活力的影响依次为:染色时
蛋氨酸是畜禽必需的含硫氨基酸,可参与机体内众多代谢途径。本文就近年来国内、外蛋氨酸在畜禽营养上的研究与应用进行综述,介绍了蛋氨酸从体外摄入到体内分解的过程,不同蛋氨酸来源及其生物学效价对比,总结了蛋氨酸在生长性能、抗氧化功能、脂质代谢等方面的新研究,以及蛋氨酸与其他物质的互作关系,为蛋氨酸在家禽养殖上的实际应用提供参考。