基于改进GSDMM聚类模型的机器人文献主题划分研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:singleitol
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,深入挖掘数据信息,研究领域未来技术的发展已成为辅助咨询研究的重要手段。近年来,全球机器人市场飞速壮大,其相关研究与应用领域不断拓展和深化,市场需求巨大,已成为国民经济的发展重点。因此,对机器人技术进行数据分析与技术预见是保证其科学发展的一个重要环节。针对文本主题划分过程中,基于引文聚类等传统方法中存在的时滞性、欠完备性、文献主题复杂、文献主题个数难以确定等特点,通过对机器人主题划分需求的研究,构建了基于机器人文献数据的大规模文本主题划分系统方案。其中建立合适的机器学习模型以获得准确的聚类结果是研究的重点。将基于折叠吉布斯采样算法的狄利克雷多项式混合模型(GSDMM)引入文献主题划分过程中,并针对其分类准确率不高、分类性能不好、无法引入先验知识等限制,通过在GSDMM模型中添加文本类别标签信息约束,对其进行了改进,提出了一种新型的附加类别标签的GSDMM半监督文本聚类模型,有效提高了模型性能。设计模型效果验证实验,比较改进前后GSDMM算法效果,证明了算法改进的有效性。设计对比实验,将基准聚类算法K-means等和GSDMM模型进行实验比较,证明了使用GSDMM进行机器人文献主题划分方案的可靠性。基于以上研究,获取大规模机器人领域文献数据,实现了机器人文献技术领域划分,为机器人领域相关工程科技战略研究提供支持。
其他文献
确定合理的融资结构,使风险企业市场价值最大化是风险企业融资策略的关键。而合理的报酬率制定方案,既能很好地吸引投资者,又能有效地排除模仿企业。本文结合风险企业产品周
采用热处理温度为160,180,200℃,热处理时间为2,4,6 h的高温热处理工艺对毛竹Phyllostachys edulis竹材进行改性处理,分析不同热处理工艺对竹材化学成分和力学性能的影响,将
本研究采用实验研究的方法,探讨了不同亚类型的汉语发展性阅读障碍儿童在视觉短时记忆上的特点,分别从不同的材料难度和目标刺激呈现时间上对各阅读障碍组与正常组的短时记忆
<史记>的大结构具有四个特点:一、<史记>五个部分不是对等平列的,而是具有不同的功能,相互间不能替代;二、<史记>五个部分相互配合,共同构成一个整体系统;三、任何一个具体篇
目的通过中医导引养生处方对老年女性腰痛的干预,评价疗效并探讨相关机制。方法采集北京市某社区患腰痛老年女性60例,随机分为治疗组和对照组,其中治疗组40例,进行16周的中医
在高等数学观点下,可以编制出更有深度的高中数学试题,如利用积分中值定理即可命制一类数列型的试题.此类试题具有较大的难度、较高的区分度,适合作为高考或模拟考试的压轴试
本文叙述分析1807-1850年间在中国及"南洋"华人地区的新教传教士从事汉英翻译活动的情况,认为传教士翻译中国文献的动机主要有:一、介绍儒家学说以让西方了解中国文化的根基,
抗日战争时期,山西是敌后抗战的主战场,八路军以山西为中心,开辟了晋察冀、晋绥、晋冀鲁豫三大敌后抗日根据地,领导人民与日本帝国主义进行浴血奋战。在创建和巩固抗日根据地的过
轻度智障儿童的数学学习必须以学生已有知识与生活经验为基础,将静态的知识建立在动态的思考之上,将抽象的数学结论建立在具体的感知之上。本文试图通过对教学情境的理性思考
小柴胡汤乃《伤寒论》少阳证主方,其应用范围极广,笔者使用该方治疗痤疮、黄褐斑、斑秃、荨麻疹、神经性皮炎、慢性湿疹、外阴瘙痒症、慢性前列腺炎、口腔溃疡等病疗效明确,