【摘 要】
:
类内、类间距离分布函数的研究具有重要的现实意义,本文我们主要利用参数统计的方法来确定类内、类间距离的分布函数。基于类内、类间的分布函数,我们提出了基于类内距离参数
论文部分内容阅读
类内、类间距离分布函数的研究具有重要的现实意义,本文我们主要利用参数统计的方法来确定类内、类间距离的分布函数。基于类内、类间的分布函数,我们提出了基于类内距离参数估计的文本聚类评价方法,同时确定了基于类内、类间距离比值型(ratio)指标的临界值。首先,文章研究了基于类内距离参数估计的文本聚类评价方法,发现当聚类类别数过小或与真实类别数相同时,该方法是可行的;而且它可以减弱初始类中心的选取对K-means算法的影响,提高聚类结果的准确性。其次,本文对基于类内、类间距离的比值型(ratio)指标的临界值也进行了研究,我们通过实验确定了聚类指标真实值在上、下界范围区间的位置,该位置可以作为评判基于类内、类间距离的比值型(ratio)指标好坏的依据。
其他文献
晋商的衰落大体上始于1905年开始的慈禧“新政”,急剧衰落于辛亥革命成功之后,最终在20世纪30年代湮没于历史的长河中。曾经创造了“贸易天下”、“汇通天下”和“富甲天下”辉
本文主要论述了词汇教学在大学英语中的重要地位 ,提出了加强词汇教学的具体形式和方法 ,说明只有重视词汇教学 ,并采取灵活多样的形式和方法 ,对词汇进行反复操练 ,才能有效
双鸭山市社会福利中心地处安邦大道中段、美丽的安邦河畔,依山傍水,景色秀丽,地理环境优越,交通便捷。社会福利中心是市委、市政府发展社会福利事业的一项重要民生工程.也是国家民
根据锅炉水管的腐蚀特性,提出了B超在锅炉水管检验中的实用性和优越性,并取得了较好的经济效益.
本文对钢/铝/镁复合板的制备与组织性能进行了探讨。通过热轧方法制备钢/铝/镁复合板,通过金相显微镜、显微硬度计、拉伸试验机、扫描电子显微电镜、能谱仪等试验设备对制备
凭借接近2500万辆的乘用车年销量,我国已成为全球第一大汽车市场。截止到2017年,我国汽车的保有量已到达2.09亿辆。其中,2017年二手车的年交易量为1240万辆。相比其他成熟的
在中共中央北方局的领导下,1936年8月,薄一波等开始在山西开展"特殊"形式的抗日民族统一战线工作,取得了显著成就,而抗战初期成就尤为明显。它不仅推动了华北抗战的进程,而且
从对一台DZL6.0-1.25蒸汽锅炉近前炉门附近两侧炉膛水冷壁管多次发生局部焊管事故的调查出发,对该锅炉侧集箱排污系统存在的设计缺陷进行了流动分析、计算。计算表明,排污时前
稻鳅共作,就是在稻田插秧前,整修好鱼沟鱼溜,安装围网、进排水管等防逃设施,施足底肥,耕耘好田地.水稻插秧后,每亩投放5cm左右泥鳅苗10000尾左右,利用泥鳅的杂食性吃掉稻田中