一类随机截尾Simmons模型及基于一种模糊均值算法识别分类的应用

来源 :中国集体经济·中 | 被引量 : 0次 | 上传用户:itismewhq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:文章在随机截尾模型基础上建立了一种随机截尾的Simmons模型,讨论了有限总体下敏感性问题的抽样调查方法,以及利用这种方法所得出的估计量,并给出了无偏与方差估计量公式。还提出了一种模糊均值算法,更加有效地对训练样本进行比较准确模糊分类。
  关键词:Simmons模型;抽样调查;估计;模糊均值算法
  
  一、随机截尾的Simmons模型
  
  (一)背景与目的
  被测试者对于样本特征有着较大的敏感性,为使之更好地配合如实提供特征信息,可以建立一种随机截尾的Simmons模型,即在随机截尾模型基础上增加一个装置产生服从均匀分布的随机变量。正是这一装置“滤去”了被测试者的敏感性,从而可以准确地估计出特征向量(体重,腰围)的估计平均值。
  (二)假设与约定
  第一,x=(x1,x2)T为样本体重与腰围特征向量。x1=(x11,x21,…,xn1),Xi1为第i个女生ai体重数据;x2=(x12,x22,…,xn2)T,Xi2为第i个女生ai腰围数据;X(i)=(xi1,xi2)T为ai的两特征向量,(i=1,2,…n)。
  第二,假设xi1∈[42,63] [c1,c1+t1](千克),xi2∈[16,27] [c2,c2+t2](市寸),(i=1,2,…n)。
  第三,假设样本x(1 ),x(2),…,X(n)相互独立同分布,f(x)=f(x1,x2)为x=(x1,x2)的概率密度,f1(x),f2(x)为相应边际密度,μ=(μ1,μ2)为x=(x1,x2)的数学期望。
  第四,在测试实验中的两次抽卡所显示的数字Y,Z分别为服从[c1,c1+t1],[c2,c2+t2]上的均匀分布。
  第五,已知样本容量n=20。
  (三)实验步骤
  第一,取3个空盒。
  1号盒子放入红、白、黑、绿4种色小球,放入比例为1:1: (0<p<1);2号放入22张卡片,卡片上标有重数据42、43、…、63;3号放入12张卡片标上腰围数据16、17、…、27。将3个盒子分别摇匀。
  第二,每位被测试者有放回地先从1号盒摸取一小球,并作答:
  取到红、白、黑球分别作答1、0、,取到绿球则转到下一步。
  第三,取到绿球者接着一次性从2号盒抽取两张卡片再放回摇匀,将该两张卡片上的数字Yi1、Zi1与自身的特征数据Xi1作比较,并作答:
  若Xi1>max{Yi1,Zi1},作答1;若min{Yi1,Zi1}≤Xi1≤max{Yi1,Zi1};作答0;若Xi1<min{Yi1,Zi1},作答-1。作答完毕最后从3号盒一次性抽取两张卡片再放回摇匀,将该两张卡片上的数字Yi2、Zi2与自身的特征数据Xi2做比较,并做类似回答。
  第四,记被测试者从1号盒子摸取小球、从2号盒子抽取卡片、从3号盒子抽取卡片时的作答值分别为βi,αi1,αi2。
  对X1,X2均沿用数据βi,则最后得到的数据记为γi1,γi2,(i=1,2,…n)。
  (四)模型的建立与分析
  由上面实验结果有:
  aij=1,xij>max{Yij,Zij}0,min{Yij,Zij}≤Xij≤max{Yi1,Zi1}-1,Xij<min{Yij,Zij}
  βi=1,红球0,白球-1,黑球,(i=1,2,…n;j=1,2)
  分别求解μ1,μ2的无偏估计与方差估计之表达式:
  第一,μj的无偏估计表达式:(j=1,2):
  本均值为:
  γj=γij①
  μj的无偏估计:
  j=cj+ ②
  第二,通过γij的方差求得μj的方差估计表达式(j=1,2):
  估计量μj的方差:Var(μj)= + 于是μj的方差估计为:
  Var( j)= + ③
  (五)数据统计与结果
  从上面可以看出,Var( j)关于p单调递增,综合考虑取p=0.4,则在1号盒子中放入30个小球:白球4,红球4,黑球4,绿球18。
  通过测试实验得到以下样本数据(见表1):
  βi所在列为空白说明取球者αi摸取的球为绿色。
  根据表1的数据及①、②、③式可求得所要考察的两特征估计值。
  样本均值:γ1= ,γ2=0
  无偏估计: 1=54.83 2=22.00
  方差估计:Var( 1)=13.54,Var( 2)=4.50
  
  二、基于一种模糊均值算法的识别分类
  
  所要识别的为参加测试男生“偏胖”、“中等”与“偏瘦”。算法给出了各男生所属类别的模糊矩阵,在此基础上构造出模糊集并进行了知识推理。
  记号:第一,X={x1,x2,…,xn},xk为第k名男生ak体重,k=1,2,…,n;第二,论域A={[z1,z2),[z2,z3),[z3,z4],(z4,z5]}为体重区间集合z1=48,z2=53,z3=58,z4=63,z5=69;第三,识别类集合Ω={C1,C2,…,Cm},m为识别的模式类个数;第四,类中心集合W={y1,y2,…,ym},yi为Ci类中心,i=1,2,…,m;第五,模糊矩阵,U=[uij]m×n第i行j列元素uij为aj属于类Ci的隶属度;第六,m=3,n=20,分别表示模糊集偏胖、中等与偏瘦。现有测得样本数据(见表2):
  (一)模糊均值算法
  1、算法依据
  构造加权指数函数:L(U,W)=(uik)t|xk-yi|2,使得L(U,W)取最小。应用Lagrange乘子法可得:
  定理:L(U,W)局部取最小的充要条件(对所有的1≤l≤m,1≤k≤n,xk≠yl):
  uij=
  yi=
  2、算法步骤
  第一,对数据集X={x1,x2,…,xn},任意给定初始模糊矩阵U(0 )=[uij(0 )]m×n;第二,计算均值yi(s )= ,s为叠代次数(1≤i≤m,s=0,1,2,…);第三,U(s )=[uij(s )]m×n替代为U(s+1 )=[uij(s+1 )]m×nuij(s+1 )= ;第四,任意给定正数ε(0<ε<0.5),若||U (s+1)-U (s) ||{uij(s+1 )-uij(s )}<ε则停止算法,否则令s=s+1返回至第二步骤。
  3、算法实现与分析
  第一,算法实现。
  对表2中的数据,事先任意给定初始矩阵:U (0 )=[uij(0)]m×n
  U (0)=
  取t=2,ε=0.4,算法终止于s=1,有U (1 )-U (0 )=0.38<ε且最终矩阵为:U (1 )=[uij (1 )]m×n为:
  U (1)=
  第二,结果分析。
  比较U (0 )与U (1 )中各元素(隶属度),第14、16、20列变化较显著(见表3):
  uij(s )为aj属于类Ci的隶属度(s=0,1;1≤m≤3;1≤j≤20)。
  从表3可看出:a16与a20在事先基本上将之分类于c3(偏瘦)或者c2(中等),算法实现后a16与a20明显识别为c3(偏瘦);对于a14则识别结果不同,由原来属于类c2变成现在的c3类。
  由表2中可知,a16、a20、a14所对应的x16、x20、x14分别为48.8、48.8、53.8都小于均值58.22(千克),三者应该分类为c3(偏瘦),识别结果是恰当的。
  如果将ε=(0.4)取到更小,则经过这一模糊均值算法,其结果更为准确。
  
  参考文献:
  1、徐春梅,吕恕.改进的随机截尾模型[J].统计与信息论坛,2006(2).
  2、赵晔,檀亦丽,万星火.沃纳模型在大学生敏感性问题调查中的应用[J].石家庄铁道学院学报,2005(4).
  3、陈根龙.随机化回答技术在敏感性问题调查中的一种新应用[J].统计与决策,2007(3).
  4、诸克军,苏顺华,黎金玲.模糊C-均值中的最优聚类与最佳聚类数[J].系统工程理论与实践,2005(3).
  5、王元珍,王健,李晨阳.一种改进的模糊聚类算法[J].华中科技大学学报,2005(2).
  6、刘蕊洁,张金波,刘锐.模糊c均值聚类算法[J].重庆工学院学报,2008(2).
  (作者单位:余喜生,西南财经大学数学学院;余炳红,江西省鄱阳县四十里街第二中学)
  
  注:“本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。”
其他文献
摘要:Web数据挖掘是数据挖掘领域中一个新兴方向。文章介绍了Web数据挖掘的概念、流程,融合前人的众多研究,重点分析了Web数據挖掘的分类及其功能,并对其未来的发展提出了自己的看法。  关键词:Web;数据挖掘;内容挖掘;结构挖掘;使用挖掘;应用    一、引言    相对于传统数据挖掘中结构化的数据,Web上的数据是半结构化或非结构化的。由于半结构化和非结构化的信息用数据模型不能清楚地表示,We
期刊
摘要:建设信访“绿色通道”,打造“民意直通车”,是信访工作思路、工作方法、工作机制的大胆创新,它通过切实帮助群众解决实际问题,有效化解社会矛盾,增强了群众对党委政府的信任度,密切了党群干群关系,体现了党构建社会主义和谐社会的执政理念。  关键词:信访;绿色通道;党群、干群关系    当前我国改革发展处在关键时期,党和政府更加关注与人民群众保持密切的联系,将“知群众之所想,急群  众之所急,务群众之
期刊
摘要:聊城市每年的“五一”、“十一”举行的“江北水城文化旅游节”,特别是期间举办的国内、国际龙舟赛、滑水表演、摩托艇表演等,不仅丰富了聊城人民的精神文化生活,也极大地提高了聊城市在国内外的知名度和影响力;而且能够有力地促进聊城对外开放,带动和加快聊城经济和其他社会事业的全面、快速发展。  关键词:聊城经济;新契机    一、第十一届全国运动会和聊城市之间的联系    2009年十月的全国第十一届全
期刊
摘要:文章在对我国传统市场营销专业教育现状进行分析的基础上,结合地方区域经济的特点,提出了分方向教学的人才培养模式,并进行了例证。  关键词:区域经济;市场营销;分方向;教学模式    市场营销作为一门以经济科学、行为科学和管理科学为基础,以研究满足市场需求为中心的营销活动及其规律性的应用科学,当前在我国经济发展中的地位越发显得重要。现代营销理论的深化和拓展以及市场营销专业的蓬勃发展,对于培养21
期刊
摘要:文章首先介绍了建立数学模型的基本步骤与方法,通过具体实例讨论了Matlab在数学建模中的应用。将Matlab应用在数学建模中,可以非常方便地求解模型,从而提高了数学建模的效率与质量。  关键词:数学建模;Matlab    近几十年来,数学科学迅速向自然科学、工程、经济、管理和社会科学等各个领域渗透,在许多方面发挥着越来越重要的作用,在很多情况下起着举足轻重、甚至决定性的作用;数学建模和与之
期刊
陈海秋(译)    阿伦·格林斯潘认为目前的房地产市场存在着一定泡沫——几年前他也曾指责与高科技相关的证券市场存在着“非理性的增长”。联想到1997年底到2000年3月,纽约股市的市值增加了5.5万亿美元,其中11只最主要的科技股占了增加额的一半。2001年3月14日,道琼斯工业指数开始跌破10000点,达到13年来的最低,纳斯达克已由5000多点跌到2000点以下,接着又跌到1700点以下,损失
期刊
摘要:文章利用协整检验和Granger因果检验对FDI与我国服务贸易竞争力之间的关系进行了探究,研究结果表明FDI降低了我国的服务贸易竞争力,而服务贸易竞争力不影响我国FDI的流入。  关键词:FDI;服务贸易竞争力;单位根检验;协整检验;Granger因果检验    一、引言    改革开放以来,虽然我国服务贸易发展较快,但整体发展水平仍然较低。2006年我国服务贸易进出口总额为1917亿美元,
期刊
摘要:针对商业领域日益出现的品牌信任危机,文章从商业心理学角度分析品牌信任危机的心理基础,以及企业应如何遵循和利用心理学规律避免品牌信任危机的出现,妥善处理危机爆发后的消费者信心恢复问题。  关键词:信任危机;情感;态度转变;知觉恒常性;晕轮效应    一、关于品牌信任危机    就在一个被国人引以为傲的民族品牌——康师傅因虚假广告宣传,陷入“水源门”事件被业界闹得沸沸扬扬之时,乳业也被舆论推上了
期刊
摘要:我国传统的法学教育模式一直以来过于强调法学知识的灌输与纯理论的探讨,而往往忽视了学生的分析及处理实际法律案件和法律纠纷能力的培养,这有违于法学教育的培养目标和模式的要求。改革开放以来,我国的法学教育在认真总结经验的同时,也大量借鉴了国外法学教育的有益经验。文章从“模拟法庭”教学形式设置的优势、发展状况及发展前景等方面,力求对弥补我国传统法学教育中法学技术能力训练和培养的不足进行探讨。  关键
期刊
摘要:在人力资源管理中,管理者常常被人员配置问题所困扰,如何才能达到人力资源的合理配置,充分发挥出人才的能力,是人力资源管理中研究的重要问题。文章就对人力资源的合理配置问题进行论述,从知人善用、适人适位的角度出发,寻求解决人力资源配置问题的途径。  关键词:人力资源;合理配置;知人善用;适人适位    如何用人之所长,最大化地发挥人力资源效用,是人力资源管理的核心问题,也是企业成功的关键条件。而解
期刊