基于信息熵的粗糙集属性应急数据去重挖掘算法研究

来源 :计算技术与自动化 | 被引量 : 0次 | 上传用户:fxh722744
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集属性应急数据存在冗余特征,降低挖掘效率,提出基于信息熵的粗糙集属性应急数据去重挖掘算法.将粗糙集理论和信息熵相结合,离散化处理应急数据,离散化完成后,约简对于决策表的条件信息熵大小不产生任何影响的属性,设定决策属性集合和条件属性集合,选取将同约简属性集合B的属性组合数目最小的熵值实现约简,去除冗余特征,完成应急数据去重挖掘.以大型船舶应急数据为研究对象展开数据去重挖掘,结果表明:可有效去重挖掘到船舶旋回性相关应急数据,利用数据增比特征能够分析到各因素对船舶旋回性的影响,并且所研究算法的挖掘效率较高,在数据量为1400条时,耗时仅为0.33 s.
其他文献
针对动力定位系统数学模型不够精确,而且具有很强的非线性特性问题,采用自抗扰控制算法设计其控制器.该控制算法无需精确的数学模型,主要利用扩张状态观测器估计船舶运动位置、速度和总扰动,最后通过反馈控制对其进行补偿,从而实现船舶动力定位的精确控制.但实际工程中,船舶的测量系统的测量噪声是难以避免的,为了避免测量噪声的影响,针对所设计的扩张状态观测器采用FA L函数滤波器,在测量信号进入扩张状态观测器之前进行滤波,以减小测量噪声的影响.从而使得其反馈控制更加精确.最后以一艘供给船为例进行仿真分析,验证了所设计非线
对于采用BT T控制策略的滑翔炸弹这一复杂非线性系统,经过线性化处理后运用分通道设计的思路,来分别对俯仰偏航双通道进行设计.首先描述了其动力学模型,在对该模型分析的基础上,提出了添加混沌扰动的改进天牛须搜索算法,在每次迭代过程中对步长进行了自适应的动态调整,从而设计了基于此算法优化的LQR控制器.经Simulink仿真后对结果进行分析,改进优化算法其优化结果可以更好的跳出局部最优点,且在不同马赫数下设计的控制器都可以较好的满足系统的输出要求,同时也克服了以往经验试凑参数的非通用弊端,从而更好的满足在线调节
研究了一种基于Bézier曲线的碰撞角约束的制导律.通过模型转化将制导指令设计的问题转化为二次Bézier曲线形式的航迹角设计问题.首先,利用Bézier曲线的性质设计了导弹速度大小不变的制导律;然后进一步对导弹速度时变的末端角度约束的制导律进行了研究,同时对导弹速度时变情形下的剩余飞行时间进行了估计;最后通过不同情况下的数值仿真,验证了所提出的制导律的有效性.
针对传统的通用飞机铅酸蓄电池测试方法精度低、工序繁杂等问题,提出了基于LabVIEW的通用飞机铅酸蓄电池测试系统设计方案.通过不同传感器多点采集蓄电池信息,利用独立式采集卡与工控机,实现对蓄电池充放电数据采集和处理.利用LabVIEW软件,完成模块驱动程序的设计,通过记录分析电压、电流等数据的变化,可以图形化直观展示蓄电池的工作状况,实现对蓄电池的自动精确测试,提高了测试效率和精度.
以机器人上下料工作站为研究对象,针对其轨迹优化和自动化生产协调之间难度大的问题,提出了利用RobotStudio仿真软件进行机器人上下料工作站的离线编程和动态模拟.给出了工作站的结构布局及上下料平台的Smart组件设计,结合机器人离线编程对工作站进行了仿真调试.在此基础上,设计出实际的模拟机器人上下料工作站,工作站由双爪机器人、供料单元、机床卡盘、立体仓库及主控PLC等组成.给出了工作站主控系统架构和设备间的通信方式,将仿真工作站的程序导入实际工作站进行设备调试.这种由虚拟仿真到实际设计制造的方式,大大缩
可再生能源具有随机性和间歇性的特点,然而随着分布式电网的渗透率不断提高,其并网也给传统电网带来了可靠性降低、双向潮流、电能质量恶化等问题,传统电网的被动调压策略已难以为继.主动配电网能支撑分布式电源的消纳,通过有载分接开关(OLTC)协调可实现电压控制.本文旨在阐述基于OLTC协调的主动配电网控制研究,先说明OLTC调压对功率的影响,介绍各传统电网调压方法,并指出了各方法的弊端.再阐述基于OLTC调压的主动配电网电压控制方案,最后对该领域进行了展望和总结.
设计了一种基于决策树算法的N1+N2结构语法关系判定方法.首先建立了该结构的语料库,对每条语料都标注构建特征集所需的词性、《同义词词林》语义编码、语法关系和词义相似度等信息;然后为证明相似度在判断语法关系中的合理性,根据语言学原理研究了N1+N2结构两个名词间语义相似度与语法关系之间的内在规律:①从语法关系的角度比较两个名词间的语义相似度结果为:并列关系>复指关系>定中关系>主谓关系;②从语言功能焦点的角度比较两个名词间的语义相似度结果为:并焦型短语>后焦型短语.最后以此为基础构建了特征集,运用决策树C4
多元线性回归模型通常用来研究一个因变量依赖多个解释变量的变化关系,但它有一个前提条件就是解释变量之间不存在相关关系.在实际的应用中,特别是计量经济学中,解释变量之间一般都存在有高度相关关系或近似相关关系,从而使得模型估计不准确.为此,通过协方差计算变换矩阵,提供一种变换矩阵消除随机变量之间相关关系的方法,通过spss25进行实证分析,最后发现通过矩阵变换变换后的数据t检验的显著性值明显降低.
针对传统三维地形生成算法在生成大规模地形数据时用时较多的问题,提出了一种结合双线性插值和Perlin Noise的地形生成算法.该方法首先将初始地形数据进行扩展,之后利用双线性插值和Perlin Noise进行地形细节生成.该方法能够有效降低生成大规模地形数据时的时间,并且该算法还可利用低分率地形数据生成高分辨率地形数据.
为提高火车票识别精度和效率,将图像处理技术和BP神经网络结合,提出了一种基于图像处理和BP神经网络的火车票号识别算法.首先,通过图像预处理、目标区域的定位、二值化、倾斜校正和字符分割,提取火车票的身份证号码特征信息,建立特征信息库;之后,将特征信息库作为BP神经网络的输入,数字和字符类别作为BP神经网络的输出,建立BP神经网络的火车票号识别模型.研究结果表明,与模板匹配和SVM相比,提出的方法可以有效提高火车票号的识别精度和效率,识别精度高达97.7%,从而为火车票号识别提供新的方法.