铁路数据中心综合决策支持系统的设计

来源 :第六届中国Rough集与软计算学术研讨会(CRSSC2006) | 被引量 : 0次 | 上传用户:zwb19860
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国加入WTO和经济市场化的进一步深入,铁路所面临的形势越来越严峻.如何应对日益激烈的竞争,如何应对瞬息万变的市场,是铁路各级各部门决策者面临的新的挑战.传统的决策支持系统是基于模型的.经过近年来与迅速发展的数据仓库技术的结合,产生了一个新的类型:基于数据仓库的决策支持系统.数据仓库是一个以支持企业或组织的决策分析处理为目的的、面向主题的、集成的、永久的、随时间不断变化的数据集和.基于数据仓库的决策支持系统通过使用联机分析处理(OLAP)和数据挖掘技术,能够对大量的历史数据进行深层次的分析和挖掘,从中找出潜在的规律,在复杂的环境中向决策者提供决策支持. 本设计就是以铁路综合信息为数据基础,以数据仓库为基本存储架构,以数理统计和数据挖掘为核心技术,以知识库、模型库作为知识和方法存储结构的信息综合决策支持系统。
其他文献
通过对文本集的词-文档矩阵进行奇异值分解(SinguIar Value Decomposition,SVD),提取K-秩近似矩阵近似表征原词-文档矩阵,左右奇异向量分别为词向量和文档向量,在此基础上进行文本分类和其它各档处理,这就是隐含语义索引技术.本文对此问题进行了研究.该文利用查询向量和各文本向量之间的夹角余弦表示相似程度,寻找和用户查询最相似的文档集合,并按相似度的高低排列,将相似度大于用户
特征子集选择问题是指从一个给定的候选特征集合中,根据一定的评价标准,选出一个特征子集,使其能够一致地描述给定的例子集合.很明显通过特征子集选择,可以减少描述原数据集合的特征(属性)的数目,进而可以减少原数据集合的例子数.而在实际应用中,数据挖掘或模式识别所处理的对象是大型的数据库.其中每个记录都包含了许多特征(属性),由于在数据的采集过程中,可能会因为某些特征提取费用或设备和人为等原因,造成了属性
在分类问题中采用基于后验概率的支持向量机,能够得到更多的信息,也更接近真实情况,所以在实际问题中可以获得更好的分类准确性.对本文中的基于后验的支持向量机与-支持向量机的等价性问题在今后的工作中还需进一步深入研究其内在原因。
聚类特点是输入空间的样本没有理想输出,因此它属于无监督模式识别问题.对于聚类问题,就是根据样本之间的某种相似度,将比较相近的样本自组织地聚集到一类.一般聚类的目标,就是使得类内距离最小和类间距离最大.其中分级聚类和k-均值聚类是两种的比较常用聚类方法.但此两种方法各有自己的优缺点.分级聚类精度高,但由于计算复杂度太大,不适合大规模样本的聚类.K-均值聚类计算复杂度较低,但是受初始聚类中心的选择影响
蛋白质结构预测是根据氨基酸序列预测相应蛋白质空间结构,是当前分子生物学首要解决的难题,并被列为21世纪生物学的首要任务.60年代初,Anfinsen就提出了他的著名论断:蛋白质特定的空间结构是由其氨基酸排列顺序决定的,而蛋白质的天然构象是能量最低的构象.从此,利用能量极小化方法预测蛋白质结构有了合理的热力学基础.然而,由于蛋白质是一个强柔性的大分子体系,其能量表面存在着极多的局部极小点,缺少一种有
本文基于较原始的基于像数网格点信息模式匹配识别算法的基础上进行,而近年来在数字识别领域的一些新的特征提取和特征的选择方法:例如:穿越次数特征,基于笔画方向的特征,周边笔画方向特征构成周边笔画方向特征,结构特征等及多分类方法结合的方法都是我们下一步可以研究的对象.随着新特征的研究及实验本身算法的优化,我们相信其识别效率还可以有较大的提高空间。
在中国篮球职业化蓬勃发展的今天,俱乐部工作的重心之一就是对人才一运动员的管理,尽管篮球比赛中记录下了大量的第一手比赛数据,但是不同的运动员特点和个性不同,如何综合评判各个运动员的实力,无论是对俱乐部进行运动员交易,还是管理部门评价MVP都具有十分重要的经济意义和社会效益.传统的评价方法都避免不了对评价对象在阈值附近的数据评价产生跳跃式变化的不合理"59现象",一差一分59为不及格、60为及格.至于
自从W.L.Gao和D.J.Buehrer提出Vague集理论以来,该理论已在包括近似推理在内的智能系统中得到广泛的应用,Vague(值)集间的相似度量成为实现这些应用的主要工具之一.许多作者提出相似度量公式,并分别研究了它们的性质.但什么样的函数才可作为Vague(值)集间的相似度量,应该有一个统一的标准.为此给出Vague(值)集间的相似度量的公理化定义.并提出两个Vague(值)集间的新的加
数据分析旨在获取有效知识,最精简的知识基最具有研究价值.为避免获取所有约简集需要的庞大计算量,但又能得到确定的最有价值的知识基,将Rough集理论的不可区分关系和保持分类特征不变的约简理论与结构数据的特征相结合,我们得到了实用的属性约简预分析算法,因此确定数据集不可区分关系最少需要的描述属性数p0,而由启发式约简结果获得的约简集所含的应有属性数pR,确定了在相对属性全组合来说极有限的范围里进行属性
属性约简是Rough集理论研究的核心内容之一.本文从信息的角度出发,结合现有的遗传算法,提出了一种在优化各种遗传参数的基础上改进属性约简算法,在加强局部搜索能力的同时保持了该算法全局寻优的特性.通过实验对比分析表明,该算法能够有效地对决策表进行约简。