浅谈数字档案信息管理

来源 :吉林画报·教育百家 | 被引量 : 0次 | 上传用户:Toowell_Star
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  在信息化发展的今天,社会保险事业单位不仅要对信息进行简单的数字转换和管理,更要对新兴事物网络进行档案化管理和归档,包括文档、文字翻译转换、图片资料、声像资料、多媒体远程会议等。所以,网络档案化管理,已经成为当今社保信息管理的必然趋势。那么,实际管理工作中,我们应该怎样充分利用数字信息化技术来加强社保档案信息管理呢?
  首先,利用数据挖掘技术,加强数字档案信息的科学化。所谓数据挖掘(Data Mining),就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。这些数据可以是结构化的,如关系数据库中的数据,也可以是半结构化的,如文本,图形,图像数据,甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现了的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以进行数据自身的维护。数据挖掘借助了多年来数理统计技术和人工智能以及知识工程等领域的研究成果构建自己的理论体系,是涉及数据库、人工智能、数理统计、机械学、人工神经网络、可视化、并行计算等的交叉学科,是目前国际上数据库和决策支持领域的最前沿的研究方向之一。
  一.科学认识数据挖掘的功能
  数据挖掘通过预测未来趋势及行为,做出预测性的、基于知识的决策。数据挖掘的目标是从数据库中发现隐含的、有意义的知识,按其功能可分为以下几类。
  1.关联分析
  关联分析能寻找到数据库中大量数据的相关联系,常用的一种技术为关联规则和序列模式。关联规则是发现一个事物与其他事物间的相互关联性或相互依赖性。
  2.聚类
  输入的数据并无任何类型标记,聚类就是按一定的规则将数据划分为合理的集合,即将对象分组为多个类或簇,使得在同一个簇中的对象之间具有较高的相似度,而在不同簇中的对象差别很大。聚类增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。聚类技术主要包括传统的模式识别方法和数学分类学。
  3.自动预测趋势和行为
  数据挖掘自动在大型数据库中进行分类和预测,寻找预测性信息,自动地提出描述重要数据类的模型或预测未来的数据趋势,这样以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。
  4.概念描述
  对于數据库中庞杂的数据,人们期望以简洁的描述形式来描述汇集的数据集。概念描述就是对某类对象的内涵进行描述并概括出这类对象的有关特征。概念描述分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述不同类对象之间的区别。生成一个类的特征性只涉及该类对象中所有对象的共性。生成区别性描述的方法很多,如决策树方法、遗传算法等。
  5.偏差检测
  数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。偏差包括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。偏差检测的基本方法是寻找观测结果与参照值之间有意义的差别。
  二.应用数据挖掘技术,提高社保信息管理水平,为社会提供一流的服务
  1.利用Web访问信息挖掘技术发现其中的关联模式、序列模式和Web访问趋势等,构建多维视图的用户兴趣模型。从而可以确定档案信息或服务受欢迎的程度,发现用户访问模式和用户需求的趋势,从不同侧面来研究用户的信息需求,为优化档案馆的档案信息资源建设提供了科学依据。
  2.科学采集档案网web服务器保留的用户注册信息、访问记录,以及有关用户与系统交互的信息等原始数据,经过清洗、浓缩和转换形成便于统计分析的用户查阅数据库、日志数据库、用户定制信息库、用户反馈信息等各种数据集合。
  3.利用档案网和档案管理软件访问信息的挖掘分析出档案资源的利用率,将利用率高、需求量大的传统载体档案优先数字化。例如:通过对档案信息的访问记录、检索请求中用户请求失败的数据进行分析,按类统计档案拒用集和频繁利用集,结合聚集算法发现馆藏资源的缺漏,有针对性地补充和丰富档案信息资源。
  4.在社保信息档案馆藏管理过程中利用文本挖掘,运用关联、分类、聚类等方法,从海量档案信息中按照相关专题进行挖掘、分类、加工、整理和有序化重组,构建特色档案信息库及各类专题档案信息库等。
  5.社保信息档案管理工作的重点是为社会服务,为一切用户提供及时、便捷的科学而准确的信息,所以,以服务为中心开展各项工作,如何使用先进的工具,提高服务的质量就是档案信息管理工作的宗旨所在。
  总之,数据挖掘为社保信息管理工作的智能化、个性化、精品化、精细化、科学化提供了行之有效的方法。在智能检索系统可调用用户兴趣模型,自动修正检索策略并可依用户兴趣将检索结果迅速聚类和分类,并条理化地排序出来。对于热点信息、重要信息的管理,我们不仅要做到精确、精细,更要做到及时、主动,利用互联网、手机短信平台等一切先进手段主动为一切用户提供及时而必要的信息:这才算是主动服务、积极服务。
其他文献
随着经济社会的发展和网络技术的进步,网络已经成为推动社会发展不可分割的一部分,尤其是对于通信运营者而言,网络是其运营的重要条件,要想为用户提供更加优质的服务,必须要
当美酒与生态扯上关系的时候是一种怎样的渊源呢?近日,美铂枫智旗下加拿大葡萄酒品牌在北京推出Eco Trail生态足迹系列葡萄酒,主打环境保护,售出的每瓶葡萄酒,酒庄都会给加拿大自然动物保护协会捐出一加币,用于全球生态保护的研究工作。这一理念也成为美铂独到的经营理念。  加拿大南部独特气候条件造就了葡萄酒的优良品质。与意大利罗马、西班牙马德里、美国加州北部平行,加拿大多个产区地处北纬42度,完美的角
期刊
从1931年开始到1945年胜利的中国人民抗日战争, 前后坚持了14年.中国人民抵抗的, 不仅是侵略中国的日本军国主义者, 而且是日本法西斯这一人类历史上的黑暗邪恶势力.中国人民
期刊
【摘 要】不同的教学方式产生的教学效果也是完全不同的,在高中物理教学中我们主要采用的教学方式有讲授式、探究式以及自主学习式,并在这些教学方式的使用上借鉴了一些其他的因素。那么,纵观这些不同的教学方式,我们该如何正确对待呢?我想通过比较大家可以很好地看清楚它们之间的联系与区别。下面我就来具体地谈一下它们的区别。  【关键词】高中物理;课堂教学;教学方式的比较  关于高中物理的教学方式,我想每一位任课
为探究吕家坨井田地质构造格局,根据钻孔勘探资料,采用分形理论和趋势面分析方法,研究了井田7
期刊
11月1日,习近平总书记主持召开民营企业座谈会并发表重要讲话。此次座谈会无疑是中国民营经济发展史上浓墨重彩的一笔,对于全国超过2700万家民营企业和6500万户个体工商户来说意义非凡。习近平总书记提出的支持民企发展六大举措让我们深刻感受到党中央对民营企业发展的关爱,“民营企业和民营企业家都是自己人”这句话更是让我们倍感温暖,深受鼓舞。  回望改革开放40年的历程,同时也是一部民营经济的蓬勃发展史。
期刊
期刊
很多人在参观“伟大的变革——庆祝改革开放40周年大型展览”时,在贪官书写的忏悔书前议论纷纷.从中,人们既看到曾经的领导干部“犯错之多、之深、之恶劣,给党的事业带来巨大
期刊
期刊
摘 要 B2C商务网站的重要特征就是满足用户的体验需求,特别是从品牌、视觉设计、信息构建、交互反馈、安全保障、个性化等方面来满足用户评价,从而抽象出用户体验的评价维度。本文将结合相关文献研究,从B2C商务网站体现用户体验的设计思路上,围绕用户体验要求来营造更好的网站购物体验环境。  关键词 B2C 商务网站 用户体验 评价指标 构建对策  互联网技术的发展,特别是电子商务平台的成熟,为越来越多的企