论文部分内容阅读
近几年随着健康产业的发展,健康管理中心信息化建设也在稳步的发展,早在几年前健康产业就开始了采用计算机以及相应的信息技术进行管理和运营,由此积累了大量的数据资料,而健康管理中心所采集的基础数据也正在以一个空前的速度在增长,但我们从这巨大的"数据海"里发现的知识都是有限的.本文将探讨数据挖掘在健康管理领域的应用,如何利用数据挖掘技术从海量的数据中获取有价值的知识和规则.文章阐述了数据挖掘技术在国内的现状,介绍了健康体检信息的特点,模式的多态性、不完整性、时序性、冗余性以及隐私性。健康体检信息挖掘具有效率性、知识的准确性和可靠性、数据标准化等特征,可采用人工神经网络算法、决策树方法、关联规则方法实现,其可自动预测疾病趋势和行为,并可运用到疾病预测和分析中。健康体检数据的特征使得其数据挖掘与常规的数据挖掘之间存在较大的差异,但其仍遵循一般的知识发现过程,即理解应用领域、理解数据、准备数据、数据挖掘、评估所得到的知识、应用所发现的知识。