论文部分内容阅读
信息技术的发展开启大数据时代,蕴藏在海量数据中极具价值的信息需要有效获取和应用。海量数据构成复杂的系统,而复杂网络将复杂的系统问题表示成网络模型,对网络结构进行分析,正是研究复杂系统的有效方法。作为复杂网络的重要特性之一,社团结构能够促进对复杂网络的深入理解。社团结构的发现对挖掘网络中的隐藏信息具有重要意义。国家自然基金课题——基于复杂网络方法的现代名老中医诊治COPD证-方-药规律研究,主要着眼于名老中医经验的总结与传承,利用复杂网络方法对中医数据进行分析和研究,解决中医经验缺乏整理和难以总结的问题。中医理论着眼于系统因素间的联系而非独立的因素本身,与病因、病机、证候相关,涉及到君臣佐使配药规律,具有极大复杂性,应用复杂系统理论对其研究,对中医经验的深入探索具有实际意义。论文以COPD中药方剂数据为例,尝试将社团发现算法应用于中医研究,对药物配伍规律进行探索。结合中医网络具有重叠性、稠密性且为赋权网络的特点,论文选取了时间复杂度较低的LFM(Local Fitness Maximization)重叠社团发现算法作为研究对象。针对传统LFM算法中存在的问题,提出改进算法,并进行实验验证。主要工作和创新点如下:1.总结当前主要的重叠社团发现算法,分析整理LFM算法存在的社团漂移、畸形社团以及在稠密网络中的精度下降等问题;2.提出LFMd(LFM with Dynamic Parameter)算法,利用杰卡德系数改善节点相似度衡量指标,使网络结构更为清晰;利用聚类系数改进社团规模参数,使社团扩张条件更为合理。LFMd算法提高了LFM算法对星型结构中重叠节点识别率,提高了传统LFM算法的准确性;3.提出LFMc(LFM based on Clique)算法,利用随机游走理论衡量节点相似性,使赋权网络中的权重信息得到充分利用;利用极大子团思想,以子团为单位进行社团扩张。LFMc算法不仅提高了传统LFM算法的准确性,而且使LFM依然可用于赋权网络,同时避免了畸形社团问题;4.以名老中医邓启源药物方剂为例,基于COPD名老中医数据,结合以上改进算法,构建名老中医药物方剂社团网络发现模型,最终获取10个名老中医药物方剂社团网络,得到了中医方剂药物搭配的初步规律。经专家确认,结果可以与中医理论相互印证。该方法可以推广至不同病症症候的中医方剂配伍规律探索,具有一定的理论与应用价值。