利用遗传算法改进基于哈希树的关联规则挖掘共调控基因

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:fayeming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着20世纪末生物技术的发展,基因组全序列测序完成,科学家掌握了大量生物基因数据,为生物信息学发展提供了广阔的空间。计算机学家、数学家和生物学家一起投入到生物信息的破解当中,其中构建基因调控网络吸引大量研究人员的注意。  现代生物学研究表明,一个生物系统所有类型细胞具有相同的基因组。细胞分化主要是通过基因表达水平的变化而不是基因序列改变而实现。基因表达是指结构基因在生物体内的转录、翻译以及所有加工过程。任何影响基因开启与关闭、转录和翻译速率的直接因素统称为对基因表达的调控。共调控基因是受某些转录因子调控的一组基因,是建立基因调控网络的基础。在计算机处理当中,一般认为共调控基因是由至少一个转录因子调控的一组基因。然而现在的研究大多用共表达基因来近似共调控基因,但是它们存在很大不同,不能直接等同。  本文研究了基因表达谱数据,根据其数据特性和生物机理,提出了一种挖掘共调控基因的新方法,主要做了以下几方面工作:第一,仿真一种利用基因表达值变化趋势挖掘正负共调控基因的方法。第二,改进关联规则,关联规则以往一般只能挖掘正规则,本文对算法进行改进还可以挖掘负规则,为提高算法效率,在关联规则中运用统一的哈希树存储和搜索频繁项集,提高时间和空间效率。第三,将遗传算法运用到关联规则中,扩展了产生规则的能力,产生不止一个左项。运用该方法挖掘酵母和拟南芥两种模式生物基因表达谱,得到大量有价值的数据,并通过与数据库比较,查找转录因子和转录因子结合位点,发现所产生的规则确实由相同的转录因子调控,并且上游基因序列中含有类似的转录因子调控位点,为构建基因调控网络奠定了基础,因此可以断定所得规则中基因具有共调控关系。仿真结果显示了该方法在挖掘共调控基因中的优越性,不失为一个有益的探索。
其他文献
高中数学课程的教学,容易受到高考应试思维的影响,很多教师一味强调学生数学运算能力和应试能力的培养,没有将学生核心素养的培养给予足够的重视,这显然不利于学生数学抽象、
课堂教学效率提高是新课程改革下强调的关键点,思维导图优势作用明显,是实现有效教与学的重要策略.因此,本文从不同角度入手客观阐述了思维导图在小学英语教学中的作用,构建
随着我国教育体制的改革,新的教育形式不断的完善,数学作为一种在现实生活中应用比较广泛的学科,已经成为人们日常生活的一部分,数学像是某种语言植根人们的思维中,在平常的
在素质教育改革的冲击下,构建高效英语课堂,培养学生的学习兴趣工作就显得尤为重要,只有有效地激发出学生对于英语学习的兴趣,不断的提升小学英语课堂教学成效,才能够有效提
脑电是在大脑皮层中形成的能够反映脑神经细胞电生理活动的信号,通过分析脑电信号,我们可以判断其生理活动和大脑意识。从而,可以直接将大脑信号转换为对外部设备的控制信号,不需
焦炭和烧结矿生产工序及高炉炼铁工序是钢铁生产中的重要环节,这三个工序流程与物流繁多,工艺操作复杂,实际生产中焦炭质量经常产生波动,烧结至高炉区的调度也常常出现不协调
小组合作学习是初中英语教学中应用比较广泛的一种学习方式.探讨了初中英语教学中小组合作学习的必然之趋,初中英语教学中小组合作学习的实施应用.
素质教育的今天,培养学生各个方面的能力是新课标下的主要的任务之一,小学道德和法治课也是培养此方面的主要学科之一.小组合作学习是道德与法治课中学生进行自主、探究学习
针对南钢45#钢生产加工过程中出现的铸坯内部缺陷、工件和轧材裂纹、热顶锻裂纹,通过对裂纹处的能谱分析及连铸过程二次冷却仿真计算,确认导致缺陷的主要原因为铸坯内氧化物
保护渣是提高连铸效率和铸坯质量的关键功能材料,起着控制传热、润滑、同化夹杂、防止钢液二次氧化、绝热保温等作用。其中润滑作用主要是通过在铸坯和结晶器之间的渣膜来实