论文部分内容阅读
系统研究群体遗传学的形成、数学模型、遗传多样性的指标体系、信息论在遗传学中的应用及DNA数据的分析方法,对于动物分广群体遗传变异分析具有重要意义。但目前建立在统计学基础上的群体遗传学尚未阐述清楚进化过程群体的熵变规律,而且遗传多态性分析的指标体系不够完善,因而必须用信息论方法科学描述和丰富遗传多样性的指标体系。此外,分子生物技术的介入及核苷酸序列进化的研究都为群体遗传学的深入研究提供了新的途径,但关于DNA序列数据的分析方法需要作进一步的研究。本研究主要体现在以下几个方面: (一)关于群体遗传学的信息论模型研究,主要分为三部分内容:一是群体平衡的Shannon信息熵的性质和群体平衡建立的熵变性质;二是群体遗传多样性测度的研究;三是非平衡群体的基因变异测量Shannon信息量的方法研究。得到了如下结论: 1、平衡群体的Shannon信息熵最大,群体平衡的过程是熵的增大过程。 (1)复等位基因群体 对具有同一基因库的复等位基因位点,用最大熵证明了该位点所对应的所有群体中,平衡群体的基因型熵最大,其数值大于等于0,小于等于21nk(这里k为该位点等位基因数目),且等于该位点基因库熵的两倍。 (2)两对等位基因群体 对两对等位基因群体,建立了各位点熵,群体熵。用最大熵原理证明了群体平衡时,基因型信息熵及配子信息熵最大,配子信息熵为各位点信息熵之和,基因型信息熵为配子信息熵的两倍。同时建立了基因相对信息量多样度的测量方法,通过模拟得出基因相对信息量多样度与基因多样度间存在线性关系,决定系数为0.9929。 (3)近亲繁殖群体 证明了近交系数为F的群体在随机交配下达到平衡的群体信息熵是F的增函数,即F固定时,其值最大;群体信息熵大于等于基因库信息熵,小于等于基因库信息熵的两倍。提出了配子间的近交关联系数的概念,并证明了它是近交系数F的单调递增函数,从信息论的角度刻画了配子间的关联程度。2 群体遗传变异的信息学模型研究 (4)性连锁群体 用最大嫡原理证明了雌性群体与雄性群体的信息嫡的和小于3倍的群体基因信息嫡,当群体平衡时相等,且达到最大。并且研究了性连锁群体从不平衡到平衡过程中的嫡振荡递增过程。 2、多样性测度的研究 在Lewontin关于多样性测度一般性原理指导下/]复等位基因群体的多样性测度进行了研究。证明了不同多样性测度均为等位基回频率的上凸函数;当基因频率之一等于1 时,它们都等于0;当所有基回频率相等时,它们达到最大值;它们随基P]个数的增加而增加。多样性测度为:杂合度 H(Dk基回多样度 D)、基回库信息嫡二(。4)、相对基因库嫡厂’(A)、平衡群体信息脑S(。J。)、平衡群体相对信息嫡StA’)。平衡群体相对纯合度嫡义U 2厂平衡群体相对杂合度嫡扎(A勺、多态信息含量PjC、两种基回均匀度U(A)和W(A),从取值范围看S’(A)、S’(AZ)、U(A)和W(A)均为[0;l], 。、、,。,。、;大1、。,。。。。。、1(人nZj人+1)。。。。。H(或D)取值范围为[0,上二二],取值范围最窄的为Pj厂:[0,二二二上上士二二1。取值范围愈 k““k3“一宽分辩能力愈强。在这些指标中,除H(或D)和PjC,外,其余均为本研究首次提出。本研究提出的 Sj*刁能反映纯合体的遗传变异,而纯合度不能,回为*之一为 1时,己无遗传变异,而J=l。 3、非平衡群体的基因变异测量的Shal。non信息量方法 人 当群体不平衡时一般采用基回多样度DJ-Z人度量多样性c本研究提出用 I叫‘大际群休的十对信息嫡厂’(口)叉 *(口)凡 * (口)作为儿平衡群体的多干,件坝度*模拟全 果表明 y(G)、乙(G)、乙(G)均与 D呈正 十关,个关系数分别为0,973324。0、992351、089门7。对于纯合体比例大的〕平衡群体 相对信息嫡多十性测度* D更实际一些。 (二二)关于微卫星数据资料的统汁分析研究,内容分为两部分:一足微卫星标记与性状问的关系分析方法;二是利用微卫星标记估计们体近交系数的I。厂究。各部分的结论如下: l、利用对所研究性状与微卫星杯记的相关分析,可以对微卫星结果是否可以作为标记进行判断。对只区分两种状态的性状划分成小 数据,对数量性状的划分可以以实测值,也可以按研究目的划分成0刁 数据或拧分组c由于标己只分为有无两种,所以,对数量性状划分成0刁 数据处理时,结促的意义更明确。利用相关系数与夹角相结合,可以给出性状与标记关系的几何解释,给定夹角的阈值,可以筛选有效的标记。 2、利用微卫星标记的共显性特征,建立估计随机交配群体的近交系数的方法。