论文部分内容阅读
基因芯片是一种微型多参数生物传感器,它通过在一个微小的固体载片表面固定大量的核酸探针,构建一组微分析单元和系统,以实现对核酸等生物组分准确、快速、大信息量的筛选或检测.探针设计是基因芯片制备流程的关键环节,是其它环节的前提保证.传统的等长移位法设计的探针,由于解链温度不一致,会导致待测序列与探针的杂交错配.该文利用变长变覆盖法,通过动态调节探针长度和探针覆盖长度,保证了探针解链温度的一致性.由于芯片设计时一般要求定长的探针,而变长变覆盖法在设计定长探针时效果不是很好.所以该文提出了设计定长探针的基于距离的优化方法,通过定义合适的距离,发现并删除明显不一致的探针,从而设计出解链温度一致的定长探针.同时讨论了不同的距离定义对算法性能的影响.变长变覆盖法和基于距离的优化算法,能够在很短的时间内设计出解链温度一致的探针集合,不过最终的优化探针集合只有一个.考虑到掩模版优化,我们又利用遗传算法设计出一组解链温度一致的探针集合.同时讨论了不同的参数设置对算法性能的影响.对于检测特定基因的芯片,我们只需针对基因的特征序列设计出特异性的探针即可.在设计出解链温度一致的探针的基础上,该文利用动态规划算法,对与探针匹配的序列进行数据库相似性搜索,从而筛选出了特异性的探针.在芯片设计完成以后,一般通过芯片的杂交实验来检测芯片的实际效果,但是这样成本太高.该文利用分子动力学,尝试了核酸分子杂交过程的计算机模拟.对于两条全配单链,变性后能复性.而当两条链有一个碱基失配时,变性后就难以复性.上述工作都是在实验室的Linux服务器(研究生期间一直由作者维护)上完成的.为了让实验室人员能方便地设计探针,作者将探针设计的程序都放到了Linux服务器上,并利用CGI技术做成了动态网页,提供网络计算服务.