计算机农业应用论文

计算机模拟和生物学研究的新趋势

www.dxf1.cn

摘要:随着生物学知识的积累和计算机技术的发展,出现了一种新的研究生物学的方法:计算机模拟。典型的有日本庆应义塾大学学者设计的电子细胞和美国康涅狄格州立大学学者设计的虚拟细胞,让生物实验在这样的人工环境中运行。生物学家将有可能使用这一新工具来研究生命过程机制,这一过程漫长或复杂,常规实验技术难以完成。这是实验生物学进步的必然性,也将为理论生物学成为整个生命科学的先驱带来巨大的机遇。

关键词:类比、复合、细胞、电脑

计算机模拟与生物研究领域方法的新动向

周建军、吴彩虹,北京大学生命科学学院100871

傅,中国科学院动物研究所100080

文摘:生物学领域出现了一种以人工实验室为标志,以高质量计算机和软件为辅助的新的研究方法。最重要的模型平台可能是电子电池或虚拟电池,分别由日本庆应义塾大学的Tomita和美国康涅狄格大学的Schaff和Loew设计。生物学家将利用这一独特的工具来积累复杂生命机制的知识,这些知识对于传统的实验技术来说似乎是困难的或者遥不可及的。像物理学和经济学一样,理论生物学将成为生命科学发展的先锋。

关键词:模拟、复杂性、细胞、计算机

有这样一个奇怪的现象,理论家在物理学和经济学中占据王者地位,而在生物学研究中恰恰相反,那些试图从数学计算出发做理论研究的人处于被忽视的地位。人们,包括实际在生物学领域工作的研究人员,都认为生物学一定是在充满各种离心机、电泳槽和奇形怪状的瓶瓶罐罐的实验室里诞生的,而且文章的写作模式几乎都是一样的,先是前言,然后是材料和方法,然后是结果和讨论。分子生物学家就是在这样的生活和研究环境中,以直接观察和实验为基础,一点一滴地收集关于生老病死的数据资料,整日忙于单个基因的克隆和功能分析,单个信号分子与直接相关的蛋白质相互作用的方式;但是,如何把生命本身作为一个复杂的系统整体来研究,还没有考虑,更不用说用什么模型来进行推演和预测了。

然而,仍然有一些“傻瓜”或“疯狂”的幻想家继续梦想。他们总想把现实世界中的生命形式和奇妙过程映射到计算机模拟环境中,创造出数字化的“人工生命”。美国加州圣达菲学院(SFI)有这样一群“疯子”。类似于现在流行的人工智能,“人工生命”是用计算机模拟基本的生物机制和生命本身,而人工智能的研究范围是模拟人类的思维过程。克里斯·兰顿在20世纪70年代初开始了这一尝试。他在读书中发现了计算机鼻祖冯。诺伊曼自20世纪40年代以来就对自我繁殖等问题感兴趣,这种现象是生物最本质的自然规律之一,从DNA复制、细胞分裂到两性繁殖。兰顿把对阅读的兴趣变成了一生的追求,聚集了志同道合的研究人员,与SFI和苹果电脑公司在1987举办了首届人工生命国际研讨会,内容涵盖了从蚂蚁王国的集体行为、蛋白质分子的自组织到生态系统的计算机进化等方方面面。其中最引人注目的是牛津大学著名生物学家理查德·道金斯(Richard Dawkins)演示的一个程序,他曾经写过《自私的基因》,通过反复使用几个简单的规则来模拟一个初始的模拟生物形态,在计算机上描绘出与真实生物世界惊人相似的生命进化和灭绝的过程。

人们从计算机创造的虚拟空间中寻找现实世界的身体替身,完成对社会和实验者本身来说难以控制、费用昂贵且过于危险的实验研究。

生命过程在很大程度上是一个化学过程,至少目前主要是研究或者有能力研究。20世纪二三十年代量子力学的主要框架确定后,理论上可以从原子外层电子的行为来解释和计算化学反应的过程。可惜当时没有计算机,即使在六七十年代,用程序计算模拟分子之间的化学反应也无法引起化学家的兴趣。然而,现在情况发生了变化。一款名为Gaussian98的软件成为了几乎所有顶尖化学研究人员的宠儿,其出色的模拟生物大分子相互作用的能力吸引了越来越多奋斗在生物领域的研究人员。由于它的巨大成功,为其发展做出突出贡献的Watter Kohn和John A.Pople发明了一种更简单易算的量子化学密度函数计算方法,并将这一理论程序变成了在计算机环境下模拟分子反应过程的实用工具,并获得了1998年的诺贝尔化学奖。

细胞是生物体最基本的形式。我们可以从细胞中学到很多关于生命复杂性的知识,尤其是经典的整体大于局部的系统理论。如何研究单细胞、更大的生命形式甚至纠结的生态系统的复杂性,对生物学家来说是一个极具挑战性的课题。传统的实验研究思路和分析方法显然达不到这一要求,单靠生物学家自身的技能是欠缺的。幸运的是,计算机科学发展到今天这样的发达水平,使得一门新诞生的生物信息学横跨在两者之间,也产生了一些计算机和生物两方面的精英,对两者都有好处。当然,本文只是阐述这种大趋势对生物学研究的影响。

本世纪中叶发展起来的分子生物学,已经如此详细地描述了细胞中的物理和化学过程,从基因表达到跨膜信号传递,从细胞中能量的产生和消耗到细胞无意识的诞生和无声的死亡。然而,无论我们对这些具体过程了解得多么清楚,我们仍然无法理解这个生命的质量整体是如何运作的,因为我们所做的和观察到的只是其中的一面,大象不会因为知道自己是要被一群盲人触碰而自动分解成一只耳朵。在过去,所有的分子生物学实验都是由盲人完成的。随着人类基因组计划和几个模式生物基因组计划的加速和完成,现在我们需要一个强大而奇妙的工具,把这些碎片化的知识集合起来,去检验一些东西,预测一些东西。这是计算机模拟。

日本庆应义塾大学生物信息学教授Masaru Tomita领导的一个研究小组正在制作一个划时代的软件:E-CELL。这是一种生物计算机模拟软件,在计算机环境中构建一个虚拟的电子细胞。它不仅包括一些单个细胞的事件和过程,而且将从整体的角度描绘细胞的全貌。该软件的测试版将于今年6月在网上(www.e-cell.org)发布。E-CELL实际上是一个建模工具包或平台,它允许用户指定细胞基因、蛋白质和其他分子、它们的细胞内定位和估计浓度,给出它们个体交互所依赖的“游戏规则”,然后将剩下的工作留给计算机,看这些用户输入的“初始值”如何在这个复杂的细胞系统中交互形成细胞。电子细胞会通过图片和数字告诉你特定物质在每个时刻特定位置的变化;你只需轻点鼠标,就可以在分子生物学实验室中进行基因敲除、转基因或基因修饰,将感兴趣的细胞自由暴露在某种生活环境中,而无需考虑细菌污染、RNA降解或恼人的放射性损伤。研究人员需要做的只是输入初始值,然后在电脑屏幕前喝杯咖啡,等待友好的E细胞模拟。毫无疑问,这种方法将为药物筛选和基因功能研究提供一种非常简单而经济的手段。更重要的是,可以实时看到某个因素和环节对细胞整体行为和生命活动的影响。目前这个程序可以在UNIX或Linux操作系统下运行。Tomita的团队用127个基因构建了一个“想象细胞”,这些基因大部分来自解脲支原体,这是最简单的细胞和最简单的基因组。这个虚拟细胞“生活”在计算机环境中,从虚拟培养基中吸收葡萄糖等营养物质,合成各种酶和蛋白质来维持细胞的生存,排出乳酸等代谢废物。生物学和计算机科学结合的E-CELL是否只能提供一个像动画片一样吸引孩子的教学节目演示?当你可以做一个演示,而且它的可重复性非常好的时候,绝对不存在人为误差;更重要的是,它给了我们一个全新的探索环境,我们可以从已知中发现未知的联系,检验我们的思想。Tomita有这样一个意想不到的发现:当虚拟细胞的葡萄糖供应中断时,细胞中ATP(所有生命过程中最重要的能量供应者)的水平实际上在下降前短暂上升。根据这个简单的模拟结果,Tomita推测在ATP产生的早期也需要ATP本身来供给能量,所以当葡萄糖来源中断时,这种自我消耗就不再进行,在ATP产生中后期行进的代谢中间体会短时间维持ATP的供给。可以清楚地看到,模拟实验为活细胞中的真实实验提供了最有价值的暗示和线索,过滤掉了许多繁琐重复的过程,给科学家留下了有趣的话题和素材。当然,要想模拟得当,首先要用很多材料丰富我们的模拟软件,了解更多的基因及其功能,了解隐藏在软细胞和生物体中的物理化学规律,才能最终模拟出“真实”生物体的完整细胞。

除了Tomita在E-CELL方面的努力,计算机科学家James Schaff和康涅狄格州立大学健康中心的生理学家Leslie Loew也在做同样的梦。他们设计了一个“虚拟细胞”,并将其放在他们的主机(www.nrcam.uchc.edu)上,用户可以通过远程登录的方式运行自己的模拟实验。除了同时模拟细胞整体,细胞生物学家还可以研究细胞的形态体积和其他物理特性如何影响这个系统中特定的生化过程。虚拟细胞是基于Loew对分子扩散及其在活细胞中如何反应的精确测量。这些结果用数学语言描述,然后写入相应的计算机程序,这些程序像真实细胞一样被“组装”成计算机化的细胞,这是一种框架环境,软件用户可以在其中避免特定生化过程的约束。例如,研究人员用老鼠在虚拟细胞中人为加入一定量的钙,然后观察虚拟细胞如何解决细胞中重要信号分子的命运以及与之相关的生物分子参与的事件。除了能看到活细胞中记录的钙振荡,还能预测另一种信号分子IP3的动态过程,这在活细胞中很难做到。研究人员会像看电影一样得到细胞内分子事件的全过程,这与实验生物学家整天在脏乱的实验室里辛苦工作相比,是一种不可思议的轻松和奢侈。

这两类模拟软件可以互为补充,其中透露的信息和研究趋势正引起越来越多的兴趣,尤其是在细胞生物学方面。没有计算机的帮助,他们觉得生活一天比一天艰难。这是最有生命力的信息科学和生命科学,是它们在未来21相互交融的一个鲜明标志。愿更多的人相信。

目前越来越多的科学实验,尤其是更复杂的实验,采用这种方法,并取得了非常有价值的结论,非常值得活跃在生物发展领域的工作者参考,比如最近发表在《科学》杂志上的长颈恐龙如何觅食的研究。长颈蜥脚类动物生活在侏罗纪和白垩纪。当蜥脚类恐龙化石在本世纪初首次被发现时,它们的脖子被描述为水平的。但最近发现的化石被重建后发现,它的头部远远高出地面,天鹅般曲线的脖子几乎与地面垂直。这立刻引起了人们对于这种恐龙的血液循环是如何为头部提供血液的争论。一些研究人员甚至认为它可能有多个心脏。而原始化石标本又重又脆,很难在它的关节上活动,所以很难确定它脖子的最初形状。为了解决这个问题,史蒂文和帕里什开发了“恐龙形态”软件来模拟两种长颈蜥脚类动物梁龙和迷惑龙的颈部形态。软件模拟每一对颈椎运动的几何细节,获得复杂的三维图片。结果表明,放松时它们的脖子几乎是水平的,向下倾斜的角度很小。头部贴近地面,与颈部相比有向下的角度。这两种恐龙的脖子并不像传统假说认为的那样柔软,梁龙只能把头抬过后背,而迷惑龙则稍微灵活一些。这意味着蜥脚类恐龙吃的是生长在湖边地面上的植物,而不是像长颈鹿一样吃树叶。

随着这样一种研究形式的出现,我们有必要反思什么是科学,什么是科学方法。科学,除了其作为真理几乎同义词的外延意义外,实际上是一种精神和方法指导下的社会行为,这种精神和方法被称为科学方法。其核心是可重复控制实验的思想,可以用来验证世界为什么是世界的各种假说。只有经历了这样一个过程的理论,才能真正称之为科学理论。然而,当自然科学研究的重点聚焦于自然界最复杂的生命系统时,我们原有的酒精灯、试管、显微镜、手术刀已经不够用了,甚至无法很好地把握实验的重复性,因为生命系统的非线性、某些过程的不可逆性以及成千上万个实验变量复杂的人为不可控影响。我们需要在真实的实验室旁边或内部建立一个实验室系统,一个计算机虚拟实验室,研究生命的复杂系统,进行大规模的假设-预测-检验和重复的“生命游戏”,主导整个生物学研究,确定对它最有价值的研究命题,指导它做什么和可能发生什么。在这个奇妙的身体替身中,科学的尊严将得到恢复,人类探索未知的兴趣和信心将得到恢复,从而使理论生物学全面领先于实验实践,支撑起21世纪常规科学的基础。

参考资料:

1.复杂性129-184,276-336,作者Mitchell Waldrop 1995;翻译陈玲,1997四月生活在北京?读书?新知三联书店出版。

2.《虚拟与现实世界——计算机模拟如何改变科学的疆域》,41-197,约翰·L·卡斯蒂写于1996;王谦祥、全宁译,上海科技教育出版社2008年2月出版,1998。

3.丹尼斯·诺米勒。建立工作单元'在计算机上'。理科1999,284:80-81。

4.肯特·史蒂文斯,j·迈克尔·帕里什。两种侏罗纪蜥脚类恐龙的颈部姿势和食性。http://China . science mag . org/CGI/content/abstract/284/5415/798