热门论文

李宝健教授在《展望21世纪的生命科学》一文中谈到基因组研究计划的重要性时,引用了science《第三次技术革命》中的一句话:“下一个传播伟大的时代将是基因组革命的时代,它正处于初始阶段。”以目前的研究水平,只要涉及生命重要现象的课题,几乎都离不开对基因及其功能的分析。2000年6月26日,英国和美国的首脑,连同公共和私人人类基因组测序小组,正式向世界宣布,人类基因组的工作草图已经绘制出来。科学家将此视为生命科学进入新时代的标志,即后基因组时代。因此,有必要了解基因组及其研究内容和进展。

1基因组学及其研究内容?

基因组(GENOME)一词是1920年由Winkles提出的由基因和染色体组成,用来描述生物所有基因和染色体组成的概念。沃森和克里克在1953年发现了DNA的双螺旋结构,这标志着分子生物学的诞生。随着各学科的发展,当前的生物学研究进入了新一代,不同的研究技术和手段在生物大分子水平上有机结合,以克服生物学问题。?

基因组研究可以理解为:(1)基因表达谱研究,即比较不同组织和不同发育阶段、正常状态和疾病状态、体外培养的细胞中基因表达模式的差异。这些技术包括传统的RTPCR、RNase保护试验和northern印迹杂交,但缺点是一次只能做一项。新的高通表达分析方法包括微阵列、基因表达系列分析(SAGE)、DNA芯片等。(2)基因产物-蛋白质的功能研究,包括单个基因的体外蛋白质表达方法和蛋白质组研究;(3)利用酵母双杂交系统、单杂交系统、三杂交系统(三杂交系统)和反向杂交系统研究了蛋白质与蛋白质的相互作用。

65438-0986年,美国科学家托马斯·罗德里克(Thomas Roderick)提出基因组学,是指对所有基因进行基因组作图(包括遗传图谱、物理图谱和转录图谱)、核苷酸序列分析、基因定位和基因功能分析的科学。因此,基因组研究应包括两个方面:以全基因组测序为目的的结构基因组学和以基因功能鉴定为目的的功能基因组学。结构基因组学代表了基因组分析的早期阶段,侧重于建立生物的高分辨率遗传、物理和转录图谱。功能基因组学代表了基因分析的一个新阶段,即利用结构基因组学提供的信息系统地研究基因功能。它的特点是高通量,大规模的实验方法,统计和计算机分析。随着人类基因组计划(HGP)1990的实施,取得了巨大的成就。同时,模式生物的基因组计划也在进行中,已先后完成了几个物种的序列分析。研究重点已经从揭示生命的所有遗传信息转移到从整体上研究分子水平的功能。第一个标志是功能基因组学的出现,第二个标志是蛋白质组的兴起。

2结构基因组学的研究内容是什么?

结构基因组学是基因组学的重要组成部分和研究领域,是通过基因作图和核苷酸序列分析来确定基因组成和基因定位的科学。遗传信息在染色体上,但染色体不能直接用于测序。基因组这个庞大的研究对象,必须分解成易于操作的小结构区域。这个过程就是基因图谱。根据使用的标志和手段的不同,作图分为三种类型,即构建生物基因组高分辨率遗传图谱、物理图谱和转录图谱。

2.1遗传图谱

通过基因重组获得的基因在特定染色体上的线性排列图称为遗传连锁图。是计算连锁遗传标记之间的重组频率,确定它们的相对距离,一般用厘米表示(cM,即每次减数分裂的重组频率为1%)。绘制遗传连锁图的方法很多,但在DNA多态性技术还不发达的情况下,很少能鉴定出连锁图。随着DNA多态性的发展,可用的遗传标记数量迅速扩大。早期的多态性标记有RFLP(限制性片段长度多态性)、RAPD(随机引物扩增多态性DNA)和AFLP(扩增片段长度多态性)。20世纪80年代以后,出现了90年代发展起来的STR(短串联重复序列,又称微卫星)DNA遗传多态性分析和SNP(单核苷酸多态性)分析。

2.2实物图

物理图谱是染色体被限制性内切酶切割成片段,然后根据重叠序列确定片段之间的连接顺序和遗传标记之间的物理距离[碱基对(bp)或千碱基(kb)或兆字节(Mb)]的图谱。以人类基因组物理图谱为例,它包括两层含义。一种是获得分布于整个基因组的30000个序列标记位点(STS,定义为染色体位置明确,可通过PCR扩增的单拷贝序列)。克隆目的基因的cDNA,测序,确定两端cDNA序列,约200bp,设计合成引物,分别以cDNA和基因组DNA为模板进行扩增;比较和纯化特定的条带;STS制备的放射性探针与基因组原位杂交,这样每100kb就有一个标记。第二是构建覆盖每个染色体的大片段。首先构建数百kb的YAC(酵母人工染色体),对YAC进行作图,得到重叠的YAC连续克隆,称为低精度物理作图,然后在几十kb DNA片段的水平上进行,随机剪切加载到粘土中的YAC作图称为高精度物理作图。

2.3转录图?

以EST为标记构建的分子遗传图谱称为转录图谱。从cDNA文库中随机条带测序克隆得到的部分cDNA的5’或3’末端序列称为表达序列标签(EST),一般长约300 ~ 500 bp。一般来说,mRNA的3’非翻译区(3’-UTR)是代表每个基因的相对特异的序列。通过RH定位对应于3’-UTR的EST序列,可以形成由基因组成的STS图谱。到2月底,1998,65438+分布在美国国家生物技术信息中心(NCBI)数据库中的植物ESTs总数已达数万个,人类基因组中的ESTs数量达到1.8万多个。这些ESTs不仅为基因组遗传图谱的构建提供了大量的分子标记,也为不同组织器官基因的功能研究提供了有价值的信息。此外,EST程序还为基因鉴定提供了候选基因。它的缺点是有时很难通过随机测序获得那些低丰度表达的基因和那些在特殊环境条件下(如生物胁迫和非生物胁迫)诱导表达的基因。因此,为了弥补EST项目的不足,必须进行基因组测序。通过分析基因组序列可以获得基因组结构的完整信息,如基因在染色体上的排列顺序、基因间间隔区的结构、启动子的结构、内含子的分布等。

3功能基因组学研究?

功能基因组学,也就是通常所说的后基因组学,利用结构基因组学提供的信息和产品,开发和应用新的实验手段,在基因组或系统水平上综合分析基因的功能,使生物学研究从对单个基因或蛋白质的研究转向对多个基因或蛋白质同时进行系统研究。这是在基因组的静态碱基序列被阐明后,对基因组动力学的生物功能研究。研究内容包括基因功能发现、基因表达分析和突变检测。该基因的功能包括:生物学功能,如磷酸化特定蛋白作为蛋白激酶;细胞学功能,如参与细胞间和细胞内信号传递途径;发育功能,如参与形态发生,包括经典的消减杂交、差异筛选、cDNA表达的差异分析和mRNA的差异显示,但这些技术都不能全面系统地分析基因。新技术应运而生,包括基因表达的系统分析、cDNA微阵列、DNA芯片等。鉴定基因功能最有效的方法是观察基因表达受阻或增加后在细胞和整体水平上的表型变异,因此有必要建立一个模式生物。

比较基因组学是以基因组作图和测序为基础的学科,通过比较已知基因和基因组结构,了解基因的功能、表达机制和物种进化。利用模式生物基因组与人类基因组编码序列和结构的同源性,可以克隆人类疾病基因,揭示基因功能和疾病的分子机制,阐明物种的进化关系和基因组的内部结构。目前对模式生物基因组的研究得出一些规律:模式生物基因组普遍较小,但编码基因比例较高,重复序列和非编码序列较少;它的G+C%比较高;内含子和外显子的结构和组织是保守的,剪切位点在许多生物中是一致的。DNA冗余,即重复;大多数核心生物功能由相当数量的直向同源蛋白承担;共线性连锁的同源基因在不同的基因组中具有相同的连锁。模式生物基因组研究揭示人类疾病基因的功能,利用基因序列的同源性克隆人类疾病基因,利用模式生物实验系统的优势,在人类基因组研究中通过比较作图分析复杂性状,从而加深对基因组结构的认识。此外,突变技术可用于确定未知基因、基因组多样性和生物信息学的应用。

4蛋白质组学研究

基因是遗传信息的载体,但蛋白质是所有生物功能的执行者。它有自己的活动规律,仅仅从基因的角度去研究是远远不够的。只有研究基因转录和蛋白质翻译的过程,才能真正揭示生命的活动规律,从而出现了一门研究细胞内蛋白质组成和活动规律的新学科——蛋白质组学。蛋白质组由麦考瑞大学的Wilkins和Williams于1994年首次提出,并于1995年7月出现在《电泳》上。是指所有基因及其存在方式所表达的全部蛋白质,是一个基因、一个细胞或一个组织所表达的全部蛋白质成分。蛋白质组是研究在不同时间和空间发挥作用的特定蛋白质组。它从蛋白质水平探索蛋白质的作用方式、作用机制、调控以及蛋白质的组内相互作用,为临床诊断、病理研究、药物筛选、药物开发、代谢途径等提供理论依据和基础。?蛋白质组学旨在阐明生物体内所有蛋白质的表达模式和功能模式,包括识别蛋白质的表达、存在方式(修饰形式)、结构、功能和相互作用方式。它不同于传统的蛋白质学科,是在生物体或其细胞的整体蛋白质水平上进行的,从生物体或细胞的整体蛋白质活性来揭示生命的规律。然而,由于蛋白质的多样性、多变性和复杂性,低表达蛋白质的检测是很困难的,因此应该明确其研究的难度。总体来说,研究可以分为两个方面:蛋白质的表达模型(或蛋白质组成)研究和蛋白质的功能模型研究(目前侧重于蛋白质的相互作用网络关系)。蛋白质组的研究可以提供以下信息:由基因序列预测的基因产物是否以及何时被翻译;基因产物的相对浓度;翻译后的修改程度等。由于蛋白质的数量少于基因组中开放阅读框的数量,功能蛋白质组学被提出。功能蛋白是指基因组在特定时间、特定环境和实验条件下活跃表达的蛋白质,它只是总蛋白质组中的一部分。功能蛋白质组学研究介于传统的对单个蛋白质的蛋白质研究和对所有蛋白质的蛋白质研究之间,是与某种功能或在一定条件下相关的一组蛋白质。?

蛋白质的组成分析和鉴定需要对蛋白质进行表征,即分离鉴定图谱,包括蛋白质分离鉴定两个步骤。二维凝胶电泳(2-DGE)和质谱(MS)是主要的技术。近年来,相关技术和生物信息学在不断地快速发展和进步。蛋白质组研究的技术体系包括:样品制备;双向聚丙烯酰胺凝胶电泳;蛋白质的染色;凝胶图像分析;蛋白质分析;蛋白质组数据库。其中三个是:二维凝胶电泳技术、质谱鉴定、计算机图像数据处理和蛋白质数据库。

5.基因组学相关学科的诞生?

随着基因组学研究的深入,人类有望揭示生命物质世界的各种此前未知的规律,彻底揭开生命的奥秘,进而驱动生命为人类社会和经济服务。基因组研究与其他学科的交叉促进了一些学科的诞生,如营养基因组学、环境基因组学、基因组学、致病基因组学、生殖基因组学、群体基因组学等。其中,生物信息学正在成为备受关注的新产业的支撑点。?

生物信息学是研究生物大分子,以计算机为工具,运用数学和信息科学的观点、理论和方法,研究生命现象,组织和分析呈指数增长的生物信息数据的科学。这项研究集中在基因组学和蛋白质上。首先是研究遗传物质的载体DNA及其编码的高分子量物质。我们以计算机为工具,研究生物信息学这种跨学科的方法,找出它的规律性,然后开发各种适合它的软件,对DNA和蛋白质的序列和结构进行收集、整理、发表、提取、加工、分析和发现。它由三部分组成:数据库、计算机网络和应用软件。其研究重点包括:序列比较、基因识别和DNA序列分析、蛋白质结构预测、分子进化和数据库中的知识发现(KDD)。该领域的主要科学问题是:继续建立和优化数据库;学习数据库的新理论、新技术和新软件;比较分析了一些重要的算法;分析人类基因组的信息结构;基于生物信息数据的遗传密码起源和生物进化研究:培养生物信息学专业人才,建立国家生物医学数据库和服务体系[5]。20世纪末生物数据的积累会导致新的理论发现或重大科学发现。生物信息学是基于数据库和知识发现的研究,给生命科学带来了革命性的变化,对医药、健康、食品、农业等行业产生了巨大的影响。

邹承鲁教授在谈到21世纪的生命科学时说,20世纪生物学取得了巨大的进步,数学科学对生物学广泛而深刻的渗透,在新的高度揭示了生命的奥秘,彻底改变了生物学的面貌。生物学不仅是目前自然科学发展的热点,而且在进入21世纪后仍将如此。科学家称21世纪为信息时代。生物科学与信息科学的结合无疑是多学科发展的必然结果。