遗传学(Genetics)——研究生物的遗传与变异的科学。
The branch of biology that deals with heredity, especially the mechanisms of hereditary transmission and the variation of inherited characteristics among similar or related organisms. (from American Heritage Dictionaries)
研究基因的结构、功能及其变异、传递和表达规律的学科。(全国科学技术名词审定委员会审定.遗传学名词.北京:科学出版社,2006年3月)
遗传学的研究范围包括遗传物质的本质、遗传物质的传递和遗传信息的实现三个方面。遗传物质的本质包括它的化学本质、它所包含的遗传信息、它的结构、组织和变化等;遗传物质的传递包括遗传物质的复制、染色体的行为、遗传规律和基因在群体中的数量变迁等;遗传信息的实现包括基因的原初功能、基因的相互作用,基因作用的调控以及个体发育中的基因的作用机制等。
遗传学中的亲子概念不限于父母子女或一个家族,还可以延伸到包括许多家族的群体,这是群体遗传学的研究对象。遗传学中的亲子概念还可以以细胞为单位,离体培养的细胞可以保持个体的一些遗传特性,如某些酶的有无等。对离体培养细胞的遗传学研究属于体细胞遗传学。遗传学中的亲子概念还可以扩充到DNA脱氧核糖核酸的复制甚至mRNA的转录,这些是分子遗传学研究的课题。
一个受精卵通过有丝分裂而产生无数具有相同遗传组成的子细胞,它们怎样分化成为不同的组织是一个遗传学课题,有关这方面的研究属于发生遗传学。由一个受精卵产生的免疫活性细胞能够分别产生各种不同的抗体球蛋白,这也是遗传学的一个课题,它的研究属于免疫遗传学。
从噬菌体到人,生物界有基本一致的遗传和变异规律,所以遗传学原则上不以研究的生物对象划分学科分支。人类遗传学的划分是因为研究人的遗传学与人类的幸福密切相关,而系谱分析和双生儿法等又几乎只限于人类的遗传学研究。
微生物遗传学的划分是因为微生物与高等动植物的体制很不相同,因而必须采用特殊方法进行研究。此外,还有因生产意义而出现的以某一类或某一种生物命名的分支学科,如家禽遗传学、棉花遗传学、水稻遗传学等。
更多的遗传学分支学科是按照所研究的问题来划分的。例如,细胞遗传学是细胞学和遗传学的结合;发生遗传学所研究的是个体发育的遗传控制;行为遗传学研究的是行为的遗传基础;免疫遗传学研究的是免疫机制的遗传基础;辐射遗传学专门研究辐射的遗传学效应;药物遗传学则专门研究人对药物反应的遗传规律和物质基础,等等。
从群体角度进行遗传学研究的学科有群体遗传学、生态遗传学、数量遗传学、进化遗传学等。这些学科之间关系紧密,界线较难划分。群体遗传学常用数学方法研究群体中的基因的动态,研究基因突变、自然选择、群体大小、交配体制、迁移和漂变等因素对群体中的基因频率和基因平衡的影响;生态遗传学研究的是生物与生物,以及生物与环境相互适应或影响的遗传学基础,常把野外工作和实验室工作结合起来研究多态现象、拟态等,借以验证群体遗传学研究中得来的结论;进化遗传学的研究内容包括生命起源、遗传物质、遗传密码和遗传机构的演变以及物种形成的遗传基础等。物种形成的研究也和群体遗传学、生态遗传学有密切的关系。
从应用角度看,医学遗传学是人类遗传学的分支学科,它研究遗传性疾病的遗传规律和本质;临床遗传学则研究遗传病的诊断和预防;优生学则是遗传学原理在改良人类遗传素质中的应用。生统遗传学或数量遗传学的主要研究对象是数量性状,而农作物和家畜的经济性状多半是数量性状,因此它们是动植物育种的理论基础。
杂交是遗传学研究的最常用的手段之一,所以生活周期的长短和体形的大小是选择遗传学研究材料常要考虑的因素。昆虫中的果蝇、哺乳动物中的小鼠和种子植物中的拟南芥,便是由于生活周期短和体形小而常被用作遗传学研究的材料。大肠杆菌和它的噬菌体更是分子遗传学研究中的常用材料。
生物化学方法几乎为任何遗传学分支学科的研究所普遍采用,更为分子遗传学所必需。分子遗传学中的重组DNA技术或遗传工程技术已逐渐成为遗传学研究中的有力工具。
1) 遗传学的萌芽
远古时代人类祖先建立了驯养和栽培方法,,实质上就是萌芽状态的对遗传和变异规律的认识和应用。后来人们对遗传和变异的本质提出过种种假说。
泛生论(theory of pangenesis):雌雄个体的精液中有能够传递特性的粒子,精液在全身各个部分形成,汇集后在血管中流动流动进入睾丸,将身体各部分的特征传递给下一代。
种质学论(魏斯曼August Weisman,1834-1914):
种质germplasm:性细胞和产生性细胞的细胞
体质somatoplasm:身体除种质以外的所有其余部分的细胞
种质负责传递保持物种种性的全部遗传因子,其自身永世长存,在世代之间连续相续;体质保护和帮助种质自身繁衍
2) 遗传学的诞生(1900)
(1) 孟德尔(Johann Gregor Mendel,1822-1884)是奥地利的一个修道士,他从1856年开始进行了8年的豌豆杂交试验,提出了遗传因子的分离定律和自由组合定律的假设,并应用统计学方法分析和验证了这些假设。但是他的发现并未引起重视,而是被埋没了35年之后才被3位科学家重新发现。
(2) 重新发现孟德尔定律
荷兰阿姆斯特丹大学的教授德弗里斯(Hugo de Vires,1848-1935), 月见草
德国士宾根大学教授柯伦斯(Carl Correns, 1864-1933),玉米
奥地利维也纳农业大学的年轻讲师丘歇马克(Erich Von Tschermak Seysenegg, 1871-1962), 豌豆
三人的论文都刊登在1900年出版的《德国植物学会杂志》18卷上,都证实了孟德尔定律。这就是遗传学历史上孟德尔定律的重新发现,标志着遗传学的诞生。
(3) 贝特森 (W.Bateson)于1906年给遗传学定名为“Genetics”(第三届国际遗传学大会),在1909年由丹麦遗传学家约翰逊(W.Johannsen)创造了“基因”(gene)一词,表示孟德尔遗传因子;1910年起将孟德尔遗传规律改称为孟德尔定律,公认孟德尔是遗传学的奠基人。
3) 细胞遗传学时期(1900-1939年)
20世纪头10年,科学家们验证了孟德尔遗传规律普遍意义,确立了一些遗传学的基本概念。这一历史时期,研究工作的主要特征是从个体水平进展到细胞水平,并建立了染色体遗传学说。
1902年,鲍维丰(T.Boveri)和1903年萨顿(W.Sutton)在研究减数分裂时,发现遗传因子的行为与染色体行为呈平行关系,提出染色体是遗传因子载体,可说是染色体遗传学说的初步论证。
1909年的约翰逊(W.Johannsen)称孟德尔假定的“遗传因子”为“基因”,并明确区别基因型和表型。1909年,詹森斯 (F.A.Janssen)观察到染色体在减数分裂时呈交叉现象,为解释基因连锁现象提供了基础。
1909年,摩尔根(T.H.Morgan,1866-1945)开始对果蝇迸行实验遗传学研究,发现了伴性遗传的规律。他和他的学生还发现了连锁、交换和不分离规律等。并进一步证明基因在染色体上呈直线排列,从而发展了染色体遗传学说。
1926年摩尔根提出基因学说,发表《基因论》。主要内容有:种质(基因)是连续的遗传物质;染色体上的遗传单位,有很高的稳定性,能自我复制和发生变异;在个体发育中,一定的基因在一定的条件下,控制着一定的代谢过程,从而体现在一定的遗传特性和特征的表现上;生物进化的材料主要是基因及其突变等论点。这是对孟德尔遗传学说的重大发展。也是这一历史时期的巨大成就。
这一时期的另一重大成就是1927穆勒(H·T·Mulle)和1928年斯塔德勒(L.J.Stadler)分别在果蝇及玉米的试验中,证实了基因和染色体的突变不仅在自然情况下产生,且用X射线处理也会产生大量突变。这种用人工产生遗传变异的方法,使遗传学发展到一个新的阶段。
4) 从细胞向分子水平过渡时期(1940-1952年)
这一时期,由于微生物遗传学和生化遗传学研究的广泛开展,使遗传学研究工作进入微观层次,其主要特征是以微生物为研究对象,采用生化方法探索遗传物质的本质及其功能。
20世纪40年代初卡斯佩森(T·O·Caspersson)用定量细胞化学的方法证明DNA存在于细胞核中。以后又有人证明DNA是构成染色体的主要物质;同种生物的不同细胞中DNA的质与量恒定,在性细胞中DNA的含量为体细胞的一半。
1944年艾弗里(O.T.Avery)等在用纯化因子研究肺炎双球菌的转化实验中,证明了遗传物质是DNA而不是蛋白质。
1952年赫尔希(A·D·Hershey)等用同位素示踪法于噬菌体感染细菌的实验中,再次确认了DNA是遗传物质。
1940年比德尔(W.Beadle)等在对链孢霉的生化遗传的经典研究中,分析了许多生化突变体后,认为一个基因的功能相当于一个特定的蛋白质(酶),并于翌年提出“一个基因一个酶”的假说。以后的研究表明,基因决定着蛋白质 (包括酶)的合成,故改为“一个基因一个蛋白质或多肽”。至此,已为遗传物质的化学本质及基因的功能奠定了初步的理论基础。
5) 现代分子遗传学时期 (1953-现在)
许多物理学家和化学家投身于生命的分子基础和基因的自我复制这两个生物学中心问题的研究,将现代物理学和化学的最新成果、理论和方法带入了生物学研究中。如丹麦的尼尔斯.波尔(Niels Bohr)、德国的马克斯.德布吕克(Max Delbruck)、奥地利的量子力学家欧文.薛定谔(Erwin Schrodinger),他们想了解传统的物理定律是否可以阐明遗传学问题,以及在生物学中能否发现新的物理定律,这些想法促使了分子遗传学和分子生物学的诞生。
(1) 1953年4月25日出版的Nature杂志上,沃森(Watson)和物理学家克里克(Crick)提出了DNA双螺旋结构模型,标志着遗传学以及整个生物学进入分子水平的新时代。
(2) 1961年克里克等证明了他于1958年提出的关于遗传三联密码的推测,1969年Nirenberg 等解译出全部遗传密码。
(3) 60年代,阐明mRNA、tRNA 及核糖体的功能、蛋白质生物合成的过程、 “中心法则”等。
(4) 50年代初,Barbara Mclintock 在玉米中发现可动遗传因子即转座因子,但是这个过于超时代的发现当时并未得到承认,甚至受到讥笑。
(5) 1961年F.Jacob和J.Monod 提出了大肠杆菌的操纵子学说,阐明了原核生物基因表达调节的问题。
(6) 后来发现真核生物的断裂基因(split gene)和病毒的重叠基因(overlapping gene), 并开始研究真核生物的基因表达调控。
(7) 70年代,发现限制性核酸内切酶、人工分离和合成基因取得进展,1972年P.Berg 成功实现了DNA体外重组,1973年S.N.Cohen 通过DNA的体外重组成功地构建了第一个有生物学功能的细菌杂交质粒,从而兴起以DNA重组技术为核心的基因工程研究。
(8) 80年代,基因工程技术飞速发展,基因工程药物和疫苗投入临床使用,转基因动植物产品上市销售,转基因动植物生物反应器研究成为热点并实现商品化。
(9) 90年代,1992年“人类基因组计划”开始实施,投资30亿美元旨在测定人类基因组全部30亿个核苷酸对的碱基序列,是在破译生物体全部遗传密码的征途上迈出的第一步,将为揭开人类和生物体生长、发育、疾病、衰老和死亡的奥秘奠定基础,其意义与原子弹研究曼哈顿计划和载人登月阿波罗计划相比有过之而无不及。 克隆羊“多莉” (Dolly) 诞生之后,克隆牛、羊、小鼠等动物纷纷获得成功。
(10) 21世纪初人类基因组计划提前完成,遗传学面临新的挑战和使命,即进入了“基因组后研究”时代,在搞清楚基因组的全部序列的基础上,还要彻底阐明基因组所包含的全部遗传信息的生物学功能,及其所编码的蛋白质的结构和功能,所以又称为“蛋白质组”研究。同时,还要应用基因工程和蛋白质工程技术,改造蛋白质,使人类对生命活动的认识和支配由必然王国进入自由王国。
在分子水平上研究生物遗传和变异机制的分支学科。经典遗传学的研究课题主要是在亲代和子代之间的传递问题;分子遗传学则主要研究基因的本质(包括基因的化学性质、结构和组织)、基因的功能以及基因的变化等问题。分子遗传学的早期研究都用微生物为材料,它的形成和发展与和有密切关系。
简史 1944年美国学者等首先在肺炎双球菌中证实了因子是(DNA),从而阐明了遗传的物质基础。1953年美国分子遗传学家和英国分子生物学家提出了 DNA分子结构的双螺旋模型。这一发现常被认为是分子遗传学的真正开端。1955年美国分子生物学家用基因重组分析方法研究大肠杆菌(Escherichia coli)的T4噬菌体中的基因精细结构,其剖析重组的精细程度EuE达到DNA多核苷酸链上相隔仅三个核苷酸的水平。这一工作在概念上沟通了分子遗传学和经典遗传学。关于方面,早在1927年和1928年 L.J.斯塔德勒就用X射线等诱发了果蝇和玉米的基因突变,但是在此后一段时间中对基因突变机制的研究进展很慢,直到以微生物为材料广泛开展突变机制研究和提出 DNA分子双螺旋模型以后才取得显著成果。例如碱基置换理论便是在T4噬菌体的诱变研究中提出的,它的根据便是DNA复制中的碱基配对原理。美国遗传学家G.W.比德尔和美国生物化学家E.L.塔特姆根据对粗糙脉孢菌的营养缺陷型的研究,在40年代初提出了一个基因一种酶假设,它沟通了遗传学中对基因的功能的研究和生物化学中对蛋白质生物合成的研究。按照一个基因一种酶假设,蛋白质生物合成的中心问题是蛋白质分子中排列顺序的信息究竟以什么形式储存在DNA分子结构中,这些信息又通过什么过程从 DNA向蛋白质分子转移。前一问题是问题,后一问题是问题,这又涉及和翻译、(mRNA)、(tRNA)和的结构与功能的研究。这些分子遗传学的基本概念都是在50年代后期和60年代前期形成的。分子遗传学的另一重要概念──在1960~1961年由法国遗传学家和F.雅各布提出。他们根据在大肠杆菌和λ噬菌体中的研究结果提出乳糖操纵子模型。接着在1964年又由美国微生物和分子遗传学家C.亚诺夫斯基和英国分子遗传学家S.布伦纳等分别证实了基因的核苷酸顺序和它所编码的蛋白质分子的氨基酸顺序之间存在着排列上的线性对应关系,从而充分证实了一个基因一种酶假设。此后的分子遗传学研究才逐渐开展起来。
从分子遗传学角度来看,真核生物和有许多相同之处,包括以DNA作为遗传物质(只有原核生物中的RNA病毒以RNA为遗传物质)、基本上相同的遗传密码、蛋白质合成过程以及机制等。但是它们之间也有一些显著的区别。例如原核生物的基因调控主要通过操纵子的作用,可是在真核生物中对于操纵子的存在还有争论,即使有的话也不象细菌中那样普遍。在真核生物的基因组中普遍存在着不编码肽链的重复序列,原核生物则罕见。在真核生物和真核生物的病毒的基因组中还发现了大量的断裂基因,但到目前为止,在原核生物和原核生物的病毒中则除了少数病毒以外没有发现过断裂基因。因此对真核生物中特殊问题的研究形成了分子遗传学中的新的研究领域。原核生物和真核生物的染色体外遗传物质也有很大差别,原核生物细胞中只有,没有和等细胞器(见)。1963年证实了叶绿体中存在着DNA以后,细胞器的遗传学研究得到了新的推动。是一种可以转移位置的遗传因子。原核生物的转座子和真核生物的各种转座因子也都是目前分子遗传学的重要研究课题。此外,在、和进化遗传学(见)等学科中也都存在着许多分子遗传学的研究课题。
研究方法 用遗传学方法可以得到一系列使某一种生命活动不能完成的突变型,例如不能合成某一种氨基酸的突变型、不能进行 DNA复制的突变型、不能进行的突变型、不能完成某些发育过程的突变型、不能表现某种趋化行为的突变型等。正象40年代中在粗糙脉孢菌中利用不能合成某种氨基酸的突变型来研究这一种氨基酸的生物合成途径一样,也可以利用上述种种突变型来研究 DNA复制、细胞分裂、发生过程和趋化行为等。不过许多这类突变型常是致死的,所以各种条件特别是温度敏感突变型常是分子遗传学研究的重要材料。
在得到一系列突变型以后,就可以对它们进行遗传学分析,了解这些突变型代表几个基因,各个基因在染色体上的位置,这就需要应用互补测验,包括基因精细结构分析等手段。
生物化学方法 抽提、分离、纯化和测定等都是分子遗传学中的常用方法。在对生物大分子和细胞的超微结构的研究中还经常应用电子显微镜技术。对于分子遗传学研究特别有用的技术是顺序分析、和和是具有特异性结构的生物大分子,它们的生物学活性决定于它们的结构单元的排列顺序,因此常需要了解它们的这些顺EuE序。如果没有这些顺序分析,则基因DNA和它所编码的蛋白质的线性对应关系便无从确证;没有,则插入顺序或转座子两端的反向重复序列的结构和意义便无从认识(见),重叠基因(见)也难以发现。
DNA分子的两个单链具有互补结构,DNA和通过转录产生的mRNA之间也具有互补结构。凡具有互补结构的分子都可以形成杂种分子,测定杂种分子的形成的方法便是方法。分子杂交方法可以用来对DNA和由DNA转录的RNA进行鉴定和测量。它的应用范围很广泛,例如用来测定两种生物的DNA的总的相似程度,某一mRNA分子从DNA的哪一部分转录等。
重组 DNA技术的主要工具是和基因载体(质粒和噬菌体)。通过限制性内切酶和连接酶等的作用,可以把所要研究的基因和载体相连接并引进细菌细胞,通过载体的复制和细菌的繁殖便可以取得这一基因DNA的大量纯制品,如果这一基因得以在细菌中表达,还可以获得这一基因所编码的蛋白质。这对于分子遗传学研究是一种十分有用的方法。此外,在取得某一个基因以后,还可以在离体条件下通过化学或生物化学方法使它发生预定的结构改变,然后再把突变基因引入适当的宿主细胞,这一方法有助于对特定基因的结构和功能的研究。
和其他学科的关系 分子遗传学是从微生物遗传学发展起来的。虽然分子遗传学研究已逐渐转向真核生物方面,但是以原核生物为材料的分子遗传学研究还占很大的比重。此外,由于微生物便于培养,所以在分子遗传学和中微生物遗传学的研究仍将占有重要的位置。
分子遗传学方法还可以用来研究蛋白质的结构和功能。例如可以筛选得到一系列使某一蛋白质失去某一活性的突变型。应用基因精细结构分析可以测定这些突变位点在基因中的位置;另外通过顺序分析可以测定各个突变型中氨基酸的替代,从而判断蛋白质的哪一部分和特定的功能有关,以及什么氨基酸的替代影响这一功能等等。例如乳糖操纵子的调节基因产物是一种既能和操纵基因 DNA结合又能和乳糖或其他诱导物结合的阻遏蛋白。分子遗传学研究结果说明阻遏蛋白的氨基端的60个氨基酸和DNA的结合有关,其余部分和诱导物的结合有关,而且还说明这一部分蛋白质呈β片层结构,片层结构的顶端暴露部分最容易和诱导物相结合。麦芽糖结合蛋白的信号序列、λ噬菌体的阻遏蛋白等的结构和功能问题也都曾用分子遗传学方法进行研究而取得有意义的结果。目前基因分离和DNA顺序分析方法进展迅速,而一些以微量存在的蛋白质却难以分离纯化。在这种情况下,根据DNA 顺序分析结果和遗传密码表便可以得知这一蛋白质分子的氨基酸顺序。
生物的研究过去着眼于形态方面的演化,以后又逐渐注意到代谢功能方面的演变。自从分子遗传学发展以来又注意到 DNA的演变、蛋白质的演变、遗传密码的演变以及遗传机构包括核糖体和tRNA等的演变。通过这些方面的研究,对于生物进化过程将会有更加本质性的了解。
分子遗传学也已经渗入到以个体为对象的生理学研究领域中去,特别是对免疫机制和的作用机制的研究。随着的提出,目前已经确认动物体的每一个产生抗体的细胞只能产生一种或者少数几种抗体,而且已经证明这些细胞具有不同的基因型。这些基因型的鉴定和来源的探讨,以及免疫反应过程中特定克隆的选择和扩增机制等既是也是分子遗传学研究的课题。
将雌性激素注射雄鸡,可以促使雄鸡的肝脏细胞合成卵黄蛋白。这一事实说明雄鸡和雌鸡一样,在肝脏细胞中具有卵黄蛋白的结构基因,激素的作用只在于激活这些结构基因。激素作用机制的研究也属于分子遗传学范畴,属于基因调控的研究。
个体发生过程中一般并没有基因型的变化,所以发生问题主要是基因调控问题,也属于分子遗传学研究范畴。
分子遗传学研究的方法,特别是重组DNA技术已经成为许多遗传学分支学科的重要研究方法。分子遗传学也已经渗入到许多生物学分支学科中。以分子遗传学为基础的遗传工程则正在发展成为一个新兴的工业生产领域。
一个旁氏表(Punnett square),显示了带有两种花色基因(紫花B和白花b)的豌豆杂交后的结果。在最基本的水平上,生物体中的遗传表现为离散性状,即基因型。[21]这种特点是由孟德尔首次观察到,他研究了豌豆中遗传性状的分离现象。在研究花色的实验中,孟德尔观察到豌豆花的颜色只有两种:紫色和白色,却没有任何一朵显示出两种颜色的中间色。这些来自于同一基因却不同且离散的版本被称为等位基因。
在豌豆的例子中,每一颗豌豆都含有一个基因中的两个等位基因,并且子代可以从父母分别继承其中的一个等位基因。许多生物,包括人类,都有这样的遗传规律。具有相同的两个等位基因的生物体被称为纯合体,而具有不同等位基因的生物体则被称为杂合体。
一个给定的生物体的等位基因的组合形式就是该生物体的基因型,而对于这种组合所表现出来的性状就是该生物体的表现型。当生物体是杂合体时,常常有一个等位基因是显性基因,显性基因决定了生物体的表现型,而另一个基因就被称为隐性基因,其性状在显性基因存在时不会被表现出来。有一些等位基因没有完全的显性,即“非完全显性”,其表现为一种中间状态的表现型,或者两个等位基因无显隐性之分可以同时表现出对应性状。
当一对生物体繁殖后代时,它们的下一代随机地继承父母的两个等位基因中的一个。这些对于离散遗传和等位基因分离的观察结果被总结为孟德尔第一定律(分离定律)。
遗传系谱图,可以帮助追踪性状的遗传规律。遗传学家利用注释和图解来描述遗传。一个基因可以用一个或几个字母来表示,并且用大写字母表示显性基因,小写字母表示隐性基因。“+”常常被用于标识一个基因的正常非突变的等位基因。
在杂交实验中(特别是在讨论孟德尔定律时),父母代被标示为“P”代,其下一代标示为“F1”(第一代)。F1代的子代就被称为“F2”(第二代)。可以用于预测杂交结果的常用图解是旁氏表(Punnett square,又称为“棋盘法”)。
在研究人类遗传疾病时,遗传学家常常利用系谱图来展示遗传性状。这些图表将一个性状的遗传关系以家族谱(family tree)的形式表现出来。
多基因的相互作用
人类的高度是一个复杂的遗传性状。来自法兰西斯·高尔顿的1889年的数据显示后代高度之间的关系是一个父母平均高度的方程。而从中计算的后代高度与真实值之间依然存在偏差,表明环境对这一性状也有重要影响。生物体具有成千上万个基因,并且在有性繁殖的生物中,这些基因的分类是互相独立的。这就意味着对应豌豆的黄色或绿色的色彩等位基因的遗传与紫色或白色的花色等位基因的遗传是不相关的。这种现象被称为孟德尔第二定律(又称为“独立分配定律”),即来自父母的不同基因的等位基因被随机抽取来组成具有多种组合结果的子代。有一些基因不是独立归类的,这也就解释了遗传中的遗传连锁现象。
不同的基因常常能够通过某种方式来影响同一种性状。例如,在蓝眼玛莉(Blue-eyed Mary,一种植物)中存在一种能够决定花色为蓝色或洋红色的基因以及一种能够决定花是否有颜色(即白色或有色)的基因;当一株该种植物含有两个白色等位基因(决定花色的第二种基因的两个等位基因),则无论第一种基因所带的颜色基因的等位基因为何,它的花色都为白色。这种基因之间的作用关系被称为上位性或异位显性(epistasis),即第二种基因位于第一种基因的上位。
许多性状没有明显的可区分的特点(例如不同的花色),而表现为连续性的特点(如人类的身高和肤色)。这些复杂的性状是来自于许多基因共同作用的结果。这些基因的影响作用在不同程度上是由一个生物体所经历的环境所介导的。生物体的一个基因对于一种复杂性状产生的影响的程度被称为遗传力。对一种复杂性状的遗传力的测量是相对的:环境的变化性越大,环境对于性状变化的影响力也就增强,而基因对于性状变化的影响力也就越小(表现为遗传力降低)。例如,作为一种复杂性状,美国人身高的遗传力为89%;而在尼日利亚,由于人们所获得的食物和医疗保健的差异性较大(即较大的环境变化性),其身高的遗传力仅为62%。
DNA分子结构,双链之间通过氢键排列形成碱基配对。
细胞中染色体的结构。基因的分子基础是脱氧核糖核酸(DNA)。DNA由核苷酸相互连接而形成的链分子,其中的核苷酸有四类:腺苷酸(A)、胞嘧啶(C)、鸟苷酸(G)和胸腺嘧啶(T)。遗传信息就储存在这些核苷酸序列中,而基因则以连续的核苷酸序列存在于DNA链中。[31]病毒是唯一的例外,有一些病毒利用核糖核酸(RNA)分子来代替DNA作为它们的遗传物质。
DNA通常以双链分子的形式存在,并卷曲形成双螺旋结构。DNA中的每一个核苷酸都有自己的配对核苷酸在相反链(对应另一条链)上,其配对规则为:A与T配对,C与G配对。因此,双链中的每一条链都包含了所有必要的遗传信息。这种DNA结构就是遗传的物理基础:DNA复制通过将互补配对的双链分开并利用每条链作为模板来合成新的互补链,从而达到复制遗传信息的目的。
不同基因沿着DNA链线性排列形成了染色体。在细菌中,每一个细胞都有一个单一的环状染色体;而真核生物(包括动物和植物)则具有多个线形染色体。这些染色体中的DNA链常常会非常长;例如,人类最长的染色体的长度大约为247百万个碱基对。染色体DNA上结合有能够组织和压缩DNA并控制DNA可接触性的结构蛋白,从而形成染色质;在真核生物中,染色质通常是以核小体为单位组成,每一个核小体由DNA环绕一个组蛋白核心而形成。一个生物体中的全套遗传物质(通常包括所有染色体中DNA的序列)被称为基因组。
仅含有一套染色体的生物被称为单倍体生物;大多数的动物和许多植物为双倍体生物,它们含有两套染色体(姐妹染色体),即含有每个基因的两个拷贝。一个基因的两个等位基因分别位于姐妹染色体上的等同的基因座,每一个等位基因遗传自不同亲本。
华尔瑟·弗莱明1882年的著作《细胞基质、细胞核以及细胞分裂》中描述真核细胞分裂的插图。染色体被复制、聚集和组织。随后,当细胞分裂开始时,复制后的染色体分别被分离进入两个子细胞中。性染色体是双倍体生物中染色体的一个例外,它是许多动物中的一种特异化的染色体,决定了一个生物体的性别。在人类和其他一些哺乳动物中,性染色体分为X和Y两类。Y染色体只含有很少量的基因,能够触发雄性特征的发育;而X染色体与其他染色体类似,也含有大量与性别决定无关的基因。雌性具有两个X染色体,而雄性具有一个Y染色体和一个X染色体。这种X染色体拷贝数的差别是性连锁的遗传病具有特殊遗传规律的原因。
当细胞分裂时,它们的基因组被复制产生两份拷贝,每个子细胞继承其中的一份。这一过程被称为有丝分裂,它是繁殖的最简单形式,也是无性繁殖的基础。无性繁殖也能够发生在多细胞生物体中,子代从单一亲本处继承其基因组,即子代与亲本具有等同的基因组。这种子代与亲本在遗传上等同的现象被称为克隆。
真核生物常常利用有性繁殖来产生后代,其后代含有分别遗传自不同亲本的混合的遗传物质。有性繁殖的过程是一个介于基因组单拷贝(单倍体)和双拷贝(双倍体)之间的一个转换过程。[23]双倍体生物通过不复制DNA的分裂来形成单倍体,所生成的单倍体子细胞含有每对姐妹染色体中的任意一个。两个单倍体细胞融合并将各自的遗传物质组合在一起来重新生成一个含配对染色体的双倍体细胞。多数动物和许多植物在它们的生命周期的多数时间内是双倍体,只有生殖细胞为单倍体形式。
虽然细菌没有单倍体/双倍体的有性繁殖方式,它们也有许多获得新的遗传信息的手段。一些细菌能够发生接合,将一小段环状DNA传递到另一个细菌细胞内。细菌还能够从环境中摄入DNA片断,并将之整合到自己的基因组中,这种现象被称为转化。这些进程导致了基因的水平转移,即无亲缘关系的生物体之间进行遗传信息的传输。
遗传密码:DNA通过信使RNA作为中间载体编码蛋白质。
血红蛋白能够在哺乳动物血液中运输氧气。图中显示了血红蛋白在携氧和脱氧状态之间的结构变化。
单个氨基酸突变导致血红蛋白形成纤维。基因通常是通过生成所编码的蛋白质(执行细胞中大多数功能的复杂的生物大分子)来表现它们的功能性影响。蛋白质是由氨基酸所组成的线性链,而基因的DNA序列(通过RNA作为信息的中间载体)被用于产生特定的蛋白质的氨基酸序列。这一过程的第一步是由基因的DNA序列来生成一个序列互补的RNA分子,即基因的转录。
通过转录产生的RNA分子(信使RNA)被用于生产相应的氨基酸序列,这一转换过程被称为翻译。核酸序列中的每一组三个核苷酸组成一个密码子,可以被翻译为20种出现于蛋白质中的氨基酸中的一个,这种对应性被称为遗传密码。[41]这种信息的传递是单一方向性的,即信息只能从核苷酸序列传递到氨基酸序列,而不能从氨基酸序列传递回核苷酸序列,这一现象被弗朗西斯·克里克称为分子生物学中心法则。[42]
特定的氨基酸序列决定了对应蛋白质的独特的三维结构,而蛋白质结构则与它们的功能紧密相连。[43][44]一些蛋白质是简单的结构分子,如形成纤维的胶原蛋白。蛋白质可以与其他蛋白质或小分子结合;例如,作为酶的蛋白质通过与底物分子结合来执行催化其化学反应的功能。蛋白质结构是动态的;例如,血红蛋白在哺乳动物血液中捕捉、运输和释放氧气分子的过程中能够发生微小的结构变化。
基因序列上的单个核苷酸变化(密码子改变)可能会导致所编码蛋白质的氨基酸序列相应改变。由于蛋白质结构是由其氨基酸序列所决定的,一个氨基酸的变化就有可能通过使结构失去稳定性或改变蛋白质表面而影响与该蛋白质其他蛋白质和分子的相互作用,而引起蛋白质性质发生剧烈的改变。例如,镰刀型细胞贫血症是一种人类遗传性疾病,是由编码血红蛋白中的β-球蛋白亚基的基因中的一个核苷酸突变所引起的,这一突变导致一个氨基酸发生改变从而改变了血红蛋白的物理性质;[45][46]在这一疾病中,突变的血红蛋白互相结合在一起,堆积而形成纤维,从而扭曲了携带血红蛋白的红血球的形状。这些扭曲的镰刀状细胞无法在血管中通畅地流动,容易堆积而阻塞血管或者被降解,从而引起贫血疾病。
也有一些基因被转录为RNA分子后却不被翻译成蛋白质,这些RNA分子就被称为非编码RNA。在一些例子中,这些非编码RNA分子(如核糖体RNA和转运RNA)折叠形成结构并参与部分关键性细胞功能。还有的RNA(如microRNA)还能够通过与其他RNA分子杂交结合而发挥调控作用。
转录因子与DNA结合,影响了所结合基因的转录。一个生物体的基因组含有数千个基因,但并不是所有的基因都需要保持激活状态。基因的表达表现为被转录为mRNA,然后再被翻译成蛋白质;而细胞中存在许多方式可以来控制基因的表达,以便使蛋白质的产生符合细胞的需求。而控制基因表达“开关”的主要调控因子之一就是转录因子;它们是一类结合在基因的起始位点上的调控蛋白,可以激活或抑制基因的转录。例如,在大肠杆菌细菌基因组内存在着一系列合成色氨酸所需的基因。然而,当细菌细胞可以从环境中获得色氨酸时,这些基因就不被细胞所需要。色氨酸的存在直接影响了这些基因的活性,这是因为色氨酸分子会与色氨酸操纵子(一种转录因子)结合,引起操纵子结构变化,使得操纵子能够结合到合成色氨酸所需基因上。色氨酸操纵子阻断了这些基因的转录和表达,因而对色氨酸的合成进程产生了负反馈调控作用。
多细胞生物中的基因表达的差异性非常明显:虽然各类细胞都含有相同的基因组,却由于不同的基因表达而具有不同的结构和行为。多细胞生物中的所有细胞都来源于一个单一细胞,通过响应外部或细胞之间的信号而不断分化并逐渐建立不同的基因表达规律来产生不同的行为。因为没有一个单一基因能够负责多细胞生物中的各个组织的发育,因此这些规律应来自于许多细胞之间的复杂的相互作用。这些过程都要通过基因调控来完成。
真核生物体内的染色质中存在着能影响基因转录的结构特点,常常表现为DNA和染色质的修饰形式(如DNA的甲基化),而且能够稳定遗传给子细胞。这些特点是“附加性”的,因为它们存在于DNA序列的“顶端”并且可以从一个细胞遗传给它的下一代。由于这些附加性特点,在相同培养基中生长的不同的细胞类型依然保持其不同的特性。虽然附加性特点在整个发育过程中通常是动态的,但是有一些,例如副突变(paramutation)现象可以被多代遗传,也是DNA是遗传的分子基础这一通用法则的极少数例外。
通过提供冗余,基因复制允许发生变异:即使一个基因在复制过程中发生突变而失去原先的功能也不会对生物体造成伤害。在DNA复制的过程中,第二链的聚合中偶尔会产生复制错误。这些错误被称为突变,它们能够对于一个生物体的表现型产生影响,特别是当它们位于一个基因的蛋白质编码区中时。错误率通常非常低:每0.1 - 1亿个碱基才会出现1个错误;这是由于DNA聚合酶具有“校对”能力。没有校对机制则错误率会增加1000倍,例如许多病毒所依赖的DNA或RNA聚合酶缺乏校对能力,这使得病毒复制过程具有很高的突变率。能够增加DNA发生改变的几率的因素被称为突变原:一些化学品常常可以通过影响正常的碱基对结构来提高DNA复制中的错误率,而紫外线能通过破坏DNA结构来诱发突变。由于对DNA的伤害在自然界中随时都会发生,细胞则利用DNA修复机制来修复DNA中存在的错误配对和断裂,但有时也无法将受破坏的DNA还原到破坏前的序列。
在利用染色体互换来交换DNA和重组基因的生物体中,减数分裂过程中所出现的配对错误也会导致突变。当相似序列导致姐妹染色体产生错误配对时,这种染色体互换出现错误的可能性非常大;这使得基因组中一些区域更趋向于以这一方式发生突变。这些错误能够对DNA序列产生很大的结构变化:整个区域的重复、倒位或删除,或者不同染色体之间发生意外性的交换(被称为染色体易位)。
基于对多个同源基因序列的比较结果所构建的进化树。突变会使生物体具有不同的基因型,并可能导致不同的表现型。许多突变对于生物体的表现型、健康和繁殖适应性基本没有影响。有影响的突变则往往是有害的,但也有少量是有益的。在对果蝇的研究中发现,如果一个突变改变了基因所编码的蛋白质,那这一突变很可能是有害的(大约有70%的此类突变具有破坏性影响,而剩余的突变则是中性的或微弱有益的)。
群体遗传学是研究基因变异在生物群体中的分布和这一分布的时间变化性。一个群体中的一个等位基因的变化频率会受到自然选择的影响,具有更高的存活率和繁殖率的等位基因能够随着时间而越来越频繁地出现在该群体中。此外,遗传漂变能够引发等位基因出现频率的随机变化而不受自然选择的影响。
在经过多个世代的传承后,生物体的基因组会发生改变,引起被称为进化的现象。突变和对于有益突变的选择使得一个物种不断地进化到能够更好地在所处的环境中生存下来的形式,这一过程被称为适者生存。新的物种的形成常常是由于地理分离而造成的,地理上的分离使得不同种群能够在遗传学上独立发展而产生分化。遗传学定律在群体生物学和进化研究中的应用被总结为现代综合理论。
由于进化过程中的序列分化和变化,物种的DNA序列之间的差异可以用作“分子时钟”(molecular clock)来计算物种之间的进化距离。遗传比较被普遍认为是鉴定物种之间亲缘关系的最准确的方法,过去常用的方法则是比较物种之间的表现型的特征。物种之间的进化距离可以用进化树来综合表示,进化树可以表示由共同祖先随时间分化而来的物种之间的亲缘关系,但不能表示无亲缘关系的物种之间的遗传物质的转移(被称为基因水平转移,在细菌中非常普遍)。
模式生物与遗传学
黑腹果蝇(Drosophila melanogaster)是一种流行于遗传学研究中的模式生物。一开始遗传学家们的研究对象很广泛,但逐渐地集中到一些特定物种(模式生物)的遗传学上。这是由于新的研究者更趋向于选择一些已经获得广泛研究的生物体作为研究目标,使得模式生物成为多数遗传学研究的基础。[64]模式生物的遗传学研究包括基因调控以及发育和癌症相关基因的研究。
模式生物具有传代时间短、易于基因操纵等优点,使得它们成为流行的遗传学研究工具。目前广泛使用的模式生物包括:大肠杆菌(Escherichia coli)、酿酒酵母(Saccharomyces cerevisiae)、拟南芥(Arabidopsis thaliana)、线虫(Caenorhabditis elegans)、果蝇(Drosophila melanogaster)以及小鼠(Mus musculus)。
医学相关的遗传学研究
医学遗传学的目的是了解基因变异与人类健康和疾病的关系。当寻找一个可能与某种疾病相关的未知基因时,研究者通常会用遗传连锁和遗传系谱来定位基因组上与该疾病相关的区域。在群体水平上,研究者会采用孟德尔随机法来寻找基因组上与该疾病相关的区域,这一方法也特别适用于不能被单个基因所定义的多基因性状。一旦候选基因被发现,就需要对模式生物中的对应基因(直系同源基因)进行更多的研究。对于遗传疾病的研究,越来越多发展起来的研究基因型的技术也被引入到药物遗传学中,来研究基因型如何影响药物反应。
癌症虽然不是传统意义上的遗传病,但被认为是一种遗传性疾病。癌症在机体内的产生过程是一个综合性事件。机体内的细胞在分裂过程中有一定几率会发生突变。这些突变虽然不会遗传给下一代,但会影响细胞的行为,在一些情况下会导致细胞更频繁地分裂。有许多生物学机制能够阻止这种情况的发生:信号被传递给这些不正常分裂的细胞并引发其死亡;但有时更多的突变使得细胞忽略这些信号。这时机体内的自然选择和逐渐积累起来的突变使得这些细胞开始无限制生长,从而成为癌症性肿瘤(恶性肿瘤),并侵染机体的各个器官。
相关研究技术
琼脂平板上的大肠杆菌菌落,细胞克隆的一个例子,常用于分子克隆。可以在实验室中对DNA进行操纵。限制性内切酶是一种常用的剪切特异性序列的酶,用于制造预定的DNA片断。[69]然后利用DNA连接酶将这些片断重新连接,通过将不同来源地DNA片断连接到一起,就可以获得重组DNA。重组DNA技术通常被用于在质粒(一种短的环形DNA片断,含有少量基因)中,这常常与转基因生物的制造有关。将质粒转入细菌中,再在琼脂平板培养基上生长这些细菌(来分离菌落克隆),然后研究者们就可以用克隆菌落来扩增插入的质粒DNA片断(这一过程被称为分子克隆)。
DNA还能够通过一个被称为聚合酶链锁反应(又被称为PCR)的技术来进行扩增。[70]利用特定的短的DNA序列,PCR技术可以分离和扩增DNA上的靶区域。因为只需要极少量的DNA就可以进行扩增,该技术也常常被用于DNA检测(检测特定DNA序列的存在与否)。
DNA测序与基因组
DNA测序技术是遗传学研究中发展起来的一个最基本的技术,它使得研究者可以确定DNA片段的核苷酸序列。由弗雷德里克·桑格和他的同事于1977年发展出来的链终止测序法现在已经是DNA测序的常规手段。在这一技术的帮助下,研究者们能够对与人类疾病相关的DNA序列进行研究。
由于测序已经变得相对廉价,而且在计算机技术的辅助下,可以将大量不同片断的序列信息连接起来(这一过程被称为“基因组组装”),因此许多生物(包括人类)的基因组测序已经完成。这些技术也被用在测定人类基因组序列,使得人类基因组计划得以在2003年完成。随着新的高通量测序技术的发展,DNA测序的费用被大大降低,许多研究者希望能够将测定一个人的基因组信息的价格降到一千美元以内,从而使大众测序成为可能。
大量测定的基因组序列信息催生了一个新的研究领域——基因组学,研究者利用计算机软件查找和研究生物的全基因组中存在的规律。基因组学也能够被归类为生物信息学(利用计算的方法来分析生物学数据)下的一个领域。
→如果您认为本词条还有待完善,请 编辑词条
上一篇消化系统疾病的饮食治疗 下一篇艾滋病防治研究进展
词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
0