遗传学基本课程

学习术语

您可能听过像「DNA」和「基因」这样的术语;或者如果您真的很专业,甚至听过像「转译」和「遗传」这样的术语。或者甚至可能是研究生级的「SNP」和「表观遗传学」。

如果您已经知道所有这些术语,那太好了,您已经会讲遗传学的语言了。但是也许您可以来复习一下遗传学。或者,也许这些术语对您来说是全新的。不管您对遗传学的阅读水平如何,理解词汇是绝对必要的;尤其在个人化的医学和营养时代,您对遗传学的知识是绝对重要的。

这是遗传学一系列四课基本课程的第一课,您将从学习遗传学关键术语的定义开始。学习基础知识将帮助您更深入了解遗传学。

一旦熟悉了遗传学的词汇,您就可以前进到遗传学基本课程—DNA和基因的基础知识。接下来,这些信息都会使用在遗传、进化论和血统的文章中。然后,您将通过最后一部份「遗传学与您的健康」来结束您的遗传学速成课程。透过每个月一篇的新文章,您将对遗传学有深入的了解,因此您就可以对您的健康做出明智的决策。

现在让我们从最基础开始。

遗传学常见术语的定义

在深入了解您的遗传如何确定您是谁之前,先了解26个常见术语是非常重要的。它们能帮助您了解遗传对您长相和细胞功能的影响、为什么您孩子的长相和行为会是这样,以及遗传如何影响您的健康。

我们首先来定义一些遗传学的相关术语。

细胞核:在技术上,细胞核是一种胞器—细胞内的一个独立结构。您的细胞核含有从父母那里获得的所有遗传物质,通常被称为基因组或DNA。细胞核的工作是在细胞分裂时保护、组织和复制DNA。

基因组:指所有的遗传物质。

DNA脱氧核糖核酸(deoxyribonucleic acid)的缩写。DNA是所有遗传信息的载体。您从父母遗传的DNA,经组装后的特定顺序决定了您的长相以及您的细胞如何工作。

核苷酸/碱基:这两个词可互换使用,是指DNA和RNA的各个基本构件。DNA由四个核苷酸/碱基所组成:腺嘌呤(adenine),鸟嘌呤(guanine),胞嘧啶(cytosine)和胸腺嘧啶(thymine),它们通常在DNA中分别被简称为A、G、C、T。

碱基对:从化学和分子的角度而言,DNA是一种双股的分子。但它也是反平行的,这表示DNA是由两个相同但相反方向的股所组成。可以把它想成:一股从「A到Z」,另一股则从「Z到A」。

这两个股通过一组相对较弱的化学键而彼此结合。您可以把这些氢键想象成像粘扣带,它们可以在需要时绑定在一起,但在必要时也可以拉开。

重要的是,一个碱基将只与另一个互补性的碱基相结合。例如,腺嘌呤只与鸟嘌呤配对(鸟嘌呤也只和腺嘌呤配对),而只有胞嘧啶可以与胸腺嘧啶配对(胸腺嘧啶只与胞嘧啶配对)。这些A-G和C-T的配对称为碱基对。这个基本的配对规则很重要,因为它是生殖和细胞分裂的核心。

染色体:DNA被包在细胞核中的最普遍的方式。染色体将大量的DNA组织成明确的紧密结构,帮助组织并保护DNA。生物体的染色体数量差异很大,它们可以从少至一个,到几百个,甚至超过10,000个染色体。人类有23对,即46个染色体。

基因:您的遗传物质的一个进一步的子组织。它是一个短小、离散的DNA片段。如果DNA是一本书,可以把基因视为其中的个别章节。这些DNA(基因)的章节是细胞制造蛋白质或酶的说明书。具体而言,基因告诉细胞组装氨基酸的适当顺序,以构建一个三维蛋白质或酶的结构。人类有20,000至25,000个基因。

基因表达:基因内或基因周围的某处(最常见的是开始处)是负责打开或关闭基因的特殊DNA序列(想象电灯开关),基因也可以维持一直开启。它们的基因产物(蛋白质或酶)一直被制造出来,通常处于一个较低而一致的水平。基因表达的两个主要过程—分别读取基因然后制造蛋白质,分别称为转录和转译。

转录:细胞读取基因内所含信息的过程。该信息会被复制到RNA信使分子中,并从细胞核发送到细胞的其他部分。 

RNA核糖核酸(ribonucleic acid)的缩写,与DNA的化学性质非常相似。RNA被认为是主要的信使。它将包含在DNA(基因)中的短片段信息传递到细胞内的其他位置;RNA特别能使这些信息被转变成细胞的功能单位—蛋白质和酶。RNA中的信息被分割成称为密码子的三个核苷酸/碱基。

密码子:RNA分子中的一组三个连续的核苷酸/碱基。三个核苷酸/碱基的顺序是特定氨基酸的编码。RNA中的密码子被读取后,细胞就开始组装氨基酸链—蛋白质和酶的基本构件。这个过程被称为转译。

转译:细胞将RNA信使分子转变成蛋白质或酶的过程。

蛋白质/酶:这两个字通常可互换地用来描述以化学键联合在一起的氨基酸链。一旦各个氨基酸结合在一起,它们就会自己折迭起来形成我们经常称为蛋白质或酶的最终功能性产物。虽然所有的酶都是蛋白质,但并非所有的蛋白质都是酶。按照惯例,当蛋白质在细胞中的功能是静态或结构时,科学家将它称为蛋白质。而「酶」这个名词则是用来描述一种主动发挥作用的蛋白质(如将食物转化为能量的酶)。

DNA复制:复制一个完全相同DNA的过程。当细胞分裂时,它也必须复制其DNA。发生这种情况是因为像粘扣带一般的氢键可以被剥离。一股留在旧细胞内,另一股则移动到新的细胞。由于碱基配对规则(只能A-G和C-T互相配对),每个细胞都可以重建缺少的反平行股。这最终使DNA再次成为双股。这个过程可以随着细胞分裂而重复多次。

遗传:将遗传信息传给年轻下一代的过程。

表现型:基于基因序列(基因型)的可见身体性状。想想您的长相和行为。

基因型:基因的DNA序列。

显性基因:当显性和隐性基因竞争表达时,显性基因会胜出。例如,当父母中一个是棕色眼睛(显性基因),另一个是蓝眼睛(隐性基因)时,他们的孩子将会有棕色的眼睛—显性基因胜出。

隐性基因:如果有显性基因同时存在,则隐性基因就不表达。但是,因为每个基因都有两个拷贝,当这两个拷贝都是隐性的时,就可以表达隐性特征。当从父母获得蓝眼睛的两个基因拷贝时,孩子就会有蓝眼睛。

倍体:指生物体中染色体的数量或DNA配对数。 

二倍体:二的意思就是「两个」。当细胞是二倍体时,它具有其DNA的两个拷贝。这是大多数细胞的正常状态,通常DNA是双链的。细胞必须具有处于二倍体状态的DNA才能分裂和自我复制。 

单倍体:「单」是指「一半」。当细胞是单倍体时,它的DNA拷贝只有一半(或一个)。单倍体细胞只会是生殖细胞如精子和卵子。这很重要,因为当精子细胞和卵细胞融合(受精)时,两个半拷贝DNA即重组成为完整的二倍体基因组。一旦这个新细胞变成二倍体,它就会开始成长和分裂。

表观遗传:它可以被视为第二个遗传密码,位于您的主要DNA序列之上。这个密码由许多化学信号组成。有许多化学信号可以修饰DNA序列或细胞核内组织DNA的结构。根据特定的化学修饰,基因可以开启或关闭。

有趣的是,您的饮食和生活方式会极大地影响这种化学密码(表观基因组)以及您的基因被调控的方式。它也证明您的表观遗传密码很大程度上是可继承的;这意味着,您父母 (甚至是祖父母)的生活方式会影响您的基因如何表达,您过着怎样的生活也会影响您孩子的基因表达。

一般认为表观基因组对下一代的健康状态(好或坏)负有很大的责任。例如,精瘦而健康的父母倾向于会拥有精瘦而健康的孩子。而且,父母患有某些疾病的孩子,在晚年罹患这种疾病的风险可能也会增加。

突变:原始DNA序列的变化。这会通过许多不同的过程而发生,例如:暴露于环境中的化学物、不正确的DNA复制以及DNA的物理性破坏/损坏。

最终,突变会影响其所编码的最终蛋白质/酶结构的功能。突变对细胞产生影响的程度有轻重之分,从没有效果到有益效果,到不利的效果。不会改变最终的蛋白质结构或功能的突变,就称它为沉默突变。

有益的突变赋予细胞或生物体改善的功能或存活的能力,这通常被认为是进化或适者生存的基础。突变也可能是有害的;如果原始DNA序列的改变对蛋白质的结构或功能具有负面影响,则可能对细胞功能产生严重后果。若在基因的必要位置发生负性突变,则蛋白质功能受到显著影响并最终导致存活能力下降。关键基因或蛋白质的一些常见的负突变会导致癌症。

癌症:由不受控制的细胞分裂所引起的疾病。通常情况下,细胞通过严格控制细胞分裂的停止或启动,保证整个过程正常运行。但是,这个过程可能会被干扰;这可能是由于突变、暴露于环境中的化学物质、物理性损伤等而发生的。但重要的是要注意并非所有突变都会导致癌症,而且并非所有的癌症都是突变的结果。最终,不受控制的细胞分裂导致异常细胞积聚成称为肿瘤的生长物质。如果这种肿瘤导致组织或器官功能受损,组织和器官就会慢慢失去功能,最后导致死亡。

SNP(单核苷酸多型性):在单个DNA碱基上的突变。由于这是基因中一个非常小的突变,所以SNP大部分是沉默突变,并且很少导致癌症。然而,当SNP发生在基因中的关键位置时,它们就会影响蛋白质功能—也许是正面的,也许是负面的。SNP在科学和医学领域受到越来越多的关注;例如,它们被使用于帮助诊断代谢缺陷或确定患者对某些药物的反应。

 


DNA和基因的基本知识

这是遗传学基本课程系列四部分的第二部分,如果您错过了第一部分,请先阅读遗传学基本课程—学习术语。在进入本文之前,先熟悉一下术语,可帮助您在深入学习之前了解重要词汇。

遗传学既非常简单,同时又异常地复杂。让我们从遗传学究竟是什么开始吧?根据韦氏词典,遗传学是「生物学的一门分支学问,其内容涉及生物体的遗传和变异」和「生物体的遗传构成和现象、类型、群组、或条件」。

简言之,遗传学就是研究什么使您变得既是人类又是独特的。这就必须感谢DNA。事实上,地球上每一个生物活体都含有DNA。细菌之所以成为细菌,鸟成为鸟,您成为人类,都是由于DNA。

DNA唯一的工作就是储存和分享讯息

许多人认为DNA是流体、是动态的并且不断变化。但事实上,DNA是一种静态和稳定的分子。无论是从石器还是从古老骸骨内,都有可能收集到DNA来进行研究,即使在千万年后。

用一个简单方法来思考,DNA就像建造房屋的蓝图。蓝图能传达很多讯息,但本身并不能建造房屋。它只能储存和分享讯息,需要有一支聪明而协调的工作团队来建造实际的家园。要有能阅读蓝图的工程师,有指导工人的工头,以及将所有东西组合在一起的工人。

DNA只不过是储存讯息和与细胞分享所储存的讯息而已;因此,您可以将DNA视为您细胞的蓝图。

DNA是非常大的分子

science, research and genetics concept - young scientist in safety glasses, face mask with test tube and virtual projection of dna molecule

DNA是您体内每个细胞核内的遗传性物质。虽然并非每个细胞都有细胞核(有些细胞有一个以上),但每个细胞核都有一个完整的DNA序列。

在每个细胞核中,DNA以单一(双链)分子形态存在。那是一个非常大的分子。人类DNA的长度在20亿到30亿个碱基之间。从这个角度来看,如果从一个细胞核取出DNA,然后在桌子上将它伸展开来,它的长度将是3至6呎(1至2公尺)。

另一种说明DNA大小的方法,是看它的总质量。如果您拿一个核苷酸碱基的平均重量乘以2(因为它是双链的),然后再乘以20到30亿(DNA的总长度),那已经是一个很大的数字了。但还没完;接着再将它乘以细胞核(或具有核的细胞)的总数,才是人体内DNA的总质量。

最后这个总数显示您体内的DNA大约在5克(0.2盎司或大约一张纸的重量)至50克(1.8盎司或大约一个鸡蛋的重量)之间。这是非常多的DNA。

这也说明了充满在每个细胞核内的DNA的紧密程度。它是一个令人无法想象的分子,竟然能放进如此微小的东西里面。

DNA在细胞核内具有高度复杂的排列

您的身体是由数万亿个细胞所组成的(准确说来,约有50万亿)。除了一些血球之外,约有75%的细胞至少有一个细胞核。在细胞核内就是您的DNA—每个细胞核内都有一个完全相同的DNA。

这怎么可能?基本上,DNA都会紧密打结。它会被自己缠绕折迭多次。但这DNA结仍是高度有秩序排列的,当需要取得它所持有的讯息时它能被(至少一部分)解开。

细胞对DNA所含讯息的需求是以特定的化学信号来修饰它,并与帮助整理DNA的蛋白质联合。其中一些化学信号持续的时间很短,其他的则能代代相传。这些化学信号被称为表观遗传密码。

通过这种表观遗传密码,细胞就能管理DNA的哪个部分被打开或关闭。这也为每种不同类型的细胞提供了独特的识别。尽管每个细胞都拥有完全相同的DNA,但细胞只会开启其所需要的DNA,并关闭它们不需要的DNA。例如,脑细胞只开启脑细胞DNA,肝细胞只开启肝细胞DNA,皮肤细胞只开启皮肤细胞的DNA,依此类推。 

DNA指示细胞制造蛋白质

那么,DNA如何告诉细胞做什么?

DNA由四种基本单位组成,这些被称为碱基的基本单位是腺嘌呤(adenine)、胸腺嘧啶(thymine)、鸟嘌呤(guanine)和胞嘧啶(cytosine),分别缩写为A、T、G、C。这是真正令人赞叹的地方;这四个DNA碱基反复不断地以一种独特的顺序重复着,使每一个人成为独特的个体。这些碱基(A、T、G、C)对您的个体负最终的一切责任:包括您的身高、外表、运动能力、以及您的细胞、组织和器官功能。

这是怎么做到的?

最简单方法就是用您在阅读文字(以英文为范例)的方式来联想。阅读时字母开始,然后字母被组成文字。DNA也一样,不过「DNA字母」只有四个A、T、G、C。当这四个碱基按特定的顺序排列时,它们就是要细胞制造蛋白质的指令。这些可能是将细胞结合一起的结构蛋白,也可能是酶(在细胞内起作用的蛋白质)。

另一个惊人的事实是,「DNA字典」中的每一个字都只有三个字母(或碱基)。这三个字母的字词被称为「密码子」。细胞能读取每个密码子,并且准确地知道将什么胺基酸(蛋白质的组成物质)放在一起,并以什么顺序排列;它也知道要使用多少个胺基酸。

在密码子里,有「从这里开始」和「在这里停止」的信号。例如,一些蛋白质只需要500个碱基就能传达它们对蛋白质的指令,其他则可多达220万个碱基。在500个碱基之下,它将产生具有约166个密码子的信息和约55个胺基酸长度的蛋白质。而220万个碱基长度将有733,333个密码子来产生具有约244,444个胺基酸的复合蛋白。

基因是DNA的一个片段,它指示制造蛋白质

基因被定义为DNA的基本物理和功能单位。它只不过是细胞制造一个或多个蛋白质的指令。如上述,DNA中有启动信号和停止信号。简言之,基因就是一个启动信号和停止信号之间的一切。

据估计,人类的整个DNA分子中有大约25,000个基因。估计的差异很大,因为人体内有100,000到超过1,000,000个各种不同的蛋白质。这些数字很难凑得对,因为一个基因能为少至一个或多达100个蛋白质编码。

DNARNA蛋白质:转录和转译

您可以将此密码子代码视为一种外国语文。这是细胞需要学习读取DNA并最终用来制造蛋白质的语言。事实上,遗传学家将这过程称为转录和转译,类似用来描述人类语言的措辞。

让我们更深入一点,来看看细胞如何准确地读取它的DNA。

说到制造蛋白质,这个顺序就很重要了:1)DNA,2)RNA,和3)蛋白质。

如上述,DNA是在细胞核中打了一个结的静态分子。但细胞无法在细胞核内制造蛋白质,制造蛋白质需要空间,所以它是在细胞核外的细胞空间中完成的。

那么这些讯息要如何离开细胞核?

有一种与DNA密切相关的分子称为RNA(核糖核酸)。一种特殊的酶(称为RNA聚合酶)会扫描DNA分子,寻找「从这里开始」的密码子,那指出该基因的开始。然后这种酶沿着DNA扫描并将DNA讯息转录成RNA讯息,这就是转录的过程。一旦这种酶来到「在这里停止」的密码子,它就会停止制造RNA分子。

然后这个新制造成的RNA分子就会离开细胞核,并立即被核醣体所接受。核醣体具有独特的能力,能读取RNA分子的讯息并将该讯息转译成胺基酸(蛋白质)顺序。核醣体一次只快速读取RNA讯息的一个密码子,并发信号给细胞,告诉细胞接下来要把胺基酸安置在哪里。

例如,密码子T-T-A是亮胺酸的「字」;密码子A-G-A编码精胺酸;密码子G-C-G表示丙胺酸。事实上,至少有一个密码子适用于所有的胺基酸,它是产生身体所需要的蛋白质和酶所必需具有的物质。

随着这个新的胺基酸链不断变长,它会开始折迭成其最终的立体形状。在最后一个胺基酸加入之后,新的蛋白质就从核醣体释放出来,并被定位到其最终目的地。然后核醣体会释出RNA讯息,并找寻另一个RNA分子来进行转译。

您的大部分基因跟香蕉相同

自2003年人类基因组测序完成以来,科学家们一直在努力弄清楚它的整个含义。最初认为,一旦我们知道了人类DNA中每一个碱基的顺序,就会带来科学和医学的大突破。

但过了多年以后,如今似乎出现了更多问题,这些问题甚至超过已经得到的答案。原因是:要读取我们的遗传密码来指出人类的区别几乎是不可能的。我们几乎都有相同的基因。是的,我们每个人都有一些跟您的指纹一样独特的部分。但就像指纹无法指出种族、身高、或体重(或这方面大部份的个人资料)一样,DNA也是如此。

diversity, race, ethnicity and people concept - international group of happy smiling men and women over white

为什么会这样?

首先,人类有超过99%的相同基因,剩下的1%以下基因则是决定您的个性。

根据估计,如果我们写一本书来发表遗传密码,那么它大约会有262,000页那么长;其中对每一个人大约只有500页是不同的。可见人类有多么相似。

我们与其他一些看起来距离很远的物种也很相似。例如,人类有:

  • 96%的基因与黑猩猩相似
  • 90%与猫相似
  • 85%与老鼠相似
  • 80%与牛相似
  • 61%与果蝇相似
  • 60%与鸡相似

您甚至有60%与香蕉相似!

这怎么可能?

事实证明,在细胞层面上,为数极多的物种的细胞都需要相同的基础基因和蛋白质才能发挥作用。除非一个细胞或有机体实际上需要新的不同的基因和蛋白质,才会开始变得高度特异化。

所以,正如您所看到的,DNA只是让您成为独一无二的人的起点,显然其中还有其他一些因素。

那么,究竟是什么使我们在整个人类中如此独特和多样化呢?请您务必研读本系列的下一部分,遗传学基本课程—遗传、进化论和血统。