基因检测科普讲座 (基因检测类科普视频)

【青稞营】第 120 次微课分享

分享嘉宾:郭一然 博士

郭一然博士,美国费城儿童医院研究科学家。资深生物信息分析专家、医学遗传学及基因组学专家。

发表 SCI 文章近60篇,其中包括 Nature,Science,Lancet,American Journal of Human Genetics 等。获得多项奖励,包括 Davis 基金会资助,进行神经性厌食症的遗传学研究。

2015年起成为美洲华人遗传学会(ACGA)终身会员,并在 2017 年底被推选为理事会成员。

基因科普讲座,生命科学之基因技术

基因科普讲座,生命科学之基因技术

今天主要讲人类遗传学、医学遗传学科研以及基因诊断的一些应用。

基因科普讲座,生命科学之基因技术

首先是介绍人类遗传学、医学遗传学科研,然后介绍一下基因检测服务,最后对未来发展趋势进行一些判断,是我自己个人的观点。

基因科普讲座,生命科学之基因技术

我们先对人类遗传学和医学遗传学进行定义。上一讲我们讲了人类遗传学。人类遗传学顾名思义是以人作为研究对象的遗传学。这个和其它的遗传学,比如动物、植物、微生物的遗传学还是有一些区别。最主要的区别来源于伦理学的限制。

伦理学对人类遗传学的限制

在其它遗传学里面,植物、动物方面的遗传学,科研人员以及科学家可以进行一些实验,像杂交和回交的实验。这些实验在动物和植物领域比较容易进行,而且没有人类遗传学中那么多的限制,但是在人类遗传学中开展这些实验就有限制。

因此,人类遗传学受到伦理学的限制,有很多研究方法就和动植物以及微生物遗传学的研究方法不太一样。有些时候只能用一些比较间接的形式进行研究,或者说在人类里面发现的某些规律,没用办法在人类身上直接进行实验、进行重现,所以只能在一些模式动物或者是模式生物里面进行重现。这就是伦理学的限制。

另外,还有一些社会学、法律方面以及心理学方面的考虑,尤其是对于患者(病人)或者是这些家庭来讲,一些考虑有的时候会起到很关键的决定性作用。

我们举一个简单的例子。如果一对夫妻曾经生了一个小孩,有某种遗传病,他们现在如果想要二胎的话,就会有一个很关键的决定:是不是要进行基因检测,或者说遗传检测。检测结果出来之后,如何根据这个结果来决定是不是继续保留正在怀孕中的胎儿。在一些隐性疾病高发的地区,比如像中国的南方的一些地区,广东广西等地,地中海贫血比较高发。

夫妻双方如果要是想生小孩的话,很可能需要做基因检测来看父母双方是不是有这种致病的突变,来判断胎儿是不是有可能得这种隐性的遗传病。这些都是需要考虑的,这就是人类遗传学以及医学遗传学的研究重点。

医学遗传学是研究基因与疾病间相互关系的医学分支,有时特指对遗传性疾病的诊断及管理,以区别于传染性疾病、肿瘤、癌症等其它的疾病,专门指这种遗传性疾病。

遗传学与基因组学

遗传学是比较传统的,针对单个基因的研究。而基因组学是比较新的学科,大概是从1999年左右或者再早一点,不会早于1980+年,只有30多年甚至更短的历史。基因组学是针对多个基因乃至全部的基因,比如人类的全部基因,或者说某种动物、某种植物的全部基因的研究。它有一个“组”学的概念。

另外,从基因组学还衍生出各种其它的组学,比如转录组学、蛋白质组学、代谢组学、表观基因组学等等。

这些组学以及现代医学的进展,都为目前所谓的精准医疗以及个体化医疗提供了无限的可能。这些在科研方面都是十分前沿的学科。各个国家,包括中国、欧美、日本、澳大利亚等国家,在这些科研方面投入了大量的资源和人力物力。国际合作也是十分常见。这也是大家寄予厚望的一组学科。

基因科普讲座,生命科学之基因技术

人类遗传学,医学遗传学的研究热点,我总结起来有这么几个。首先是人类(人群)的遗传学,或者叫群体遗传学。它是研究一个种群、一个群体的遗传结构及其变化规律,研究群体中基因的分布、基因频率、基因型频率,以及变异、改变、突变、维持和变化的一个学科。

另外,还有对常见、复杂多基因病的遗传学、基因组学研究。这方面的疾病就很多了,包括糖尿病、心脑血管疾病、代谢类疾病(比如肥胖)、血脂水平、血压水平、精神类疾病等等。

精神类疾病有我们比较熟悉的,比如自闭症、孤独症、精神分裂症、还有所谓的躁郁症、自杀倾向。

还有神经类的疾病,或者有一些神经退行性的疾病,比如像癫痫、老年痴呆症(也叫阿兹海默症)。

这些基本上属于多基因的,或者多因素的疾病,就是说,它有多个基因的相互作用,并不是单个基因的遗传规律,所以研究起来就和一会儿将要介绍的单基因病/遗传病的研究方法有所不同。

第三个研究热点是罕见单基因病遗传学研究,包括像染色体畸变导致的各种综合症,比如像唐氏综合症,它是由21号染色体多了一条导致的,还有十八三体(即第18号染色体多了一条),还有一些其它的综合症,有的是单基因导致的,有的是大片段的插入缺失导致的,有的是单个碱基导致的。

还有一些,比如像出生缺陷,先天性心脏病(先心病)这种在中国发病率最高的,在世界上发病率也很高的。还有一些地区性的,比如像血友病,还有我刚才提到的,中国南部高发的地中海贫血,这些都是属于遗传病的范畴。

遗传病和多基因疾病的区别

狭义的遗传病致病的因素比较清楚,或者说至少遗传规律比较清楚。我们只要对单个基因,或者比较少的基因,或者一段染色体区域,进行研究就够了,其它的就不用太关心。但是复杂的多基因的疾病,像前面提到的糖尿病、高血压,这些疾病是由多个基因的相互作用,研究起来和单基因的或者遗传性的疾病就不完全一样。

我本人从2009年加入费城儿童医院以来,非常幸运,跟着组里的领导及同事一起做了很多研究。首先是群体遗传学,然后是多基因疾病,后来是单基因疾病,都做过研究。所以我可以从比较概括的角度对这些疾病进行分享。因为做过具体的研究项目,所以比较熟悉。

基因科普讲座,生命科学之基因技术

首先我们讲群体遗传学以及与之相关的人类的演化历史。我推荐一本畅销书《人类简史》,是一个以色列人写的,讲的是我们人类发展的历史。

这本书的英文名叫 Homo Sapiens,这个词是拉丁文,它的意思是智人,很聪明的人的意思。Homo 是人,Sapiens 是智慧。

为什么叫 Homo Sapiens 呢?

在人类演化历史里,Homo Sapiens 是目前的一个发展阶段,之前还有很多其他的,人这个种下面不同的分类。人下面的不同的分类,由化石看到的有直立人、Neanderthal人、Denisova人、有北京周口店发现的山顶洞人,还有历史上曾经出现过的“人”。但是后来他们都灭绝了,最后只有智人活了下来。

当然这个也是人类演化/进化的一个理论。但是从化石上来讲,以及从现在的分子遗传学的证据来讲,这个理论十分接近历史发展的真实情况。只是有很多历史没法重现,所以我们只能称它为一个理论,但是这个理论对我来说,应该就是历史的现实。

在发现化石以后,人们又通过分子遗传学的方法进行分析,尤其是对遗传变异以及基因组变异进行分析,逐渐重现了人类演化的历史。

经过分析之后发现,人类最开始发源于东非,埃塞俄比亚附近的一个小村落。逐渐经过迁徙,先向北、向东走,走到中东那个地方,从中东分成了两支,有一支走向欧洲,另外一支走向东亚,经过东亚之后又继续走,经过白令海峡到达了北美洲,最后到达南美洲。

从东亚还有一支走东南亚这个方向,最后到达大洋洲,就是爪哇岛那边、巴布亚新几内亚,最后到达澳大利亚、新西兰附近。

其实还有一些,经过太平洋岛国,到达太平洋深处的一些小岛。

这个历史看起来很传奇,但是经过中性进化理论,以及线粒体、Y染色体、基因组进化速率分析,人们推断出来,这个理论也是十分接近于历史现实的走出非洲的理论。

人类最开始是从东非发源,逐渐散播到全世界。

基因科普讲座,生命科学之基因技术

从这个图上,我们还可以看到,在东非的人的基因组里,有很多小的不同颜色的圆点,这些圆点代表的是基因组的变异,代表的是每个人之间的差别。

逐渐往后走之后,有些圆点在迁徙过程中被划掉了,圆点也就越来越少。在南美洲那边的圆点就十分少了。这里指的是南美洲的土著,并不是现在的南美洲人。现在的南美洲人是当地的土著和欧洲的殖民者,以及非洲的黑奴之间进行人种融合的结果。当地的土著本身的遗传学结构已经发生很大的变化。

在东非人类发源的时候,遗传变异还是比较丰富的,但是逐渐遗传变异就丢失掉了,最后有的可能只剩下比较少的遗传变异了。

这也是对遗传数据进行分析,根据中性进化理论得出的结果。这也是走出非洲理论的一个依据。

人类基因组计划是从1999年开始到2003年完成的。这个计划极大地加速了群体基因组学、群体遗传学的发展。

这个人类基因组计划提供了一个可供参考的、标准的人类的基因组。其他人的基因组都去和这个参考的基因组进行比对,发现不一样的地方,就是与你这个人所在的人群,在人类进化历史过程中所留下来的一些印记。

根据这些印记可以看到整个的发展历史。

这个基因组另一个作用是,比如比对一个有病的人的基因组和真正健康的参考的基因组之间的区别,通过这种区别找到和疾病相关的基因。这就是人类基因组计划最初的设想。

中国也参与了这个计划的1%,这也是我们中国人十分自豪的事情。

随着人类基因组计划的实施与完成,后续国际上一些大的科研单位又组织了基因组变异计划。首先是单体型图计划 HapMap,项目包括270个人,非洲的90个人,亚洲的90个人,再加上欧洲的90个人。

然后又有一个千人基因组计划,更加扩大了计划里的样本量,达到了一千多人的数量级。后面又有其它的大型群体基因组学计划,还有一些国家级的基因组计划,比如像冰岛的基因组计划、英格兰的基因组计划,这些都是人类基因组计划之后的大型的国际协作项目。

与这些基因组计划相关的,并且也是同时发展的,是高通量的DNA检测技术成本的大幅下降。只有这种测序成本大幅下降之后,这种群体级别的DNA测序才有可能成为现实。

基因科普讲座,生命科学之基因技术

上图中可以看到,检测一个人的基因组所需要的花费(以美元计),最开始是十分昂贵的,差不多达到了一亿美元的水平,之后逐渐下降。从2001年开始到2007年左右这个价格按照所谓的摩尔定律在下降。

这个摩尔定律大概意思是说,每年成本都会下降一半,是一个递减的规律。

基因科普讲座,生命科学之基因技术

2001-2017年基因组测序成本(图片来源:NHGRI)

大家看那个图的纵轴是对数轴,按照摩尔定律,它应该是一个线性的递减。这个测序技术成本的下降,是一个超摩尔定律,就是比摩尔定律还要再快,所以尤其是从2007年开始有一个很大的拐点。这就是高通量的测序技术,也是一个我们看到的这个所谓的短序列,把长的DNA序列变成短的序列,然后再进行检测。这样一个技术导致成本急速地下降。

到2017年为止,可以看到,每一个人的基因组检测的成本(机器设备和生物试剂的成本),已经降到了1000美元,约合6000+人民币左右。虽然说仍然很高,但是比十几年前一亿美元这个级别已经下降太多了。而且估计在未来的两三年之内,这个成本还会下降,大概降到一半到1/3。

所以以后这种人的基因组数据,就是可以被老百姓以很廉价的价格就可以获得了。

现在群体水平检测基因组变异已经成为可能,于是我们就可以在群体水平上对每个人和参考基因组之间的差别进行比对,这就是所谓的单核苷酸多态性(SNP)位点。

每个人的序列大部分是一样的,但是在某些地方,比如SNP这个位点处,第一个人是一个A,第二个人是个G,第三个人是个T。这就是所谓的多态性位点。我们可以对这些多态性位点进行各种计算和分析,无论是对疾病风险的预测,或者是对族裔、祖源的追溯,或者是对体貌特征的判断,都是会有一些联系的。

基因科普讲座,生命科学之基因技术

我来说一下常见复杂多基因病的遗传学和基因组学。

首先我要介绍一个方法,就是所谓的全基因组关联分析方法 GWAS(Genome-Wide Association Study),找一些所谓 cases,就是有病的人,再配上一些,和它相互配对,叫 Matched Controls,就是正常人的对照组。有病例组,有对照组,再拿他们的基因组信息进行比对,比如在中间这个小点的图里,第一行可以看到,在病例组(Cases)里面有一个亮点,但是在对照组(Matched Controls)里面是没有亮点的,这就是病例和对照之间在基因组上的区别,我们就把这种基因组上的区别画出来,画到下面这个图里。

最开始在画这个图的时候,大家觉得它很像很多高楼由地平线上耸立,有点像当时纽约的曼哈顿,岛上有很多高楼大厦,所以就管这个图叫曼哈顿图。

在某些基因的位置,大家可以看到,有一个很高的凸起,这说明在这个位点处,病例和对照组之间的遗传变异的频率差别特别的明显。这个图从左到右,从一号染色体一直到22号的染色体排起来,能看到不同的基因在上面的分布。

曼哈顿图表现遗传变异差异频率的高低水平。一个(位)点越高,说明这个点所在的遗传变异在病例与对照组之间的频率差异越明显。如果病例与对照组当中的这种频率的差异不明显的话,说明病例与对照之间没有太多区别,应该就和这个疾病没有太多关联。

我们找的是区别很明显的,比如像下面这个图的左下角,2型糖尿病的关联基因,TCF7L2基因,这个也是我所在的实验室在2006年发现的一个基因,它的曼哈顿图长这个样子。

基因科普讲座,生命科学之基因技术

在发现TCF7L2基因之后,人们对这个基因的后续进行了很多功能学的研究,发现它的确对这个糖尿病的发病机制以及胰岛素分泌代谢,有很强的关系,后续对它还进行了一些药物研发方面的工作。

所以说,全基因组关联分析是一种十分有用的分析工具,而且它能够在人类众多的基因中找到和特定疾病相关联的基因。人类基因组大概一共有2万多个基因。如果从2万多个里找出10~30个和疾病高度相关联的基因,对于后续的研究是十分有帮助的。

基因科普讲座,生命科学之基因技术

这张图是美国人类基因组研究所以及欧洲分子学研究中心,他们做的关于 GWAS(关联基因)关联分析的一个总的概括。这是在 GWAS 发展了十年(2008年~2018年)以后,有如此多的研究发现被发表出来。

左边的图里23条染色体,每个染色体都被分成了许多小段。右边那个是一个放大的图,在每个小的染色体位点上有很多小的圆圈,每个圆圈都代表一个不同的疾病,说明有这么多疾病与这个基因相关联。

现在的分析结果是已经发现了58,000个位点和17,000种表型/疾病相关联,这些结果来自于5000项研究,已经发表了超过3,300篇文献。所以这十年是一个很大的发展,发现了很多新的基因,发现了很多和疾病相关联的位点。

这些对于疾病的研究,对于后续的药物的研发,都有很大的作用,而且对我即将介绍的基因检测的产品和服务也是有很大的帮助。

罕见的单基因的遗传性的疾病

基因科普讲座,生命科学之基因技术

这些疾病分几大类。第一类是染色体疾病,比如唐氏综合症。还有一种是单基因的疾病,比如像地中海贫血。还有线粒体的疾病,和其它的单基因疾病不太一样。另外就是一些遗传性的肿瘤,比如家族性的乳腺癌,在欧美地区比较高发。对家系的研究是主要的研究方向,因为这些疾病主要是以家系的方式呈现出来,对家系进行分析更有利于找到致病的基因。

在进行研究时,有一些参考的数据库是十分重要的。这也是人类知识的积累。比如像右边画出来的 OMIM数据库,集合了现在已知的7,000种单基因病以及基因与疾病相互联系的信息。

基因科普讲座,生命科学之基因技术

下面我也画了家系研究的方法、策略,以及分类,比如像最常染色体隐性遗传,常染色体显性遗传,X染色体伴性遗传。这些我们在中学里其实都是有接触过。

基因科普讲座,生命科学之基因技术

分析策略:首先是对大量的人进行测序,得到正常人的基因组的变异特征。正常人之间还是有不一样的,有些变异的存在对人的健康没有多大影响。

再看中间这个图,这是很大的一个数据库。它列出了千人基因组第一列,ESP第二列,ExAC第三列,以及gnomAD 第四列,这四个数据库的数量。最大的数据库 gnomAD的人群已经超过了13万人,这是我们主要使用的数据库。拿它作为参考标准,对每一个测序检测DNA 的人和参考标准进行对比(右下角的图),进行对比之后发现基因组上的异常。

基因科普讲座,生命科学之基因技术

介绍完科研方面的进展,我们来看一下基因检测,大家比较关心的一些服务以及应用

首先我觉得科研与应用服务之间是相互促进的关系。服务是面向消费者的产品。科研的是基础,提供严谨的科学和医学的证据。服务和应用的市场需求可以指出科研新的方向。

应用的种类我分成这么几类。第一类是直接面向消费者的,就是 DTC (Direct To Consumer)。这一类在全球都是比较热门的。下面又可以分成两类,一类是医学类的直接面向消费者的,另一类是非医学类的。

像这种医学类的直接面向消费者的产品一般是对复杂疾病以及肿瘤、癌症的易感性或者发病风险进行估计。这个和我刚才介绍的全基因组关联分析十分相关。

这种产品的依据基本上全部是来自于GWAS(全基因组关联分析),利用全基因组关联分析的结果,把那些基因挑出来,然后再看受检测的人在这些基因里是一个什么样的变异情况,有哪些突变,然后把这些突变集合在一起,用某种数学模型或者 Logistic回归分析的模型,算出来一个分数(百分比)并告诉你,根据你的基因组信息,你得这种病的概率是多少。

另外的非医学类的直接面对消费者的产品就比较多了,而且比较受关注。

比如最有名的所谓的天赋基因、祖源分析。祖源分析是往祖先回溯。这在欧美地区比较热门,因为欧美地区人群混杂地比较厉害。有的人的父亲来自欧洲的一个国家,母亲可能不是欧洲的,或者是欧洲另一个国家,所以他们的追溯自己的祖先比较感兴趣。

非医学类的面向消费者的,还有酒精耐受度,目前有一些公司在做。有些人比较能喝酒,有些人喝酒容易脸红,有的喝不了太多。这和人体内两种酶有关系,一种是乙醇脱氢酶,另一个是乙醛脱氢酶。

这两酶要是有突变的话就会影响酶的活性,影响或者改变分解酒精代谢的功能。这些可以通过基因检测检测出来。

另外,非医学类的检测有一些比较有意思比较好玩的,Just for fun 的检测,比如你这个人爱不爱吃香菜、榴莲、茴香之类的。

临床基因检测

第二类大的应用的是临床基因检测。这一类和直接面向消费者的区别主要是,临床级别的检测要和医生进行沟通,因为有很多专业的知识只有医生才懂,才能解释清楚。有时甚至需要医生、遗传分析师、患者及家属共同讨论,共同交流才能得到结果。这和直接面向消费者的检测十分不一样。

临床基因检测更多是基于罕见单基因病的科研成果。比如像现在也是比较热门的无创产前检测,用于筛查唐氏综合症以及其它染色体类别综合症。

无创产前检测的理论基础是1997年 Dannis Lo(香港的一名科学家卢煜明)的科学发现。

他发现,在怀孕的母体的血液中,有胎儿游离的DNA。把母体血液中胎儿的DNA 取出来,就可以对胎儿进行一些基因检测。这样,就不用拿一根针刺破子宫取羊水,只要抽母亲的外周血就可以了。因此被称为无创产前检测。这个技术现在已经做得相当成熟了。国内有好几家大的单位做这种产前的筛查。

临床基因检测第二类比较大的应用是携带者筛查,主要是预防隐性遗传病。在中国,最重要的一个隐性遗传病是地中海贫血,有不同的类型,但是由单个基因,甚至一两个基因,一个基因家族里的基因发生突变导致的。

隐性疾病指的是,如果父亲是基因突变的携带者,母亲也携带某个突变(有可能跟父亲的突变不一样,但是是在同一个基因上的突变),那么他们生出来的小孩得隐性地中海贫血的概率就会大大地增加,可以达到25%,比正常人高很多。正常人的概率是十分低的。所以对这些家庭进行携带者筛查是十分必要的。

第三个临床基因检测的方面的就是家族性的遗传病的诊断。在临床上,我们发现有些遗传病是在多个世代中遗传下来的。所以找到致病的突变,利用诸如着床前的遗传诊断,或者试管婴儿等方法,把携带致病突变的胚胎选择掉。找正常的没有致病突变的胚胎让它发育成胎儿,就可以阻断疾病的遗传,这对预防遗传病有很重要的意义,避免严重的遗传病以及出生缺陷。

基因检测另外的应用种类还包括法医学。这是比较新兴的,但是也是很有前途的学科。之前有新闻描述,有犯罪嫌疑人是通过遗留在犯罪现场的DNA,经过和数据库的比对,发现嫌疑人的行踪,才追拿归案的。还有一些是通过 DNA 以及数据库的比对,找到可能和这个人相关的家属,然后再通过家属找到嫌疑犯。

还有更新的一些研究,通过DNA 证据可以预测人的一些体貌特征,包括比如眼睛的颜色、头发的颜色(这对欧美人比较通用,他们的头发、眼睛有各种各样的颜色)。东亚人主要都是黑色头发,黑色或者褐色的眼仁的颜色。欧洲人除了头发和眼睛的颜色各异,他们的头发又有卷发和直发,身高、体型、皮肤颜色,其它各种各样的体貌特征,多多少少都和遗传学有关系,所以只要拿到嫌疑犯的 DNA 的证据(DNA 的残留物)就可以在某种程度上对他/她的体貌特征进行预测,缩写搜索嫌疑人的范围。

基因科普讲座,生命科学之基因技术

下面我简单说一下直接面向消费者的基因检测,最近五年呈现了爆炸式的增长。主要有各种疾病的风险预测,易感性的评估。

刚才我也说过了,这些是和疾病有关的。不同的疾病预测准确不一样。比如,目前很难对二型糖尿病的风险进行预测。虽然有些公司称能准确预测,但是目前从科学上来讲,是很难准确预测的。

但是对乳腺癌的预测就十分准确,比如像有很明显的家族性乳腺癌或者卵巢癌发病的话,我们都建议未发病的女性亲属都要定期进行乳腺的检测,这些还是比较准确的。

另外,有所谓的天赋基因。这也是最近很多基因检测公司一个大的卖点,宣传得特别神。

天赋基因可以分成几类。天赋可以分成运动天赋、智力天赋、社交属性的天赋和其它天赋。首先说运动天赋。有两个基因的确和运动能力之间的关系特别大。ACTN3基因跟肌肉相关,ACE基因和耐力相关。虽然如此,运动能力还和训练和营养关系也是特别大。基因再好,如果你锻炼得不够,或者营养跟不上,运动能力也是没有达到最大的可能性。

智商更是很难通过基因来预测了,至少目前是这样。因为存在大量的基因和智商相关,而且后天培养及家庭影响也是十分重要。仅仅依靠 DNA 就准确评估智商,目前来看,我个人认为是很不靠谱的。不是不靠谱,而是很不靠谱。尤其像和智商相关的很多基因是在低智商的综合症,或者是在患病的病儿的研究中发现的。这些基因如果出了问题的话,人的智商会十分低。但基因出现什么样的变化会让人的智商变得非常高,现在是没有很多研究。

另外有一些所谓的社交属性的,是否适合冒险,还有交际能力怎么样,这些可能存在一定的遗传学基础,因为冒险行为和某些精神类疾病存在比较强的关联,可能会做出一些过激的行为,俗话说胆子特别大。这些目前研究得仍然比较少,当然精神性疾病和社交属性之间的关系也是一个研究热点。

最后还有其它的一些天赋,有音乐、艺术、表演、文学等。后天的培养、坚持以及机遇都会对这些方面的成就有特别大的影响,所以基因检测预测这些天赋是不太靠谱的。这也被一些媒体称为科学算命。算命本身就不靠谱,科学算命也是算命,所以还是不靠谱。这是我个人的观点。当然在我们同行内部也有很多共识:目前天赋基因还是一个十分不成熟一个领域,还有很多科研工作要做。科研要走在产品服务的前面。所以目前劝大家要谨慎,很多公司是靠这个来骗钱的。

基因科普讲座,生命科学之基因技术

现在我就来简单介绍一下临床基因检测方面的工作。之所以叫临床,就是要给医生看的基因检测。

最开始有染色体核型分析,主要是细胞遗传学方面的,主要是数染色体的条数看对不对,和正常人是不是一样。

后面又有亚染色体级别的,比如荧光原位杂交、染色体基因芯片,通过这些技术来看大片段的插入和缺失。大片段的插入和缺失就是,比如某一些基因,如果在人类基因组上直接丢掉了,这些基因如果和疾病相关的话,那就有可能导致很严重的疾病。这也是亚染色体级别的一些作用,就是看那些和疾病相关的基因是不是还在。

另外,在基因级别有一些方法,比如 Sanger、MLPA、基因包测序等,可以看到单个基因内部是不是有一些改变。

分辨率最高的是单碱基级别的测序方法,比如 Sanger、基因包测序、全外显子组测序、全基因组测序,可以精确到每一个ATCG字母是不是正确,是不是和参考基因组一样,看有没有可能会导致疾病。

发展的趋势,是检测的分辨率越来越高,精度越来越高,同时检测产生的数据量越来越大,分析难度也越来越大。这就要求有新的学科的加入了,比如生物信息学、大数据、人工智能、机器学习等多学科的协调工作,才能提高检测的效率,才能缩短检测报告的时间。

基因科普讲座,生命科学之基因技术

最后再来说一下发展的趋势。在科研方面的经费投入和成果肯定但是越来越多的,无论是在国际上还是在中国,都是这样。基因检测行业市场也是十分巨大,中国国内每年估计都有近千亿元的容量,因为普通百姓对这个了解越来越多,而且放开二胎导致的高龄产妇的问题越来越突出,这些主要是面向临床。

比如二胎有可能生出一个唐氏儿,筛查,遗传病基因缺陷方面是不是又有一个提高的趋势,又要进行严格地控制,还有肿瘤和癌症逐渐高发,其它附加疾病的防控,糖尿病、心血管疾病,生活习惯指导,都是要基于基因检测。

在产业端,目前有大量的资本涌入,我已经有很多朋友,不下十个朋友,已经融到资了,都是上千万的融资,未来也将更受到资本的追捧。无论是从上游设备/试剂制作商来讲,从中游基因检测公司来讲,还是从下游逐渐升级的分析解读服务提供商来讲,都有比较好的预期,所以资本就会不断地涌入,然后这个行业不断地壮大。

基因科普讲座,生命科学之基因技术

在市场前景很美好的同时,行业本身还缺乏标准,运行也亟待规范,所以我们在2017年10月份在深圳开了一个会,当时我也很荣幸参加了这个会。会上达成了一个【深圳共识】。上图右边就是今年(2018年2月)才发表的一篇文章,发表在《中华医学遗传学杂志》上。

这个【深圳共识】主要是规范临床基因检测报告的撰写,探讨基因检测行业的共识,建立年度讨论的机制。今年(2018年)会在上海进行这个会议。最后要加强同行之间的协作。因为只有把这个市场做规范,做好,大家都才能更好地发展,然后才能更好地服务广大人民群众,服务消费者和各个医疗机构。

提问互动

Q:谢谢郭博士的分享。

我是一个球迷,这两天在世界杯比赛,葡萄牙的C罗表现非常突出 ,他有三个代孕的孩子,有八卦说,其中一个孩子的卵子是来自两个母亲。 我想请问现在科学能做到把两个女性的优秀的基因合成一个卵子吗?

A:

我不清楚“卵子是来自两个母亲”具体是怎么实现的,但我猜测其DNA(核基因组)应该是来自于一个母亲的卵子,而卵子的其他部分(比如线粒体、细胞液等)来自另一个母亲。由于线粒体内也有少量DNA,所以核DNA和线粒体DNA来自于两个母亲是可以实现的。

但线粒体基因的主要功能是编码线粒体蛋白质,主要负责人体的能量供应。线粒体基因出现缺陷时能导致线粒体疾病,除此以外,线粒体基因正常的时候不太会出现“优秀”基因的情况。

Q:郭博士,您是研究罕见病基因的,刚才您介绍了可以在胚胎阶段就挑选出健康的胚胎,阻断遗传病。

请问,现在生出了有缺陷的孩子,能够通过去除相关基因的方法来治疗?比如说,有个孩子是自闭症,刚才你也讲到了这个是基因缺陷。有没有可能把那个相关的基因去掉,治好病?

A:

这是个很好的问题。由于时间所限,我刚才没有机会讲解:罕见单基因病分为很多种,其中有一大类叫“先天性代谢缺陷”,这也是国家重点关注的疾病,因为如果在出生最初的几天甚至几周内给予相应治疗(比如补充某些酶),那么孩子的病情会有很明显的好转。另外,结构性病变可以通过手术、器械矫正。但其余的大多数遗传病患者则没有这么幸运,因为目前仍然缺乏有效的治疗手段。

所谓的“去除相关基因”,我理解是“改正相关基因突变”,目前在某些眼科单基因疾病中、血液类单基因疾病中以及某些皮肤类疾病中都有临床试验在进行,其主要目的就是通过改变出错的基因(去掉基因缺陷),达到治疗疾病的目的。

自闭症则是另一大类疾病,我刚才的幻灯片中将其放在“常见、复杂多基因病”中,因为从患者数量上看,自闭症主要是非综合征类型(non-syndromic)的多基因病,而综合征类型(syndromic)的自闭症发病率较低(但一般是单基因病,并伴随多系统畸形/异常,如心脏结构异常,肢体畸形,面部畸形等等)。非综合征类自闭症属于多基因复杂疾病,目前其发病机制以及相关基因仍然在研究当中,治疗管理方面多从康复训练着手。

Q:今天我看了电影《侏罗纪世界》,里面有一个华裔科学家将霸王龙和迅猛龙的基因合成了一个特别厉害的恐龙,由此我想到了两个问题。

一、中国在基因研究方面在世界上处于什么样的位置?二、人类能否利用基因技术创造出新的物种?

A:

我可以自豪地讲,在基因研究方面,中国处于世界第一梯队,在某些方面(基因编辑、基因组分析等)与美国欧洲等国并驾齐驱。

人类创造出新的物种是很有可能的,事实上科学家已经在实验室创造出了新的微生物(病毒为主),但是创造新的植物、甚至动物将仍然面临伦理学挑战(如果技术手段已经成熟的话)。

【青稞营】:关注教育和成长的社群,举办夏冬令营活动。

关注【青稞营】微信公众号:QingKeCamp,参加【青稞营】澳大利亚微留学(插班学游)营