探索生命奥秘的里程碑

2021-02-09

科技日报记者 张晔

一段头发、一颗指甲盖、一串脚印、甚至是滤纸上微量的龈沟液,通过这些细小的人体组织,我们就能检测出人类生命的健康密码。而这一切在数十年前还是无法想象的。

2001年2月12日, 中、美、日、德、法、英等6国科学家和美国塞莱拉公司联合公布人类基因组图谱及初步分析结果。

这项长达10年、耗资30亿美元的人类基因组计划,经过十年努力,在全球科学家鼎立合作下终于完成,所获得的人类基因组的DNA序列图,也是有史以来最准确,最完整的脊椎动物基因组序列。

人类基因组图谱的绘就,不仅是人类探索生命奥秘的一个重要里程碑,也成为遗传基因医学和生物技术产业开启的标志。

草图公布20年后,计算生物学正以更高的精度描绘并预测我们的身体,并提供更加个性化和更加精确的诊疗;科学家正在不断加深对人类生物学的理解,精准医疗也已经日渐走入我们的生活。

解开生命的密码

喜爱看科幻大片的人,对《复仇者联盟》、《金钢狼》、《侏罗纪世界》等应该都不陌生,这些电影的故事背景都有一个共同的关键词:基因。

上世纪50年代以后,随着分子遗传学的发展,人们进一步认识了基因的本质。从此,人类就幻想着有朝一日能解开遗传基因的密码,彻底改变对大多数疾病的诊断、预防和治疗的方式,甚至实现对基因的改造重组,诞生出具有特殊机能的“基因修饰人”。

但是,想要破译基因这本蕴藏着生命奥秘、决定人的生老病死的“天书”,并不容易。人类基因组约含6万到10万个基因,由约30亿个碱基对组成,分布在细胞核的23对染色体中。

“到今天为止我们还没有这样的技术,拿来一条染色体就能直接测序。”南京医科大学生物信息系主任副院长汪强虎教授说,人类基因组计划实际上就是由复杂到简单,再由简单又回归复杂的一个过程。

汪强虎告诉记者,人类基因组计划启动后有两种策略在同步进行:一是层次测序策略,即先把基因组拆分成大片段并一一克隆,随后再将各个克隆单独打碎成小片段,测序后再组装拼接起来,这是6国科学家测序计划所采取的策略;二是美国塞莱拉公司提出的全基因组鸟枪法,这种方法绕过大片段连续克隆系统的构建,而是把基因组直接打散成小片段并随机测序,然后利用计算机算法进行组装。

以今天的眼光来看,2001年公布的草图显然还有很多的不足,但是它对人类分子生物学起到了巨大的推动作用。

在人类基因组测序起步的时候,用的是凝胶电泳法,基本上还是手工运作的。20世纪90年代中期,毛细管电泳仪技术的诞生,使得测序的速度大大加快,一天就可以有100万个碱基对的的序列被测出。而塞莱拉公司提出的全基因组鸟枪法,则更加简单、高效且成本低廉,发展成为目前通行的测序方法的雏形。

“目前,第三代测序技术纳米孔测序已经诞生。”据汪强虎介绍,它是检测单个DNA分子通过膜上的纳米孔时电流的变化,对DNA进行测序。

“纳米孔测序技术可以获得包含数十万个碱基对的‘超长读取’,这样的长度可以跨越覆盖整个重复区域,从而绕过了一些复杂的挑战。”汪强虎告诉记者,测序技术的长足进步,让那此曾经被认为十分棘手重复序列的检测,变得易如反掌。

测序仅仅只是开始

破译人类遗传密码不仅被认为是达尔文时代以来生物学领域最重大的事件,同时也被认为是人类历史上最重要的科研工程。

按照设想,碱基对测序完毕之后,科学家将分析碱基对如何组成基因以及各种基因有什么功用等。弄清全部基因的位置、结构和功能,将为人类征服多种疑难病症铺平道路。

但是,当测序完成十年之后,人们设想的精准医疗并没有如约到来,科学家还在不断的对人类基因组序列“打补丁”,同时,参考基因组还需要不定期地更新,这项工作由基因组参考联盟(GRC)负责,2013年,GRC发布了最新的人类参考基因组GRCh38。

去年,美国国立卫生研究院(NIH)宣布,终于获得了人类X染色体的完整的、无间隙的、端对端的完整序列信息。

汪强虎认为,人类基因组图谱的绘就是一个里程碑,但在探索人类自身奥秘的科学进程中,它仅仅是一个开始,未来之路并不平坦。

对于科研工作者来说,潜在的挑战依然存在。比如,1号染色体和9号染色体的重复DNA片段比X染色体上的要大得多。科学家接下来计划继续努力弥合更多未知的“缺口”区域。

值得注意的是,在号称“生命天书”的人类基因序列草图中,1%的工作由中国完成,也就是3号染色体上的3000万个碱基对。

汪强虎说,这1%得来并不容易,像德国和法国发达国家也只是承担了约2-3%的任务,而且中国是唯一一个参与其中的发展中国家。

1997年11月,中国遗传学组青年委员会第一次会议在张家界召开,在这次会议上,杨焕明、汪建、于军等几位科学商量要加入人类基因组计划,推动中国基因组科学的发展。在中科院和国家南、北方基因组中心同行的支持下,也在中科院遗传所的大力支持下,中科院遗传所人类基因组中心在1998年8月成立,并于次年6月正式向美国国立卫生研究院提出了中国加入人类基因组计划的申请。

1999年7月8日,人类基因组计划网站公布了中国1%申请成功的消息。

杨焕明、汪建等人带领的团队联手向这一生命科学的高峰发起冲刺。中国专家组每天测序量达到200万对碱基,在不到半年的时间里,他们就保质保量并提前完成了任务。这充分体现了中国对人类所负的责任,也体现了我国参与国际科研重大项目的积极态度。

通过人类基因组计划,中国科学家在短时间内学习并追赶发达国家的先进生物技术,又先后完成水稻基因组、SARS冠状病毒的基因组研究,以及对熊猫、家猪、家鸡、家蚕等基因组的测序工作,使我国的基因组研究得以跻身世界前沿。

图说:参与“国际人类基因组计划”的16个中心负责人合影,前排右二为杨焕明。(受访者提供)

中国测序设备走向世界

人类基因组计划,在科学上是各国合作共享的研究成果,但在产业和应用上则是一场争分夺秒的赛跑。

基因测序仪是生命科学研究和生命产业发展的决定性设备。长期以来,部分外国企业一直垄断着基因测序仪的研发和生产,其在测序仪研发领域拥有众多专利,并形成了严密的保护体系。而近年我国基因测序市场虽发展迅速,但在“重应用、轻研发”的倾向下,国内测序仪研发领域一度存在空白。

1999年,华大集团因人类基因组计划而成立,2013年,华大集团收购美国测序仪制造商CG公司,通过大量的研发投入,将原本极为昂贵且形如“黑铁塔”的大型测序仪原型机,变成了多款经济可靠、且拥有更高性能的桌面型设备。

华大集团旗下公司华大智造在CG多年的测序仪研发基础上,结合华大的经验与优势,迅速形成了具备国际竞争力的、具有自主知识产权的高通量基因测序仪。

高通量测序系统集成了光机电液、生物化学、酶工程、生物信息等多个跨学科理论和技术,位于生命科学仪器设备智能制造的最高端。

基于源头性核心技术优势,华大智造不断推陈出新。2018年10月突破性地发布了全球日生产能力最强的基因测序仪——DNBSEQ-T7,其主打快速、灵活、超高通量的测序性能优势,堪称“超级生命计算机”,各项参数指标达到全球第一。

2019年6月,基于自主测序技术DNBSEQTM和相关建库技术,华大智造面向全球发布“高清”基因组“676”标准,开启了基因组测序的“全高清”时代。

基于“676”标准的从头组装二倍体基因组数据,将基因组测序真正带入“全高清”时代,对于更全面和准确地获取遗传信息有里程碑式的突破意义,也将极大推动个性化医疗的发展。

在了解华大智造测序原理之后,哈佛-麻省理工医疗科技学院遗传与生物物理学教授——乔治·丘奇评价“有了这两项技术(DNBSEQ™和stLFR),华大智造能够首先实现测序价格可及且测序错误率基本为零”。

图说:华大集团研发的基因测序仪(受访者提供)