技赋能,弥补传统考古不足
将基因分析应用于考古学研究中,分子考古学已经成为国际考古研究中的前沿领域和热点方向。古DNA是分子考古学的核心,遗传信息保存在DNA中,DNA考古就是利用现代分子生物学的手段提取和分析保存在遗骸中的DNA,同时依靠考古学以及其他学科交叉研究,研究古代生物种群特征及相互关系。这一方法,弥补了传统考古无法触达的精准,使考古成果更精准、更科学、更客观。
2020年,中国科学家从甘肃夏河县白石崖溶洞(上图)的土壤沉积物中提取出丹尼索瓦人的线粒体DNA,表明了丹尼索瓦人自倒数第二次冰期至末次冰期都生活在青藏高原。
吉林大学于1998年建立国内首个考古DNA实验室,并利用考古学、人类学以及语言学等跨学科交叉,为我国北方地区和新疆地区的古人类DNA、古动植物DNA研究和古文明的溯源,作出巨大贡献。
2019年,吉大古DNA实验室成功实现世界首例古小麦全基因组破译,为理解东西方文化交流及农业传播,提供跨时间维度的直接证据;2020年6月1日,吉林大学古DNA研究成果还原新石器时代农业革命以来,中国北方地区的人群互动,为探讨中华文明的起源、形成和发展提供重要证据。
以计算之美,溯源人类文明之美
然而,古DNA的提取并不是一件容易的事情。古DNA由于年代久远、水解、氧化、微生物降解等原因很难完整保留下来,不仅可提取到的量很少,与现代DNA相比更短,科研人员需要对珍贵的古DNA进行更大规模的测序,以获得更多有效数据,测序带来的海量DNA数据对计算力、计算效率都提出很高要求。
古DNA的研究中,研究人员先对骨骼样本进行采集,用专业工具获得骨骼粉末;采用特有试剂盒对粉末进行DNA提取;随后对提取液中的古DNA进行文库构建并测序。通过测序仪测得DNA片段的序列信息后,首先比对(Mapping)至所研究物种的参考基因组(References), 然后利用群体遗传学分析工具、系统发育软件等对序列信息进行分析,并与现代或者其他古代人群、动物等遗传信息进行比对,从而追溯个体或群体的来源、迁移以及融合过程等。
无论是比对(Mapping)、群体遗传学分析,还是系统发育分析,对这些研究数据的处理都对算力提出要求。
过去,科研人员通常使用台式机和普通服务器进行一系列数据分析,单次能分析的序列数量非常有限。随着二代高通量测序技术平台的开发应用,对小片段古DNA分子捕获能力的增强,科研人员实验所得的DNA序列大幅提升,带来了巨大的DNA数据处理需求,台式机和普通的服务器已经远远无法满足需求。
吉大考古学院与浪潮合作,创新性地开发了基于浪潮智算的基因测序加速应用方案,最大限度地提高了测序精准性,提升了古DNA使用效率,可以在9.64小时内完成全基因组分析,48分钟完成全外显子组分析。相比基于CPU的方案,基因数据处理速度提升39倍,加速了古DNA研究成果的诞生。
用科技的力量实现与历史的对话,浪潮正在持续不断地通过技术的力量推动人类文明发展和溯源、追问未知答案、追求人与地球的和谐共生,将智算力注入宇宙探索、文明研究、生态环境、物种保护、交通出行等各个领域,为不断变化的世界匹配持续迭代的科技,让“计算之美”无处不在。