生命科学领域解决方案

2020  02/21

解决方案的内容

由于测序技术的飞速发展,人类发现的基因序列数目以指数级增长,对于如此数量庞大的基因进行同源性搜寻、比对、遗传发育分析等等,往往伴随着巨大的数据处理量和并行计算量。另外,生命科学的研究对象往往是蛋白质和DNA大分子,对这些分子的结构进行预测,研究它们的动力学特性、热力学特性及其在生命过程中如何发生作用等等,这些科学问题也要借助于高性能计算机。所以高性能计算机在生命科学研究中,应用非常广泛,扮演着及其重要的角色。

image.png

高性能计算在生物领域中的应用主要分为以下几类,第一,实验仪器測量数据处理和分析,首先通过实验仪器对生物分子进行测量,使用一些后处理软件对原始的大量数据进行处理和分析。比如对DNA分子进行研究的 Illumina公司的测序仪 Genome Analys HSeq2000以及相应的后处理软件GAPipeline等;ABI公司的测序仪 Solid3、Soid4以及后处理软件 Bioscope。然后对序列数据进行同源及相似性搜寻、比对、序列分析、遗传发育分析等,应用软件数量巨大,各种软件在同源性分析算法上各有特点,最常用的有 BLAST,FASTA,HMMER, ClustalW.,DNASTAR,PHYLIP,PAML,PAUP T-Coffee,EMBOSS等。有对蛋白质分子进行研究的三维冷冻电镜方法及结构解析软件EMAN,SPIDER;利用Xray方法测量用软件cCp4、ARP/wARP,CNS进行解析等质谱仪测序以及后续处理软件tandom(X!tandom)等。

 第二,分子动力学,从原子的角度利用经典力学模拟分子的运动,研究体系动力学和热力学特性,主要软件有AMBER,CharmmNAMDGromacs等,这类应用非常适合大规模并行。第三,计算机辅助药物设计类计算,模拟小分子配体与生物大分子受体的相互作用,预测两者间的结合模式和亲和力,从而进行药物的虚拟筛选,根据计算方法的不同分刚性对接、半柔性对接和柔性对接,应用软件有DOCKAutoDockFlexXDiscovery StudioZDOCKRDOCKMORDORT等。

 对于种类繁多的生物领域计算,中科云达可以提供完善解决方案,满足不同应用软件对高性能计算资源的不同需求。

image.png

计算系统包括高密度、低功耗、易管理的刀片服务器, CloudTa B7220-14N刀片节点配置以双路为主,采用Intel最新可扩展处理器,注重浮点峰值和内存性能;利用图形加速技术大幅度提高计算能力的GPU节点;计算网络采用低延迟、高带宽的InfiniBand,能大幅度提高应用程序的计算速度和分布式加速比针对大规模高性能计算集群系统,全局共享存储的性能和扩展性非常关键,目前主流的解决方案是采用分布式的存储系统,在软件层面,中科云达为生物高性能计算用户配备完备的分布式软件开发和运行环境配置中科云达集群监控管理及作业调度软件,包含针对不同应用软件开发的Web作业提交界面,可以大大降低高性能计算机的使用门槛。

热门评论
发布评论

登录 后发表评论