华大基因再次荣获“高性能计算创新优秀奖”

2012年6月18日,在德国汉堡举行的2012年国际超级计算大会(International Supercomputing Conference, ISC'12)上,国际数据公司(IDC)宣布了第三届“高性能计算创新优秀奖”(HPC Innovation Excellence Award)的获奖名单,华大基因继2011年获得该奖后此次再度名列其中。该奖项再次证明了华大基因高性能计算能力已经处于国际先进水平,引领着生物领域高性能计算的发展。


“高性能计算创新优秀奖”主要授予在高性能计算(high performance computing,HPC)技术研究领域取得显著成就的使用者,由IDC组织的评审委员会对个人或机构在高性能计算应用方面取得的成就进行评选而得出。通过该奖项,人们可以了解到HPC使用者和他们的组织机构在学术、产业和政府领域由HPC技术支撑所获得的成就,如在各个不同产业和应用领域收集通过HPC技术获得投资回报和科研成果的成功案例,从而帮助人们更好地了解HPC技术的应用,展示HPC的应用价值以及扩大公众对HPC技术投资的支持。


高性能计算主要是从体系结构、并行算法和软件开发等方面研究开发高性能计算机的技术。目前,HPC不仅用于科学研究、航天国防、气象预报、石油勘探等,还可应用于信息化、教育、企业等更广泛的领域,HPC的应用需求在深度和广度上都面临着蓬勃发展。在生物学领域,随着基因组高通量测序技术的进步,生物信息数据的存储计算需求每12-18个月就会增长10倍,远高于Moore定律提供的参考数值。


对于华大基因而言,生物信息分析的使命就在于挖掘人类基因组和其他物种基因组测序所得的海量数据背后所隐藏的科学意义及应用价值。随着分析数据指数式的增长,越来越多的科研院所都开始采用高性能计算技术。对此,华大基因研究院副院长方林表示:“HPC在科学发展上拥有巨大的潜在应用价值,它能够促进大规模基因组数据的处理,使得组学相关的研究更快速、更容易。我们希望在日后的研究中进一步加强HPC的应用,以更好的满足处理和分析‘大基因组数据’的需求。”


华大基因一直致力于通过发展高性能计算,投入高性能硬件设备的组件,开发和优化相关分析软件等研究推动科研项目及其相关产业发展。目前,华大基因已在深圳、香港、北京和武汉等地建立多个大型生物信息超级计算中心,总峰值计算能力达到200T flops,总内存容量达到35TB,总存储能力达到16PB。这为海量生物信息学数据的存储、处理和分析提供了稳定而高效的保障。其中位于深圳和香港的两个中心,是目前中国最大的两个生物信息超级计算中心。


此外,华大基因充分利用分布式计算的优势,开发了一系列基于映射/化简框架的云计算软件,并搭建了高性能绿色云计算平台。其中,SOAPgaea主要用于重测序的数据分析,通过选择合适的软件和优化的参数,不同研究领域的专家可以生成适用于自身特定需求的分析流程来实现自己特定的分析。同时,SOAPgaea也拥有自主研发的算法模型,如比对工具GaeaAlignment和单核苷酸变异检测工具GaeaSNP等,实现了进程间共享内存的新特性,在软件的精度和性能方面都更加出色。SOAPhecate则是首个分布式组装软件,它的成功开发使得基因组组装避免了高内存服务器的使用,大幅度降低了基因组组装的成本。


方林指出:“在未来的工作中,华大基因会持续研究高性能计算领域的新技术,并将这些技术应用于各种实际的生物信息项目中,如百万种动植物参考基因组的构建以及一些复杂疾病的研究项目等。”


其他获得该奖项的单位包括:GE全球研究中心(GE Global Research)、美国国防部高性能计算现代化项目(Department of Defense High Performance Computing Modernization Program)、玛丽·伯德帕金斯癌症中心和路易斯安那州立大学(Mary Bird Perkins Cancer Center and Louisiana State University)、怡安奔福保险集团(Aon Benfield Securities, Inc)。