Hadoop框架在大规模生物医学信息处理中的应用

5月24日,第四届中国云计算大会在北京国家会议中心隆重举行,会议围绕“云计算实践”这一主题,探讨云计算在中国的发展与实践,展示国内外云计算最新的研究成果和应用。

军事医学科学院数据中心主任赵东升介绍了Hadoop框架在大规模生物医学信息处理中的应用。

随着新一代高通量测序技术、医学影像技术的发展,产生的海量数据为医学信息处理带来新的机遇和挑战。如何对数据进行科学的搜集、管理、挖掘、注释已经成为医学信息处理研究的热点,同时要考虑如何以更低的成本,更高效地完成大量的数据分析处理。

普通的数据分析工具面对当今的海量数据已经力不从心,迫切需要采用新的数据分析引擎。

开源的Hadoop已经在过去五年之中证明了自己是市场中最成功的数据处理平台之一。Gartner和IDC的分析师认为海量数据的处理速度和处理各种数据的能力都是Hadoop吸引人们的地方。

Hadoop模仿和实现了google云计算的主要技术,是目前最知名的云计算开源系统。特别适用于使用简单计算模型的集群处理大规模数据集。