2016-03-13 10:37:00
來源:
在3月19日舉辦的China Hadoop Summit(中國Hadoop技術峰會)上,中國Hadoop大數據廠商紅象云騰與OpenPOWER基金會共同發布紅象云騰的新一代大數據產品,幫助企業高速處理PB規模數據。
此次發布的兩款新產品中,“紅象數據高鐵-CRH4”的RedHadoop Enterprise CRH4 For POWER版軟件,是全球第一個支持OpenPOWER服務器的Hadoop商業版本。同時發布RedHadoop Enterprise CRH4 For POWER EC版軟件, 支持Hadoop HDFS Erasure Code CAPI FPGA加速方案,也是全球第一個支持Erasure code(可擦除碼)在FPGA/CAPI上實現的商業發行版Hadoop方案。
用“高鐵”比喻Hadoop,源自二者動力原理的相似:高鐵的效率比傳統火車快,是因為每節車廂都有動力,而不僅僅是火車頭有動力。基于分布式技術的Hadoop的原理即把數據分塊,通過并行運算來提高數據檢索、查詢、分析等操作的效率,每臺機器都有自己的動力(計算力)與存儲,從而提供充沛的動力和功能模塊來提升客戶的大數據應用環境。
北京紅象云騰系統技術有限公司總經理童小軍演講
可以看出這兩款產品都是為OpenPOWER服務器定制的。從OpenPOWER生態的角度看,兩款大數據產品的發布也進一步完善了OpenPOWER的生態鏈。據北京紅象云騰系統技術有限公司總經理童小軍介紹,基于OpenPOWER服務器的開發的RedHadoop的性能大幅提高。標準的Hadoop測試表明:在OpenPOWER服務器上的Redhadoop測試值,是在x86服務器上測試值的三倍。同時,RedHadoop借助FPGA/CAPI來實現Erasure Code加速算法,將原本社區版的三份副本的存儲量縮小到原來的一半,大大降低磁盤使用,節省一半磁盤成本,并通過紅象DataBank產品實現界面化操作數據,提高大數據工具使用效率。
據悉,作為Hadoop社區經典難題,Erasure Code (可擦除碼)是由Xilinx、IBM中國研究院和紅象云騰、恒揚科技、中太、烽火科技等OpenPOWER成員及合作伙伴聯合研發的。 “大家都在盼望Erasure code, 這個功能在Hadoop 1.0年代存在,但是到了Hadoop 2.0年代就被取消了。這其實是非常好的功能,可以大大節省硬盤存儲。”中國Hadoop技術峰會主席何建軍評價說,“隨著我們去年開始倡導第二代分布式計算架構,今天的Erasure code第一次真正意義上實現了分布式計算,把CPU不適用的算法挪到了FPGA/CAPI上,而FPGA/CAPI上來計算擦除碼是傳統軟件算法的300倍。我很高興,今天我們的Hadoop愛好者們可以享受到更好的技術。”
據悉,這一系列產品具備分布式存儲和計算功能,支持PB級海量數據存儲和批處理、流處理、內存計算、多維查詢、搜索引擎等,支持在其前往數據中進行分鐘級統計和秒級延遲檢索,在在線(Online)、近線(NearLine)、離線(OffLine)三大應用場景做場景優化,為用戶提供全場景的大數據平臺解決方案。與此配套的Redhadoop Databank則成功提升大數據人機交互,通過可視化數據展現和多維度查詢,讓Hadoop使用更安全,更簡單,更快速。
并且這些大數據產品已在聯想集團、NTT-DOCOMO、中國航天等企業順利上線,管理最大集群超過100臺,數據達到 4.8PB規模。其中,聯想集團通過紅象Hadoop和奧飛ETL,在三個月內完成完成了數據倉庫、實時計算、多維查詢等應用,出數效率提高到分鐘級別。