百度發布超級AI計算平臺X-MAN4.0 加速OAI AI硬件系統標準落地
歐洲時間9月27日,在荷蘭阿姆斯特丹舉辦的2019 OCP Regional Summit會議上,百度發布了業界首款支持OAI(Open Accelerator Infrastructure)標準和液冷散熱的超級AI計算平臺X-MAN4.0。百度在主導OAI標準定義的同時,也以實際行動推動OAI標準落地,通過構建開放的AI硬件生態系統來推動全球AI新硬件技術創新和落地。
百度超級AI計算平臺X-MAN4.0
OAI標準為何而生?
隨著AI技術的快速發展,眾多AI芯片公司應運而生,AI芯片產業的格局正呈現多元化發展趨勢。由于AI硬件系統設計的技術難度和復雜性,其研發周期通常長達一年,并且需要投入大量的研發資源,這嚴重阻礙了新AI加速芯片的落地和應用。
OCP開放計算項目,是由Facebook攜手英特爾、Rackspace等公司于2011年成立的一個非營利組織,也是全球云計算基礎硬件技術領域覆蓋面最廣、最有影響力的開源組織。在今年3月美國OCP全球峰會上,百度聯合Facebook和微軟發布了OAM(OCP Accelerator Module)標準,該標準制定了AI硬件加速模塊的尺寸、供電、高速互聯接口等規范,之后主導發起將OAM項目升級為OAI,該標準用于指導AI硬件加速模塊和系統設計,它集合定義了AI硬件加速模塊本身、主板、互聯拓撲、機箱、供電、散熱以及系統管理等系列設計規范。
通過OAI標準,可以統一AI硬件加速模塊和系統設計,有效兼容多元化AI加速芯片,促進AI芯片多元化生態格局的健康持續發展。
百度主導OAI標準定義
首款支持OAI標準和液冷散熱的AI計算產品X-MAN4.0
X-MAN4.0是百度超級AI計算平臺X-MAN系列產品的第四代,是第一款支持OAI標準和液冷散熱的的AI計算產品。X-MAN4.0單節點可以支持8個AI加速器,加速器之間采用8 port HCM(Hybrid Cube Mesh)互聯架構,雙向通信帶寬高達56GBps。在單個機柜層面,X-MAN4.0最大可支持32個AI加速器構建互聯集群,具有極好的可擴展性。X-MAN4.0符合ODCC 3.0整機柜規范,高度為4SU(182.5mm),寬21英寸(536.0mm),長度850mm,支持風冷散熱方式,也支持液冷,采用更高效的48V供電方式。
百度X-MAN系列產品多項技術行業領先,如X-MAN1.0首次實現AI計算硬件解耦架構、X-MAN2.0首次將冷板式液冷散熱技術應用到AI計算產品里、X-MAN3.0首次倡導模塊化標準化設計。此次百度將相關設計理念貢獻到OCP并主導 OAI標準制定,并實現了首款支持OAI標準及液冷散熱的AI計算產品。浪潮作為百度的重要合作伙伴之一,一直在參與X-MAN系列產品的研發和生產。
OAI標準獲得行業廣泛支持
OAI項目是由百度、Facebook、微軟三家國際AI領先企業聯合發起的,包括多項標準,其中OAM標準已經在3月發布,OAI-UBB(Universal Baseboard)標準已經形成初稿即將在10月正式發布。OAI標準也得到了眾多公司包括Google、阿里、騰訊、京東云等互聯網企業,英偉達、英特爾、AMD、高通、賽靈思等AI芯片企業,Graphcore、Habana Labs、寒武紀等AI芯片及處理器初創企業,以及浪潮、IBM、聯想、英業達等ODM/OEM系統廠商的參與和支持。當前英特爾、英偉達、AMD和Habana已經開發出了支持OAM標準的AI加速卡,并且OAI項目成員相比3月初增長了近50%,這充分顯示了OAI標準的全球影響力。
對此,百度副總裁侯震宇表示:“百度非常高興能夠與Facebook和微軟及OCP其他成員圍繞OAI標準的制定展開合作,該標準將極大提高不同AI硬件加速模塊和系統的互操作性,加速新AI硬件加速模塊的大規模落地應用。”
OAI標準獲得廣泛支持
參與全球標準定義,打造軟硬一體AI全棧解決方案
此次百度主導OAM和OAI標準定義,不僅將又一次推動AI新硬件技術全球范圍內的創新與進步,還會進一步將自己在AI領域的最佳實踐、專業能力和創新能力,貢獻給國際AI社區,促進世界AI水平的進步。這不是百度第一次參與國際AI領域技術標準的制定了。2018年5月,在紐約人工智能大會上,百度、谷歌、斯坦福大學、哈佛大學等多家企業和高校聯合發布了一套用于測量和提高機器學習軟硬件性能的國際基準 MLPerf,旨在推動機器學習硬件+軟件相關技術創新。
通過基礎技術創新,百度正在打造AI芯片昆侖、超級AI計算平臺X-MAN、深度學習框架PaddlePaddle等軟硬一體全棧AI解決方案。
在“夯實移動基礎,決勝AI時代”的戰略指引下,百度也在穩步打造AI生態體系,加速AI技術的產品化和商業化進程。作為AI生態體系的重要組成部分,百度打造了面向自動駕駛領域的Apollo開放平臺和對話式AI操作系統DuerOS,并通過百度智能云的ABC(AI、Big Data、Cloud Computing)三位一體發展戰略,促進各行各業智能化升級。
- 標簽:
- 編輯:王麗
- 相關文章