轉:2017國際高性能計算論壇開啟“超算+”時代
2017國際高性能計算論壇(IHPCF2017)進入精彩的第二天。今天圍繞着“超算+”,美、日、俄、法、中各國專家就高性能計算與大數據、AI的融合發展,雲計算模式下高性能計算應用服務的設計與實現,以及E級融合計算的實現等問題展開了深入的探讨交流。此次論壇為世界超算開辟了更廣闊的發展之路,在促進“E級計算”前進的同時開啟“超算+”時代。
近年來,随着互聯網新興産業的快速發展,特别是雲計算、大數據、人工智能(AI)等前沿技術的快速崛起,普通計算已難以滿足它們對海量數據存儲、大規模計算、應用平台支撐的發展需求。與此同時,超級計算機的應用領域也正在進一步拓展,超算與這些前沿技術的融合成為了勢不可擋的發展趨勢。
繼昨天2017國際高性能計算論壇盛大開幕式及精彩報告後,9月20日,圍繞着“超算+”,與會專家就高性能與大數據、AI的融合發展,雲計算模式下高性能計算應用服務的設計與實現,以及E級高性能計算在系統、架構、編程框架與應用等領域的創新等問題展開了深入的探讨與交流,又一次将2017年國際高性能計算論壇的技術交流、學術研讨的氛圍推向了高潮。
當前,人工智能(AI)是科技界話題讨論的熱點,引起了廣泛的關注。但是,AI需要在高性能計算、成熟算法和大數據三大力量的支撐下才能展現出強勁的生命力。為了滿足AI的超大規模計算需求,超級計算機已逐漸成為訓練各種深度神經網絡的利器。論壇上,各國專家就當前高性能計算與大數據、AI融合技術的發展展開了熱烈的讨論。
日本東京工業大學的Satoshi Matsuoka教授詳細介紹了目前Green500榜單上能效最高的系統TSUBAME3,該系統針對大數據和人工智能應用從通信帶寬、内存層次、低精度算法等多個方面展開深度優化,這些優化技術将用于構建世界上最大的針對大數據/人工智能應用的公共開放基礎計算設施(ABCI,AI-Based Bridging Infrastructure);中山大學徐峻教授講解了計算機藥物設計的基本概念與方法,介紹了基于高性能計算的新型子圖産生算法DSGA以及針對分子疊加的加權高斯算法WEGA,最後展望了大數據分析在制藥工業領域中的應用;普林斯頓大學William M. Tang教授介紹了深度學習技術在核聚變反應異常監測中的應用實踐,他們提出了一種稱作FRNN(Fusion Recurrent Neural Net)的循環神經網絡,并采用分布式數據并行、異步參數更新、MPI通信等技術實現高可擴展性,預計将擴展到數千GPU規模。
雲計算是在近幾年随着互聯網發展起來的新興計算,其依靠着靈活的擴展能力主要應用于社交網絡、企業IT建設和信息化等數據密集型、I/O密集型的領域。超算與雲計算有很多相似的特點,如兩者都使用了分布式計算、網格計算、集群、高通量計算等。那麼,超算與雲計算能否走向融合,開辟出更廣闊的發展之路呢?論壇上,國際專家們就超算與雲計算的融合創新發展之路進行了探讨。
美國伊利諾伊理工大學孫賢和教授針對高性能計算與大數據處理融合的趨勢,提出了在文件系統層實現兩類應用有機融合的新型計算框架PortHadoop-R。該框架吸收并行文件系統和MapReduce各自的優勢從而實現高并發、低延遲數據訪問,允許Hadoop節點直接訪問并行文件系統中的數據,實現數據傳輸與基于R語言的數據分析和可視化的有機結合,使得PortHadoop-R在NASA的氣候模拟應用上取得了15倍的加速比;美國威斯康辛-麥迪遜大學Miron Livny教授介紹了他們研發的一種對動态計算和數據密集型負載進行實時容量規劃的高通量動态調度技術,其在數據挖掘、機器學習、圖像處理、統計推理等應用領域具有很大優勢;國家超級計算廣州中心主任盧宇彤教授分析了天河二号的應用現狀和用戶需求,提出了HPC無處不在的願景,計劃進一步完善天河上現有的混合可定制軟件棧——天河星光平台,進一步統一資源管理、統一數據管理以及統一應用管理。天河星光平台即可以幫助用戶高效使用天河計算和存儲資源,又可以幫助領域應用開發者方便地開發大規模異構并行程序。最後盧主任介紹了目前在天河星光平台上完成的諸多教育、科學、工程、智慧城市等應用成果。
繼昨天關于E級系統架構創新突破的熱烈讨論之後,與會專家們再次圍繞E級計算時代的高性能計算新型體系結構設計、系統優化、編程框架、軟件環境等影響E級計算發展的關鍵問題展開論述,并毫無保留的分享了各自的探索實踐經驗。
William Gropp教授指出,現有的網絡互連性能評價模型和MPI通信機制在多核/衆核條件下表現不足,針對當前的MPI編程模型作适當的擴充并結合軟硬件實現協同優化将是有效的解決方案。William Gropp教授因此提出MPI+X的概念,将MPI與OpenMP、Pthreads、OpenCL、OpenACC、CUDA等多種編程模型有機結合,并适當考慮CPU、網卡、内存、操作系統的特性,輔以新的算法和軟件實現,充分發掘系統的網絡互連性能;北京應用物理與計算數學研究所的莫則堯研究員介紹了針對數值計算的高可擴展性框架的理論和方法,該方法基于Patch-Centric數據并行策略實現了高可擴展性。同時針對傳統的Domain-Specific 并行編程方法,建立了涵蓋結構網格(JASMIN)、非結構網格(JAUMIN)、組合幾何(JCOGIN)三種框架。通過組件封裝的方法,方便地實現了并行程序的生成。目前,該框架已經成功地應用在了近百種不同領域涵蓋各種數值方法的計算程序的并行優化中,為用戶帶來了極大的便利;日本築波大學的Taisuke Boku教授介紹了一種在含有FPGA的異構集群中靈活使用FPGA實現計算加速和互聯加速的技術,該技術充分利用最新FPGA上100Gbps光互聯接口和FPGA固有的高并發性,依托以太網構建低延遲大規模互聯網絡。基于該技術的原型系統AiS(Accelerator in Switch)已經部署在日本最快的超級計算機Oakforest-PACS上,并在多個應用上取得了成功。
論壇的最後進行了專題研讨,就E級計算的體系架構發展趨勢、高性能計算和大數據融合發展的挑戰,以及人工智能是否能成為高性能計算發展的助推器等問題進行了深入的探讨。
感謝國際超算專家帶來的精彩報告,同時感謝各參會者的積極參與,持續兩天的2017國際高性能計算論壇(IHPCF 2017)在熱烈的掌聲中圓滿落幕。本次論壇為中、美、日、德、俄等各國高性能計算研究者們提供了良好的國際交流合作平台,通過對高性能計算系統、網絡架構、系統軟件、應用支撐等關鍵技術的探讨研究推動了高性能計算向E級目标邁進;同時各國超算專家就超級計算與當下熱門的大數據、人工智能、雲計算等前沿技術的融合創新發展分享了各國經驗和取得的成果,為世界超算開辟了更廣闊的發展之路,在促進“E級計算”發展的同時開啟“超算+”時代!
未來,國家超級計算廣州中心将依托全新升級的“天河二号A”系統進行典型應用移植和優化,充分發揮它強大的計算能力和豐富的軟件資源優勢,以服務“大科學”、“大工程”和“新産業”為重心,緻力于推動高性能計算與大數據、人工智能以及雲計算融合發展,加速國産超算系統和應用水平走在“超算+”時代前列!