首頁>要聞 要聞
超算的真正較量:美國重登第一,中國怎么辦?
6月25日,在德國法蘭克福舉行的2018國際超算大會上,最新一期Top500全球超算排行榜正式發布,美國橡樹嶺國家實驗室的超級計算機Summit,以峰值計算性能每秒20億億次(200 PFlops)的速度登頂全球最快超級計算機。
中國的天河二號和神威·太湖之光讓出了已經占據5年的第一。不過,在業內人士看來,Summit已經比預計的日期延后了一年,而中國并非不能造出200 PFlops的機器,只不過各自有既定發展節奏。爭奪世界最強計算機固然重要,但超算的真正較量,絕不是看誰是第一那么簡單。
中看更中用
付昊桓記得這么一個故事。2010年的11月,天河1A首次成為世界最快。中國超算界專家都很高興,畢竟“最快”這個榮譽,幾十年來由美日壟斷。
不過,大會現場有美國專家發問,中國現在有實力構建全球最快的超級計算機,但是否能用最快的機器來解決最頂尖的科學或者工程問題?在這位專家的眼中,這臺龐然大物也許是“中看不中用”。
雖然尖銳刺耳,但的確反映了一個事實:造出最快的計算機固然不錯,能否真正發揮作用才是根本。
也差不多那個時候,付昊桓從斯坦福回到了清華地球系統科學系,聽說了這段故事。當時,天河1A采用的是英特爾的處理器和英偉達的GPU加速器,在上面跑大型的應用程序也才剛剛起步。
“我回到清華后的第二年,也就是2011年的時候,我們幾個人慢慢結識,先是認識了薛巍老師,然后是楊超老師。”付昊桓說。
清華大學計算機系的薛巍教授此前從事電力電網研究,之后又擴展到氣候模擬等其他應用領域。中國科學院軟件研究所楊超研究員則從事計算數學的研究。付昊桓那時正對新的計算架構著迷。“因為天河1A是CPU加GPU,主要的計算力由GPU加速器來提供。所以要把它高效用起來,就得把GPU用好了。我們當時就組了一個團隊,想把這個機器用起來,解決大氣模擬的問題。”付昊桓說。
從天河1A開始,短短幾年內,中國先后推出一系列超級計算機,不斷刷新“最快”紀錄:“神威藍光”“天河二號”“神威·太湖之光”,從2013年6月算起,中國的超算已占據TOP500榜單第一位置5年之久,并于2016年和2017年,兩獲“戈登·貝爾”獎。付昊桓現為清華大學地球系統科學系副教授、國家超級計算無錫中心副主任。
2016年,在一份報告中,美國國家安全局和能源部認為,中國超算已經和美國接近并跑,對其國家安全、經濟社會、超算行業等造成威脅,若再不加大投資,尋求改變,美國將失去其領導地位。
而今,再不會有人認為中國的超級計算機只是個龐然大物。最強超算的爭奪,已經成了中美日等少數國家之間的競爭。6月25日,美國Summit正式重回第一。不過業內清楚,擁有第一強的機器僅僅只是超算較量的一步。
打造完善的生態系統
利用太湖之光,付昊桓希望為研究地震發生機制提供更為準確的模擬平臺,同時為抗震防震提供量化評估工具。模擬唐山大地震之后,下一個更艱巨的目標是汶川地震。
付昊桓的團隊打算運用超算模擬汶川地震的震源產生、地震波傳播過程,針對特定區域完成基于地震過程情景模擬的震害預測,量化評估地震強度及震害分布。精確的模擬,對于降低與預防地震災害所帶來的巨大損失,以及開展地震高發區的合理規劃與設計,均可發揮重大作用。
付昊桓的團隊打算與成都理工大學研究山體滑坡的團隊合作,研究地震會不會觸發山體滑坡,會觸發什么樣的山體滑坡。此外也與建筑防震專家合作,將地震的模型與建筑的模型連接起來,研究發生地震后會對建筑造成怎樣的損害。“像美國加州地區也是地震頻發,那里人們買房子都要購買地震保險。而每棟房子保險的定價,背后依靠的就是基于地震模擬的量化風險評估。”付昊桓介紹說,地震相關產業服務離不開精確的模擬。
除了科學方面的用戶,各個超算平臺也接納了不少企業用戶——他們想設計新型的飛機發動機、船舶,還有風力發電的渦輪機葉片。超算已成為支撐智能制造,提升經濟質量的重要一環。
超算平臺大量的投資希望換回更大的社會經濟效益。無錫市希望通過超算平臺吸引從事人工智能、智能制造、工業大數據的企業和研究人員,其建立的超算產業園,也希望能惠及當地經濟發展。
國家超級計算無錫中心主任楊廣文利用一切機會推介神威·太湖之光。在去年的一個論壇上,他懇切地說:“超算大家聽上去是高大上的,也是國家戰略,但是否會把它做成一個可持續發展的(產業)?超算人也想成功。”
在前述的美國國家安全局和能源部的報告中,也認為中國超算將威脅美國經濟:“高性能計算領導地位的損失潛在地威脅到已經重度使用高性能計算的行業內的美國公司。這些行業包括汽車、航空航天、先進制造、石油勘探、制藥研究、金融等。這些行業在全球范圍內已經具有強的競爭性,因此美國競爭力的些許損傷(例如,如果中國用其高性能計算領導地位為其國內產業提供廉價甚至免費的計算能力)就會轉化成更大的經濟效應。同樣也會帶來重大的知識產權風險:如果一家制藥公司的藥品開發在海外進行,那么IP泄露在多大程度上會阻礙美國的競爭力?”
而對于中國,有些行業也發展到了一定程度,必須自行開發軟件。“飛機、高鐵還主要是依賴國外的商用軟件在進行設計和仿真,下一步我們希望基于‘神威’的平臺,特別是和這些應用單位深入合作去做我們自主工業仿真和設計的軟件平臺。”付昊桓說。
從采用國產的處理器,到編譯器、操作系統、各種計算庫、開發框架,中國的超級計算機試圖構建一套自己的生態系統,而要真正進入良性的發展還依賴于用戶的使用和反饋,他們是超算社群至關重要的一環。
期待整個青藏高原
2015年4月9日,美國商務部發布公告,禁止向中國的4家國家超算中心出售英特爾“至強”芯片。有外界評論認為,禁運可能和天河二號多次占據超級計算機高性能榜首有關。緊接著2015年年底,中國推出神威·太湖之光,且使用的是全國產芯片。
不過,這兩件事情之間僅僅是一種“巧合”。此前的“神威藍光”就已經采用了全國產芯片,神威·太湖之光從開始設計之初就是全國產,不過是按照預期的進度推出而已。
這恰如此次美國Summit的推出,都是意料中事。“200P、300P我們其實是可以造出來的,只是規劃節奏不一樣。”付昊桓解釋。
目前,世界各國正準備建造下一代E級計算機(100億億次)。為何建造E級計算機,TOP500發起人、橡樹嶺國家實驗室及田納西大學Jack Dongarra教授在上個月南昌舉辦的ASC會議期間說:“不是我們要造下一代計算機,而是科學家提出了更困難的挑戰,更難的問題(需要這樣的計算機),E級的計算機只是我們發展中間跨越的一個障礙物,以后還會有更高量級的計算機出現。”
中國目前有三家機構正在獨立研發E級計算機,預計于2020年推出。而中國超算更為重要長遠的任務,也許是整個生態系統的建設。
“單純從超算而言,無論是硬件系統,還是部分領域的軟件應用,中國都已經有和美日比肩的突破性成果。但要能夠對超算背后的諸多產業都能形成一個正面的反饋,還需要較長時間。比如基于超算的天氣及氣候預測、工業設計和仿真、新材料的制備、新藥研發等等,任何一個行業與超算硬件及軟件的融合,都能產生巨大的產業提升。我們現在有了超算技術的突破,下一步應該期待如何實現對產業的輻射和支撐。”付昊桓說。
對于中國的超算來說,現在有了一個珠穆朗瑪峰,下一步或許應該期待整個青藏高原。(作者系“知識分子”公號主筆)
編輯:曾珂
關鍵詞:超算的真正較量