3月25日,在中國科學院“先導杯”并行計算應用大賽啟動會上,中國工程院院士、大賽專家咨詢委員會主席李國杰講述了一件往事。
1987年1月,李國杰從美國學成歸國,成為中國科學院計算技術研究所一名研究員。就在這一年,李國杰受中國科學院理論物理研究所之邀,專門去講授一門課程:并行計算。
李國杰注意到,彭桓武(“兩彈一星”功勛科學家,時年72歲)、郝柏林(我國著名理論物理學家,時年53歲)等老科學家都坐在臺下聽課,一堂不落。
“我深深感受到了老一輩物理學家當時對并行計算技術的渴求。”李國杰說。
并行計算迎來黃金時
“下一個十年,將出現(xiàn)一個全新的體系結(jié)構(gòu)的‘寒武紀大爆發(fā)’,學術界和工業(yè)界的計算機架構(gòu)師將迎來一個激動人心的時代;而體系結(jié)構(gòu)的改進必須和并行算法、并行軟件同步進行,而且越是高層的改進效率提升越大。”李國杰說,因此,“未來幾十年一定是并行計算的黃金時代”。
為什么說計算機性能越高、其能解決的問題越大,算法的優(yōu)化所帶來的好處就越大?李國杰舉了一個例子。
“一個問題的規(guī)模為N,假設解決該問題一種算法為Alg1,它的計算復雜性是N的平方;另外一個算法是Alg2,優(yōu)化以后它的計算復雜性是Nlog2N。那么,兩個算法的性能比值是N/log2N——N越大,性能的差別就越大。”李國杰更進一步說明道,“對于只能解決問題規(guī)模為10的低端計算機,兩個算法的性能只相差3倍;但是對于能解決問題規(guī)模達1000的超級計算機,兩者性能就相差100倍。”
“換一個角度,如果在低性能的單機上兩種算法可解決問題的規(guī)模相差3倍,則在包含上百萬處理器的超級計算機上,兩個算法可解決問題的規(guī)模相差上百倍。”李國杰說,因此,計算機性能越高,越需要優(yōu)化算法。
據(jù)介紹,此次中國科學院“先導杯”并行計算應用大賽,就意在凝聚不同領域?qū)I(yè)人才,彌補我們在基礎算法和軟件應用上的不足,建立和完善先進計算產(chǎn)業(yè)生態(tài)。
從技術推動轉(zhuǎn)向應用拉動
在分享中李國杰提到,計算機科學家的思維定勢仍是技術推動,而非時下更為迫切的應用拉動。
“過去,在計算機科學家的傳統(tǒng)思維邏輯中,他們認為用戶并不知道需要什么技術;于是計算機科學家引進新的語言、研制新的編譯技術、創(chuàng)新系統(tǒng)結(jié)構(gòu)來解決某些并行問題,然后將他們自以為‘聰明’的解決方案推送給用戶。而問題是,用戶并不會用也不太愿意學習這些學者們提供的方法。”
“計算機科學工作者應當和應用領域?qū)<乙黄痖_發(fā)關鍵的并行應用程序。”李國杰說,當前計算機科學正在融入到其他科學中。計算機科學中的概念、定理、方法正在發(fā)展成為更寬廣領域,特別是生物和化學領域的基本工具,這些工具將集成到整個科學的織網(wǎng)中。
“現(xiàn)在新的科研途徑就是應用拉動的,即所謂top-down研究方式,計算機科學工作者應當和應用領域?qū)<乙黄痖_發(fā)關鍵的并行應用程序。”李國杰說,計算機科學家與其他領域的科學家密切合作,已成為當代科學研究的特點。
他指出,其他領域的學者運用普遍流行的算法和軟件會解決一些局部性的問題、獲得一些漸進性的改進,但要獲得算法上的根本性突破,需要與真正懂算法的計算機科學家深度合作。
“為解決腦科學的解剖成像等問題,一些腦科學家這幾年一直和我的一個老朋友——中國工程院的外籍院士、普林斯頓大學計算機科學系講席教授李凱合作。這些腦科學家用傳統(tǒng)的技術重構(gòu)老鼠的大腦需要7000年,現(xiàn)在通過他的新算法、新模型,數(shù)據(jù)分析時間縮短了20萬倍。”李國杰說。
并行計算仍面臨不少挑戰(zhàn)
在分享的最后,李國杰提出,盡管并行計算大行其道,但“并行計算并不是萬能藥”。
他提出,目前,智能計算、大數(shù)據(jù)計算主要是靠并行處理,不但GPU給人的希望是大規(guī)模并行,量子計算、生物計算等的威力也是并行處理。“并行計算雖然有很強大的功能、效率,但是它也不是萬能的。”
“30多年前,我在美國讀博士的時候,就在我的博士論文中作出這樣的結(jié)論——并行處理只能夠提高串行計算可求解問題的計算效率,不能用來擴大求解指數(shù)負載性問題的規(guī)模。”李國杰解釋道,也就是說,如果某個問題是指數(shù)復雜性問題,僅僅采用并行計算,求解問題的規(guī)模是擴大不了的。
此外,并行計算目前還面臨著不少挑戰(zhàn)。李國杰提到,并行計算目前還面臨著“需要有全新的思路挖掘片內(nèi)并行性”“如何緩解因擴展并行而惡化的訪存瓶頸”“并行算法也要緊緊圍繞低功耗這個更重要的目標”“提高并行計算的通用性、覆蓋應用的范圍”“必須對付智能應用這類動態(tài)、不確定的復雜負載”等重要命題。
來源:《中國科學報》