2020年一開局,新冠病毒就給全球一個“暴擊”,所有人都不得不面對這場危機。
但危機也意味“危中有機”。
在線會議迎來了爆發,僅釘釘一個平臺,全國超過2億人實現了在線辦公,1.2億學生在線上課。
互聯網技術二十年的發展,讓這些數字不足為奇。
但是恐怕不會有太多人注意到, 疫情的爆發也讓AI技術浮出水面,乃至悄然滲透到我們日常生活的角落:
AI醫療用于核酸檢測、肺部CT檢查;機器人技術保證疫情期間的生產得以繼續進行;人臉檢測用于跟蹤和防控病毒傳播。
在這一切看得見的技術之下,還有更多看不見的基建設施在背后提供。僅AI醫療影像每天要處理上萬張CT圖像,需要服務器進行大量的訓練和推理運算。
如果沒有強大的算力資源作后盾,AI技術也只是“巧婦難為無米之炊”。
因此,國家在3月提出了新基建:加快5G網絡、數據中心等新型基礎設施建設進度。
誰來提供巨大的算力需求?
在4月9日浪潮2020年云數據中心合作伙伴大會(IPF2020)上,浪潮發表了對于未來數據中心演進趨勢的獨到見解
智算中心,為AI時代“發電”
大會一開始,浪潮集團執行總裁、首席科學家王恩東便以電力為比喻,告訴我們算力在AI時代的基礎地位。
工業時代,電力是推動社會進步的基礎,而算力則是我們這個AI時代的電力。
擁有業內最強最全面的AI計算產品系列的浪潮自然沖在提升算力的第一線。
增加發電量可以堆砌燃料,但提升算力可不僅僅靠堆砌硬件。
在王恩東看來,圍繞算力要在四個關鍵作業環節做出創新:生產算力、聚合算力、調度算力、釋放算力。
生產算力就是要以硬件為基礎,不能僅僅靠硬件,但沒有強大的硬件卻萬萬不可能。
近年來,浪潮推出了多款強大的AI算力機組:AGX-5是目前全球最高性能的AI計算主機之一,AGX-2是目前單位空間內GPU計算密度最高的服務器,MX1是全球首個可支持多家不同型號AI芯片的AI開放加速系統。
有了強大的硬件設備,就能訓練更強的AI模型。
借助浪潮的超大規模AI計算框架LMS,浪潮首先實現了70億參數自然語言處理模型的訓練,相比主流的BERT模型參數量提升了20倍。
在提升單機的計算能力后,浪潮依托數據中心來聚合算力。
比如,浪潮NX20智能網絡加速產品可以打造更高效率更低延遲的云中心,而針對高并發推理集群,浪潮通過構建高性能存儲池和深度優化軟件棧,吞吐能力提升3.5倍以上。
全面升級的浪潮AI軟件
如果說這生產算力和聚合算力相當于制造發電機和并網發電,那么調度算力和釋放算力就是把電力以最高效的方式輸送到最需要的地方,更需要在軟件上優化。
正因如此,硬件廠商的浪潮近年來在AI軟件方面也有大量投入,甚至軟件開發人員數量已經超過硬件。
對客戶而言,要在有限的硬件成本上充分利用算力,唯有在軟件上的提升,才能實現AI算力的釋放。
浪潮AI&HPC總經理劉軍認為:
要生產算力,光有非常好的硬件實際上還是不夠的,如何把更大規模的計算挑戰在當前的硬件平臺上實現,我們還需要有非常強大的軟件優化產品和技術,使得我們充分釋放AI計算的算力。
所以,浪潮早在2017年就推出了深度學習訓練平臺AIStation。
AIStation支持多種深度學習框架,可以快速部署深度學習訓練環境,管理深度學習訓練任務,實現對硬件算力的管理和調配。提高計算資源的利用率和生產率,為深度學習用戶提供高效易用的平臺。
今年的IPF上,浪潮又重磅發布了AIStation推理平臺,全面支持訓練與推理兩大環節,將AI計算的另一塊拼圖補上,成為業界功能最全的AI管理平臺。
這一次的全新升級AIStation資源平臺全面支持訓練與推理兩大環節,實現從模型開發、訓練、部署、測試、發布、服務的全流程一站式高效交付,為企業用戶提供更全面的服務。
平臺已經搭建完成。萬事俱備,只欠東風。開發技術可能又是橫在企業面前的一道難題。
為了解決傳統企業在AI落地上面臨的技術能力不足、人員匱乏的情況。
浪潮發現在面對AI客戶時,這些企業最大的問題是缺乏專家,很難花費大量的人力物力去開發AI應用,
而AutoML是現在AI民主化的一個極有前景的研究方向。不需要太多AI專業知識,即可根據需求自動開發模型。
浪潮將這一些列軟件打包為AutoML套件(AutoML Suite),能夠從海量的數據里面,自動產生跟AI相關的高技術模型,降低了企業使用AI的門檻。
AutoML Suite中包含自動搜索網絡的AutoNAS、自動調參的AutoTune和自動壓縮剪枝的AutoPrune,解決了從開發設計到訓練再到部署過程中的每個難點。
同時AutoML Suite還能保證在用戶開發時數據的隱私保密性,又解決了企業在考慮上云時存在的擔憂。
而有了浪潮的這兩件工具,過去需要幾個專家開發數月的模型,現在可能只需一兩人在幾天內完成開發,過去需要數天才能部署到設備的模型,現在只需幾分鐘。
在AI算力四大作業環節的加持下,智算中心已可以對外提供一站式AI算力高效供應。
浪潮認為,智算中心將成為新基建,為AI產業提供動力,它需要滿足開放標準、集約高效和普適普惠三個必要條件。
開放標準,要求智算中心從硬件到軟件、從芯片到架構、從建設模式到應用服務都應該是開放的、標準的;集約高效,要求智算中心的建設要有超大規模,要采用領先的技術,保證自身的先進性;普適普惠,則要求智算中心發揮基礎設施的社會價值,服務大眾。
在王恩東看來,雖然對于普通人來說,智算中心看不見摸不著,但它就在那里,源源不斷產生智慧時代的動力。智算中心,就是我們這個時代的動力源。
評論