3月22日,中國電信宣布,天翼云上海臨港國產萬卡算力池正式啟用,人工智能研究院、上海稀宇科技(MiniMax)、百川智能、思必馳科技等八家人工智能研究機構和企業作為首批用戶入駐。
就在三天前,3月19日,上海市發展和改革委員會等部門聯合印發《上海市新型基礎設施建設項目貼息管理指導意見(2024年版)》(以下簡稱《指導意見》),鼓勵合作銀行建立上海市新基建優惠利率信貸資金,總規模達到1000億元以上,重點支持新網絡、新算力、新數據、新設施、新終端五大領域,由此可見上海對于加快新型基礎設施建設,推動新質生產力發展的迫切。
算力集群
作為上海“新算力”建設的重要一極,中國電信在接應上海市政府要求,加速建成多元供給、云邊協同、隨需調度、高效綠色的城市高性能算力網絡體系上跑出了加速度。
此次正式投產運營的算力池,是國內首個投入正式運營的國產單池萬卡液冷算力集群,也是業內領先的全國產化云智一體公共智算中心。
“理論上,集群規模越大,大模型訓練的速度就越快。”首批入駐企業思必馳科技聯合創始人、首席科學家俞凱告訴《IT時報》記者,中國電信國產萬卡算力集群的推出,有助于解決國產大模型企業的可持續發展問題。
發布會現場,上海市副市長陳杰與中國電信副總經理唐珂共同點亮算力池。上海市政府副秘書長莊木弟、中國電信市場部總經理陳文俊、上海電信總經理龔勃、上海市發改委副主任裘文進、上海市通管局副局長賀豐、天翼云公司副總經理黃洪波、上海電信副總經理陳志宏、上海電信資深經理張慷出席會議,上海電信總經理助理龔豪與合作伙伴簽署入駐協議。
單池萬卡支持萬億大模型訓練
全球人工智能發展正在進入“深水區”。
隨著生成式AI的迭代和發展,大模型規模正以驚人的速度擴展,萬億參數級別幾乎成為通用大模型的標配,然而算力需求量大、利用率低、成本壓力大、模型構建難度提升、模型行業落地復雜,成為大模型開發應用面臨的一系列挑戰。
不久前舉行的全國兩會上,《政府工作報告》提出要“適度超前建設數字基礎設施,加快形成全國一體化算力體系”。
作為央企和國云平臺的構建者,中國電信早在三年前便超前布局,在臨港新片區成立臨港算力(上海)科技有限公司,加速臨港算力中心建設,為長三角提供更加優質、更加普惠的智算公共服務。
如今,成果已初現。
國內最大的國產單池液冷萬卡算力集群正式在上海臨港智算園區交付,并投入商業運營。
據《IT時報》了解,此次啟用的天翼云上海臨港國產單池萬卡液冷算力集群創新性地采用網絡中置、算力分層的“魔方”型,實現了單一集群內萬卡高速互聯,可以滿足萬億級參數大模型訓練所需的多機多卡并行、高吞吐無損通信等需求。
同時,為了實現綠色低碳的目標,全面采用融合液冷服務和IDC基礎設施的新一代智算液冷DC艙,實現了數據中心的能效和智算集群的算效雙提升,為“人工智能+”提供智能、彈性的綠色算力。
“新國貨” 新算力
提升算力自主創新能力,實現國產算力技術和能力突破,建立云網協同的高性能算力基礎設施,是“新算力”的核心基石。
這次中國電信拿出的“新算力”,是妥妥的“新國貨”。在天翼云臨港國產算力池里,除硬件全部采用國產芯片和設備外,智算云的操作系統、智算服務平臺和算力網絡等方面,也都實現了全棧自研。
黃洪波介紹,此次投入運營的公共智算中心以中國電信天翼云自研TeleCloudOS 4.0為底座,承載天翼云算力分發網絡平臺“息壤”、智算基礎設施平臺“云驍”、一站式智算服務平臺“慧聚”,構建算力聚合分發的新模式,實現全棧能力自主可控、安全可信,可為大模型企業提供從算力供給、算力輸送、算力調度到模型訓練及推理應用的一站式服務。
其中,“云驍”支持多種國產芯片及上層框架,可以對萬卡規模智算集群進行納管,實現超大規模集群穩定運行;“息壤”算力網絡則可以將零散的通算、智算和超算算力統一分配調度,目前已納管上海多家智算廠商,為上海本地企業提供普惠的智算調度服務。
“在算力方面,國產大模型企業面臨兩個挑戰,第一是有沒有,第二是用不用得起,我們希望中國電信打造的國產萬卡算力池和公共智算云服務,能幫我們解決第一個問題。”俞凱告訴記者,期待與算力租賃相關的補貼配套政策能陸續出臺,從而降低算力成本。
賦能大模型全產業鏈
此次發布會上,有八家合作伙伴作為首批用戶入駐臨港國產算力池,其中既有通用語言大模型公司百川智能、上海稀宇科技、思必馳科技、天壤智能,也有深耕金融領域的行業大模型金聲玉亮、國內領先的企業級AI-Agent平臺公司瀾碼科技、AI創新生物制藥公司賽隴生物,以及承擔上海市人工智能研發與轉化培育建設重任的上海人工智能研究院,基本覆蓋基礎層、技術層、應用層等人工智能完整產業鏈。
作為國內開展對話式人工智能技術研發的領軍企業,思必馳2022年獲批建設“語言計算國家新一代人工智能開放創新平臺”,該公司自研的行業語言大模型DFM-2,通過了《生成式人工智能服務管理暫行辦法》和《中國境內深度合成服務算法》兩個備案。
據了解,DFM-2已在臨港國產算力池完成初步適配,實測結果顯示,遷移后集群訓練效率與原集群基本可對標,通過配套高效的RDMA網絡,以及亞毫秒時延的并行文件存儲,算力得到了有效釋放。
隨著“人工智能+”首次被寫入政府工作報告,AI產業機遇正在加速涌現。根據《上海市人工智能產業發展“十四五”規劃》,到2025年,上海將基本建成具有國際影響力的人工智能產業創新發展高地,人工智能規上產業規模年均增長12%以上,達到4000億元。
2月19日,國務院國資委召開“AI賦能產業煥新”中央企業人工智能專題推進會,會議強調,中央企業要把發展人工智能放在全局工作中統籌謀劃,加快建設一批智能算力中心,開展AI+專項行動。
在中國電信的智算中心布局中,上海是重要的核心樞紐節點之一,或將持續迎來算力建設高潮。
評論