近日,高性能計算與人工智能協同創新國際論壇(英文簡稱:HACI)在深圳舉辦,中國電信科技委主任邵廣祿應邀出席會議,分享了中國電信在智算集群和網絡方面的實踐與思考。
“算力是人工智能發展的重要驅動力,影響著大模型的迭代和創新的速度,也影響著經濟發展的速度。”邵廣祿介紹到,在智算方面,中國電信重點推進兩項工作,一是建成大規模智算集群,目前上海、北京兩個萬卡集群已經投產。面向AI大模型訓練的智算集群,需要從IDC向AIDC升級,重點圍繞模型算力利用率MFU、線性加速比、穩定性、時延、丟包率、GPU利用率等六大關鍵指標,持續開展智算集群的設計、建設、運營、優化等工作,提高大模型訓練的效率效能。二是用智算網絡和算力調度平臺實現全國算力資源的互聯互通,按需調用,自研“息壤”算力調度平臺,已實現全國21EFlops的算力調度。中國電信積極探索“云、網、智”的融合技術,致力于打造彈性超寬、高速無損、“云、邊、端”全域調度的智能算力網絡,滿足不同企業、不同行業對大模型訓練和推理的差異化需求。
邵廣祿表示,中國電信已經從電信運營商升級到電信+云計算的運營商。在AI時代,中國電信還將升級為智算服務商和大模型服務商,提供算力服務和模型服務。
邵廣祿指出,算力的網絡化成為發展方向,并倡議:一是推動算力生態的開源開放,為異構算力互通提供基礎的開發環境,以統一標準對接各類異構硬件,方便大模型在異構算力間自由切換。二是推進共建共享。生成式人工智能是重大的科技創新和產業變革,需要早布局、快推進,需要學術界和產業界以戰略眼光強化合作,集中力量突破底層技術,推動產業創新和產業生態建設。