五度易链-专注数据治理服务与产业数据应用领域

電話咨詢 在線咨詢 產品定制
電話咨詢 在線咨詢 產品定制
010-68321050

《智能計算中心創新發展指南》發布:提升算力利用率要做“加法”,優化算力調度要做“減法”!

五度易鏈 2023-08-01 3621 0

專屬客服號

微信訂閱號

大數據治理

全面提升數據價值

賦能業務提質增效

 “實際上,算力之困已經爆發了。”張云泉坦言,國內目前大模型存在技術水平不高、同質化等問題,主要是算力層面和國外差距比較大,沒有算力基礎,后面算法等都無法進一步發展。這些大模型企業不是不愿意盡快更新迭代,而是算力不夠用,只能精打細算。

  伴隨國內“百模大戰”愈演愈烈,AI產業化前夜似乎已在不知不覺中來臨。海量數據爆發,計算量指數級增長,傳統基礎設施架構下的算力早已無法滿足模型時代的算力需求。據OpenAI測算,全球AI訓練所用的計算量呈現指數級增長,平均每3.43個月便會增長一倍,目前計算量已擴大30萬倍,遠超算力增長速度。國家信息中心聯合浪潮信息發布的《智能計算中心創新發展指南》顯示,當前我國超過30個城市正在建設或提出建設智算中心,但仍然無法滿足相關的需求。智能算力的供需矛盾日益凸顯,由AI大模型引發系列連鎖反應正在讓科技圈從“狂熱”走向“冷靜”。

  算力之困已經爆發了?

  打造一個大模型究竟需要多少算力?公開數據顯示,ChatGPT初始所需的算力就是1萬塊英偉達A100(一種AI芯片),價格大約是1億美元。后續的調優訓練每天算力消耗大概是3640PFLOPS,需要7至8個算力達到500PFLOPS的數據中心支持,建設成本約為三四十億元。

  “大模型的用戶量、訪問速度、網絡帶寬、訓練模式等都會影響到其算力需求的大小。”中國科學院計算技術研究所研究員張云泉在接受《中國電子報》記者采訪時表示,“要訓練一個中國版的ChatGPT,首先要部署價值至少1億美元的硬件設施,還要準備大筆訓練調優的費用。”

  騰訊云異構計算產品負責人宋丹丹對《中國電子報》記者介紹稱,大模型對算力的要求分為訓練和推理兩個階段。訓練需要短時間內的并行算力,而且要在短時間內能夠做到交付,對算力的量、算力的穩定性和性能、彈性擴縮容能力有高要求。進入推理階段,對于單位算力的性價比、成本、算力所處的位置、端應用服務是否能夠快速連接等要求比較高。這就要求企業具備海量的可擴縮容的高性能算力,并且這些算力能夠穩定交付。

騰訊云自研的星星海服務器在云上支持AI企業的大模型訓練需求

  近日,廣發證券分析師對國內AI大模型的訓練和推理階段算力需求,以及相應的成本進行了測算。結果顯示,在暫不考慮軟件層面算法優化帶來的模型消耗算力成本下降的前提下,國內大模型在訓練與推理階段或將產生相當于1.1萬臺或3.8萬臺(樂觀假設下)高端AI服務器的算力需求,以單片A100售價10萬元、AI加速卡價值量占服務器整機約70%計算,則對應約126億元或434億元增量AI服務器市場規模。

  “實際上,算力之困已經爆發了。”張云泉坦言,國內目前大模型存在技術水平不高、同質化等問題,主要是算力層面和國外差距比較大,沒有算力基礎,后面算法等都無法進一步發展。這些大模型企業不是不愿意盡快更新迭代,而是算力不夠用,只能精打細算。

  浪潮云首席技術官孫思清在接受《中國電子報》記者采訪時表示,從通用算力到智能算力,算力需求的變化其實與場景需求密切相關。伴隨模型參數規模越來越大,智能化程度越來越高,對并行計算能力以及包括存儲、網絡等在內的底層基礎硬件能力,以及擴展性、靈活性的要求也越高。此外,算力還要與大模型本身進行更好的適配。在這樣的形勢下,智能算力需求激增。

  記者了解到,近幾個月騰訊云智算商機相比去年同期增長10倍以上。另據一些服務器廠商透露,目前智算服務器出貨量超過通用CPU了。不過,孫思清表示,未來,隨著軟硬件升級和大模型核心技術的提升,同等規模的大模型所需算力也許會逐漸減少。

  提升算力利用率要做“加法”

  隨著AI大模型同雨后春筍一般層出不窮,人工智能應用加速向各行各業滲透,新一輪算力革命加速啟動。工信部最新數據顯示,中國算力總規模居全球第二,保持30%左右的年增長率。新增算力設施中,智能算力占比已超過50%。在多個權威市場分析機構的排名中,美國和中國都屬于算力的領跑者,主要差距在于計算效率和應用水平。

  “我國算力的利用率只有30%。”中國工程院院士鄔賀銓坦言。他認為,算力利用率低一方面是因為雖然算力有了,但是存儲沒有跟上,算力不能得到很好發揮,建議進行數據優化;另一方面是因為算力使用門檻相對較高,只有極少數企業能做,建議降低門檻,讓算力使用更簡單便捷。

  提升算力供給能力是重中之重。孫思清表示,硬件層面,CPU、GPU等核心硬件的性能越來越高,將有效提升算力供給能力;軟件層面,模型算法和計算框架的優化,也能緩解一定的算力壓力,減少對算力的依賴。

浪潮云基于運維安全大模型建立新型OpsCenter服務交付體

  “不同于超算需要的64位雙精度浮點運算,智能算力多為32及以下的低精度運算,它是分階段的,可以通過硬件加速來實現算力提升。”張云泉表示。比如,隨著數據量的增長和計算任務的復雜化,CPU、GPU需要具備更高的計算和處理能力,存儲器需要具備更大的容量和更快的讀寫速度。同時,算力提升還需要更大的網絡帶寬、速度更快的網絡設備,從而更快地完成大規模數據傳輸和處理。

  “智算即異構計算。相對于只用CPU的通用計算,在服務器里CPU+GPU就是異構計算。背后的邏輯,是讓最適合的專用硬件去做最適合的事。”宋丹丹表示,“對于整個算力的優化是分層級解決的。除了計算資源自身的架構和性能提升,也就是卡的迭代外,我們會在虛擬化層,通過GPU虛擬化或者計算池化等等一系列的技術,會把算力做更多的多機多卡互聯,然后把它以云服務、容器、Serverless或者實例的模式更靈活地對外使用。在平臺層,通過任務流的模式,以深入上層服務的方式進一步優化計算效率。”

  優化算力調度要做“減法”

  如果能讓復雜的算力資源匹配與調度過程變得簡單化,無疑會實現事半功倍的效果。有觀點認為,公有云可以更大程度的調度多元算力,讓算力資源的調配變得更快速、更簡單、更便捷。

  日前,復旦大學率先選擇將智能計算平臺CFFF部署在公有云上。據復旦大學浩清教授、人工智能創新與產業研究院院長漆遠透露,有賴于公共云模式,跑在CFFF平臺上的項目可享受到超千卡并行的智能算力,千卡并行的有效算力達到行業領先的92%,可拓展性達到萬卡,萬卡并行有效算力也可達90%。

  中國工程院院士、阿里云創始人王堅指出,從計算到智算,公共云提供的是像電一樣的計算服務,把算力基礎設施部署在公共云上將加速推動產業步入開放發展的新階段。在他看來,AI大模型的訓練和運營需要集約化、在線的算力基礎設施。集約化的算力基礎設施是基礎支撐,要求更高的計算并行性、更高的計算效率、更低的計算成本,并且要求適配各類專用計算芯片。在線化對算力提出更高要求,從模型訓練和應用看,需要形成“用戶膨脹、使用反饋、模型進化”的飛輪效應,海量用戶在線使用和大規模API調用集成等都需要在線化的算力資源。這種集約化、在線化的需求,與公共云集中建設運維、彈性伸縮、按需服務的商業模式不謀而合。

  “云是大模型最好的承載方式,也是訓練和應用大模型的最佳平臺。”宋丹丹指出,一方面,云上具備領先的軟硬件架構、面向未來的技術架構和研發體系。對AI企業而言,從本地搭建服務器架構可能不是一個合適的選擇。借助云上豐富的能力和產品,如云上的算力、網絡、向量數據庫,企業可以聚焦于大模型研發本身,業務開發的敏捷度也能進一步提升。另一方面,打造大模型需要的算力規模,對企業現金流的挑戰很大。云上的算力形式,可以根據用戶需求靈活分配計算資源,同時也提升了大模型的訓練和推理效率。

  孫思清認為,公有云集約化的特點有助于算力共享模式的實現。大模型的訓練并不是一直滿負荷進行的,空閑的時候,可以利用云的模式將算力池化,與其他有算力需求的企業共享。但同時他也指出,現實操作起來存在困難,數據歸屬、隱私保護、合規性等問題都需要考慮。

  他表示,算力可以當作“水電”來用,但數據不可以。“水電”能動,但“水廠”“電廠”不能動,分布式算力并不能適用所有場景。此外,算力互聯還需建立標準化的運營體系,算力如何計量、如何付費、如何結算都需要探討。

  張云泉表示,具體問題要具體分析,不能一概而論。幾十億參數規模的大模型放在云上可以,幾百億、上千億規模的大模型肯定不行。中等規模以下的智算中心可以部署在公有云上,但大規模的智算中心如果部署在公有云上,網絡延遲會很大,難以支撐高端計算。另外,運營商也會考慮到用云成本以及上云后是否會被云廠商“鎖定”等問題。

  他認為,優化算力調度不能光靠算力網絡的互聯互通來解決問題。首先要盡快推進接口協議,定義標準、建立標準;其次要優化算力調度管理軟件,同時建設安全體系;此外,要選擇成熟芯片和生態完善的技術路線,這樣智算中心用起來效率才能達到比較高的水平。建議組建生態聯合體,共同打造1~2個大規模的智算中心,協同訓練少數幾個通用大模型,共享算力資源。”

  “未來,大模型將走向相對開放的生態,開源是一個重要趨勢。”孫思清說道。他建議,政府層面應做好算力資源的統籌,重點聚焦合規性管控和集約化建設,把握好節奏,避免“一窩蜂”導致大量算力的浪費。企業層面應持續加打技術創新與場景實踐力度,分工合作,協同發展。

  作者:宋婧  來源:中國電子報、電子信息產業網

本文為本網轉載,出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其內容的真實性,如涉及侵權,請權利人與本站聯系,本站經核實后予以修改或刪除。

評論

產業專題

申請產品定制

請完善以下信息,我們的顧問會在1個工作日內與您聯系,為您安排產品定制服務

  • *姓名

  • *手機號

  • *驗證碼

    獲取驗證碼
    獲取驗證碼
  • *您的郵箱

  • *政府/園區/機構/企業名稱

  • 您的職務

  • 備注

主站蜘蛛池模板: 直流电能表-充电桩电能表-导轨式电能表-智能电能表-浙江科为电气有限公司 | 解放卡车|出口|济南重汽|报价大全|山东三维商贸有限公司 | 桑茶-七彩贝壳桑叶茶 长寿茶 | 上海新光明泵业制造有限公司-电动隔膜泵,气动隔膜泵,卧式|立式离心泵厂家 | 炉门刀边腹板,焦化设备配件,焦化焦炉设备_沧州瑞创机械制造有限公司 | 通信天线厂家_室分八木天线_对数周期天线_天线加工厂_林创天线源头厂家 | 废水处理-废气处理-工业废水处理-工业废气处理工程-深圳丰绿环保废气处理公司 | CNC机加工-数控加工-精密零件加工-ISO认证厂家-鑫创盟 | 辊道窑炉,辊道窑炉厂家-山东艾希尔 | 分类168信息网 - 分类信息网 免费发布与查询 | 无线讲解器-导游讲解器-自助讲解器-分区讲解系统 品牌生产厂家[鹰米讲解-合肥市徽马信息科技有限公司] | 刺绳_刀片刺网_刺丝滚笼_不锈钢刺绳生产厂家_安平县浩荣金属丝网制品有限公司-安平县浩荣金属丝网制品有限公司 | 珠海白蚁防治_珠海灭鼠_珠海杀虫灭鼠_珠海灭蟑螂_珠海酒店消杀_珠海工厂杀虫灭鼠_立净虫控防治服务有限公司 | 深圳市人通智能科技有限公司| 阜阳在线-阜阳综合门户| 免费个人pos机申请办理-移动pos机刷卡-聚合收款码办理 | 液压压力机,液压折弯机,液压剪板机,模锻液压机-鲁南新力机床有限公司 | 工业洗衣机_工业洗涤设备_上海力净工业洗衣机厂家-洗涤设备首页 bkzzy在职研究生网 - 在职研究生招生信息咨询平台 | 中山市派格家具有限公司【官网】 | 上海租车公司_上海包车_奔驰租赁_上海商务租车_上海谐焕租车 | MVR蒸发器厂家-多效蒸发器-工业废水蒸发器厂家-康景辉集团官网 | 蒸汽热收缩机_蒸汽发生器_塑封机_包膜机_封切收缩机_热收缩包装机_真空机_全自动打包机_捆扎机_封箱机-东莞市中堡智能科技有限公司 | 多功能三相相位伏安表-变压器短路阻抗测试仪-上海妙定电气 | 风化石头制砂机_方解石制砂机_瓷砖石子制砂机_华盛铭厂家 | 泰国专线_泰国物流专线_广州到泰国物流公司-泰廊曼国际 | 北京银联移动POS机办理_收银POS机_智能pos机_刷卡机_收银系统_个人POS机-谷骐科技【官网】 | 水厂自动化-水厂控制系统-泵站自动化|控制系统-闸门自动化控制-济南华通中控科技有限公司 | 石英陶瓷,石英坩埚,二氧化硅陶瓷-淄博百特高新材料有限公司 | 聚氨酯催化剂K15,延迟催化剂SA-1,叔胺延迟催化剂,DBU,二甲基哌嗪,催化剂TMR-2,-聚氨酯催化剂生产厂家 | 不锈钢搅拌罐_高速搅拌罐厂家-无锡市凡格德化工装备科技有限公司 | 诺冠气动元件,诺冠电磁阀,海隆防爆阀,norgren气缸-山东锦隆自动化科技有限公司 | 【电子厂招聘_普工招工网_工厂招聘信息平台】-工立方打工网 | 太平洋亲子网_健康育儿 品质生活| 通用磨耗试验机-QUV耐候试验机|久宏实业百科| 深圳装修_店面装修设计_餐厅设计_装修全包价格-尚泰装饰设计 | 集装袋吨袋生产厂家-噸袋廠傢-塑料编织袋-纸塑复合袋-二手吨袋-太空袋-曹县建烨包装 | 帽子厂家_帽子工厂_帽子定做_义乌帽厂_帽厂_制帽厂 | 定硫仪,量热仪,工业分析仪,马弗炉,煤炭化验设备厂家,煤质化验仪器,焦炭化验设备鹤壁大德煤质工业分析仪,氟氯测定仪 | 河南生物显微镜,全自动冰冻切片机-河南荣程联合科技有限公司 | TPM咨询,精益生产管理,5S,6S现场管理培训_华谋咨询公司 | 吉林污水处理公司,长春工业污水处理设备,净水设备-长春易洁环保科技有限公司 |