算力短缺下的大模型時代 企業如何應對高昂訓練成本

robot
摘要生成中

算力服務:大模型時代的新商業模式

隨着大模型在人工智能領域的熱潮興起,算力正在成爲一種新興的商業模式。雖然大模型"煉丹"的熱度終將褪去,但算力服務商需要未雨綢繆,及時調整戰略方向。

近期,一位清華大學畢業三年的年輕人訓練出了參數量達億級的盤古氣象大模型。該模型使用了全球40年的天氣數據,利用200張GPU卡進行了爲期兩個月左右的預訓練。按照目前的市場價格計算,這個項目的訓練成本可能超過200萬元。而如果是訓練通用大模型,成本可能會增加百倍。

目前中國已有超過百個10億參數規模的大模型。然而,行業普遍面臨高端GPU短缺的困境。算力成本居高不下,缺乏算力和資金成爲擺在衆多企業面前的現實問題。

高端GPU的供不應求是行業公認的難題。高峯時期,一張英偉達A100的價格被炒至二三十萬元人民幣,單臺A100服務器的月租也飆升至5-7萬元。即便如此,仍有企業難以獲得所需芯片。某雲計算行業高管表示,雖然客戶對高端GPU資源需求旺盛,但目前的供給難以完全滿足廣泛的市場需求。

面對這一局面,業內普遍認爲,隨着大模型市場的競爭加劇,市場將逐漸回歸理性,企業也會根據預期變化來調整策略、控制成本。

爲應對算力短缺,企業採取了多種方法。一些公司通過使用更高質量的數據來提升訓練效率。有的企業着力提升基礎架構能力,實現千卡以上的穩定運行。還有公司選擇從雲計算架構過渡到超算架構,或使用國產平台進行大模型訓練和推理。

算力已經成爲一種新的服務模式。算力服務是以多樣性算力爲基礎,通過算力網路連結,旨在提供有效算力的新興產業領域。它不僅包括算力,還涵蓋存儲、網路等資源的統一封裝,以API等形式完成算力交付。

在算力產業鏈中,上遊企業主要提供算力基礎資源,中遊企業負責算力生產和供給,下遊企業則利用算力服務進行增值服務。目前,按量計費和包年包月是主流的算力服務計費模式。

隨着大模型高性能計算需求的常態化,算力服務正快速形成獨特的產業鏈和商業模式。盡管當前高端GPU短缺、算力成本高企,但這種狀況是暫時的。長遠來看,算力服務商需要隨時準備應對市場變化,在大模型熱潮回歸理性時及時調整策略。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 6
  • 分享
留言
0/400
Token_Sherpavip
· 07-10 00:38
哈哈,又一次显卡挖矿……我们真的不懂吗
查看原文回復0
ZK佛系玩家vip
· 07-09 11:31
割韭菜还是上云便宜点
回復0
链游评鉴家vip
· 07-07 02:38
训练成本要吃掉多少利润啊,看了都心慌
回復0
GweiTooHighvip
· 07-07 02:34
建卡算力矿工已在路上~
回復0
ShibaOnTheRunvip
· 07-07 02:31
缺啥都不能缺算力啊
回復0
大鱿鱼讲师vip
· 07-07 02:19
又是哄抬gpu价格的
回復0
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)