算力短缺下的大模型时代 企业如何应对高昂训练成本

robot
摘要生成中

算力服务:大模型时代的新商业模式

随着大模型在人工智能领域的热潮兴起,算力正在成为一种新兴的商业模式。虽然大模型"炼丹"的热度终将褪去,但算力服务商需要未雨绸缪,及时调整战略方向。

近期,一位清华大学毕业三年的年轻人训练出了参数量达亿级的盘古气象大模型。该模型使用了全球40年的天气数据,利用200张GPU卡进行了为期两个月左右的预训练。按照目前的市场价格计算,这个项目的训练成本可能超过200万元。而如果是训练通用大模型,成本可能会增加百倍。

目前中国已有超过百个10亿参数规模的大模型。然而,行业普遍面临高端GPU短缺的困境。算力成本居高不下,缺乏算力和资金成为摆在众多企业面前的现实问题。

高端GPU的供不应求是行业公认的难题。高峰时期,一张英伟达A100的价格被炒至二三十万元人民币,单台A100服务器的月租也飙升至5-7万元。即便如此,仍有企业难以获得所需芯片。某云计算行业高管表示,虽然客户对高端GPU资源需求旺盛,但目前的供给难以完全满足广泛的市场需求。

面对这一局面,业内普遍认为,随着大模型市场的竞争加剧,市场将逐渐回归理性,企业也会根据预期变化来调整策略、控制成本。

为应对算力短缺,企业采取了多种方法。一些公司通过使用更高质量的数据来提升训练效率。有的企业着力提升基础架构能力,实现千卡以上的稳定运行。还有公司选择从云计算架构过渡到超算架构,或使用国产平台进行大模型训练和推理。

算力已经成为一种新的服务模式。算力服务是以多样性算力为基础,通过算力网络链接,旨在提供有效算力的新兴产业领域。它不仅包括算力,还涵盖存储、网络等资源的统一封装,以API等形式完成算力交付。

在算力产业链中,上游企业主要提供算力基础资源,中游企业负责算力生产和供给,下游企业则利用算力服务进行增值服务。目前,按量计费和包年包月是主流的算力服务计费模式。

随着大模型高性能计算需求的常态化,算力服务正快速形成独特的产业链和商业模式。尽管当前高端GPU短缺、算力成本高企,但这种状况是暂时的。长远来看,算力服务商需要随时准备应对市场变化,在大模型热潮回归理性时及时调整策略。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 6
  • 分享
评论
0/400
Token_Sherpavip
· 07-10 00:38
哈哈,又一次显卡挖矿……我们真的不懂吗
查看原文回复0
ZK佛系玩家vip
· 07-09 11:31
割韭菜还是上云便宜点
回复0
链游评鉴家vip
· 07-07 02:38
训练成本要吃掉多少利润啊,看了都心慌
回复0
GweiTooHighvip
· 07-07 02:34
建卡算力矿工已在路上~
回复0
ShibaOnTheRunvip
· 07-07 02:31
缺啥都不能缺算力啊
回复0
大鱿鱼讲师vip
· 07-07 02:19
又是哄抬gpu价格的
回复0
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)