📢 #Gate广场征文活动第二期# 正式启动!
分享你对 $ERA 项目的独特观点,推广ERA上线活动, 700 $ERA 等你来赢!
💰 奖励:
一等奖(1名): 100枚 $ERA
二等奖(5名): 每人 60 枚 $ERA
三等奖(10名): 每人 30 枚 $ERA
👉 参与方式:
1.在 Gate广场发布你对 ERA 项目的独到见解贴文
2.在贴文中添加标签: #Gate广场征文活动第二期# ,贴文字数不低于300字
3.将你的文章或观点同步到X,加上标签:Gate Square 和 ERA
4.征文内容涵盖但不限于以下创作方向:
ERA 项目亮点:作为区块链基础设施公司,ERA 拥有哪些核心优势?
ERA 代币经济模型:如何保障代币的长期价值及生态可持续发展?
参与并推广 Gate x Caldera (ERA) 生态周活动。点击查看活动详情:https://www.gate.com/announcements/article/46169。
欢迎围绕上述主题,或从其他独特视角提出您的见解与建议。
⚠️ 活动要求:
原创内容,至少 300 字, 重复或抄袭内容将被淘汰。
不得使用 #Gate广场征文活动第二期# 和 #ERA# 以外的任何标签。
每篇文章必须获得 至少3个互动,否则无法获得奖励
鼓励图文并茂、深度分析,观点独到。
⏰ 活动时间:2025年7月20日 17
算力短缺下的大模型时代 企业如何应对高昂训练成本
算力服务:大模型时代的新商业模式
随着大模型在人工智能领域的热潮兴起,算力正在成为一种新兴的商业模式。虽然大模型"炼丹"的热度终将褪去,但算力服务商需要未雨绸缪,及时调整战略方向。
近期,一位清华大学毕业三年的年轻人训练出了参数量达亿级的盘古气象大模型。该模型使用了全球40年的天气数据,利用200张GPU卡进行了为期两个月左右的预训练。按照目前的市场价格计算,这个项目的训练成本可能超过200万元。而如果是训练通用大模型,成本可能会增加百倍。
目前中国已有超过百个10亿参数规模的大模型。然而,行业普遍面临高端GPU短缺的困境。算力成本居高不下,缺乏算力和资金成为摆在众多企业面前的现实问题。
高端GPU的供不应求是行业公认的难题。高峰时期,一张英伟达A100的价格被炒至二三十万元人民币,单台A100服务器的月租也飙升至5-7万元。即便如此,仍有企业难以获得所需芯片。某云计算行业高管表示,虽然客户对高端GPU资源需求旺盛,但目前的供给难以完全满足广泛的市场需求。
面对这一局面,业内普遍认为,随着大模型市场的竞争加剧,市场将逐渐回归理性,企业也会根据预期变化来调整策略、控制成本。
为应对算力短缺,企业采取了多种方法。一些公司通过使用更高质量的数据来提升训练效率。有的企业着力提升基础架构能力,实现千卡以上的稳定运行。还有公司选择从云计算架构过渡到超算架构,或使用国产平台进行大模型训练和推理。
算力已经成为一种新的服务模式。算力服务是以多样性算力为基础,通过算力网络链接,旨在提供有效算力的新兴产业领域。它不仅包括算力,还涵盖存储、网络等资源的统一封装,以API等形式完成算力交付。
在算力产业链中,上游企业主要提供算力基础资源,中游企业负责算力生产和供给,下游企业则利用算力服务进行增值服务。目前,按量计费和包年包月是主流的算力服务计费模式。
随着大模型高性能计算需求的常态化,算力服务正快速形成独特的产业链和商业模式。尽管当前高端GPU短缺、算力成本高企,但这种状况是暂时的。长远来看,算力服务商需要随时准备应对市场变化,在大模型热潮回归理性时及时调整策略。