a16z「门徒」Inference 实操指南三:Epoch3 激励测试启动,Multicoin Capital 重金入局

撰文:J1N,Techub News

Epoch3 已于 2025 年 6 月 7 日正式启动,引入重大协议变更包括技术改进、新的质押机制和运营变革等。

Kuzco 已进行品牌升级,更名为 Inference。

该项目获 Multicoin Capital 投资一事属实。

设备门槛提高

推出与io.net 类似的质押挖矿机制

Epoch2 回顾

参与的配置推荐

阅读前建议回顾往期文章:

《a16z「门徒」Kuzco 实操指南:如何高效地进行 AI 算力挖矿?》

《a16z「门徒」Kuzco 实操指南二:从单兵作战到集群部署》

Multicoin Capital 入局实锤

去年的 12 月,Inference 创始人 Sam 在官方 DC 的黄金矿工频道声称该项目获得来自于 Multicoin Capital 和 a16z csx 1150 万美元融资。这一消息最近得到证实,在 Multicoin Capital 的 Portfolio 名单中能看到该项目列出。Inference 获 Multicoin Capital 投资一事属实。(Multicoin Capital 同时也是 io.net 早期的投资者)

Epoch 3 初期

自 2025 年 6 月 7 日 Epoch3 启动以来,网络已运行 10 天,相比前两期来说,参与的矿工人数明显增加、推理量和网络稳定性有显著提升。截止撰稿,worker 数量达到 1.21 万台,从数字上看虽然还没超越 Epoch1 的最高值 1.4 万台。但 Epoch3 限制了低算力显卡以及多开,合理推断目前参与人数数倍于早期。

Epoch 3 带来哪些变化?

自动节点更新

自动节点更新这一功能其实能非常大程度减轻矿工的运维负担,Epoch 1&2 运行体验下来,官方经常不定期更新文件,更新通知也不及时。导致很多用户进程终止,以为是设备出问题,花费大量时间折腾,其实原因是用户未及时更新。

统一推理引擎管理

笔者两期跑下来都是运行 Meta 的 Llama-3.1-8B 模型,并没有出现官方文件显示的,可以选择运行哪些模型。这一点存疑。另外如果可以选,优先选择使用率较高的模型,因为推理量更大,获得的分数越高。

增强的 GPU 检测和验证

Inference 早在 Epoch 2 的时候就宣布要强制移除算力在 RTX 3080 以下的显卡,估计是担心社区的不满,所以一直没执行,截至 Epoch 2 后期。仍然可以看到依有大量 3060、3070 等算力不足的显卡参与推理。笔者认为算力不足的设备会严重影响使用者的体验,剔除算力不足显卡能够给整个产品带来质的提升。

Inference 中文DC社区

权益加权作业路由

权益加权作业路由对矿工所获得的积分进行优先级计算,在计算其每单位工作量得分公式里增加 k 参数,

优先级分数 = 1 + k *( 矿工设备显存 / 全网显存 * 全网 INT 质押量 * 矿工声望权重)

k = 0 时:路由采用循环方式,为所有矿工提供等值积分。

在网络利用率较低时:会增加k值,将增加矿工的奖励。

在网络利用率高时:会减少k值,使得各种规模体量的矿工其所获奖励趋于均衡。

通过动态改变 k 参数实现网络不同工况下最合理激励以及最佳的资源利用率。即对于矿工来说,这意味着在需求低迷时期,仍然有不错的积分奖励。而在需求高峰期,即使权益极少的矿工也能做出贡献并获得回报。

双代币系统

Epoch3 上线双代币系统,INT 积分与 INT-DEV 代币。目前测试代币与积分没有价值,仅用于测试。

INT 积分主要用于计算矿工工作量,同时也是当前阶段评价网络参与度的重要指标。

INT-DEV 代币,是 Solana Devnet 测试网代币,不具有价值。主要用于空投和奖励分配测试,当前作用是测试质押系统。

质押系统

质押系统使用 INT-DEV 代币的 SPL 代币标准。该系统类似于一个加速器,允许任何矿工都可以创建 INT 质押池,设定佣金率,吸引其他 INT 持有者进行质押。

作为质押池创建者,质押的人和 INT 越多,其能够从网络中分配到更多的推理任务。池主在创建池子时会设置一个佣金比例。每次推理任务完成后会给质押池积分,池主在抽走用之后,剩下的积分会给池子中的质押用户

作为只有 INT 代币而没有矿机的用户,可以将手里的 INT 质押到分润高的矿池,以获取更高的收益。目标是机器算力高、质押人数少的池。

笔者的质押池,欢迎大家进行质押。目前质押没有收益,仅测试用。

这里就有了 Multicoin Capital 指导的影子了,也进一步证实其有参与投资。Inference 的质押机制是跟 io.net 类似的方式去扩大投资者群体。这算是进度慢项目的优势,同赛道的头部项目跑出来的模式可以加之改良并使用。但不意味着质押机制的引入能够为代币价格带来积极影响,我们看 IO 的表现就一目了然。

声誉系统(Epoch 3 后期推出)

声誉系统是根据矿工运行的情况去给予信誉值,对矿工的推理吞吐量以及运营的稳定性进行评估。笔者认为这一机制能推进该项目的去中心化,这一点比很多纯卖节点或者给钱就能参与推理的项目要强很多,确实是做实事的项目。

Epoch 2 回顾

Epoch2 开始于去年 11 月,Epoch2 的初期表现比较糟糕,首先刚开始的三个月内全网推理量较少,仅有平时的 10-20%。关于这一点,官方在二期开始前已经在 DC 回应道,「目前简单的答案是「积分将以一个合理的方式转换,考虑到它们在获得时相对于网络其他部分的价值」,这确保了早期的人得到适当的奖励,同时也考虑到我们需要继续激励运营商贡献他们的计算」。也就是会根据实际的网络运行情况,为参与者相对公平地分发激励。

笔者对第二期表现不佳做出合理推断:

当时官方承诺移除 RTX3090 以下的显卡,但实际上官方没这么做,使得很多任务分配给算力并不足的 RTX3060 等显卡,就会导致一些问题,比如在任务量有限的情况下,任务被 RTX3060 获得,但是 RTX3060 推理速慢,最终使得高算力卡如 RTX3090、RTX4090 接收不到任务,自然就没有推理量。导致分数的下降。

另外一方面 Inference 团队(原 Kuzco)在去年 12 月作为重要的合作方参与 Solana 的 AI 黑客松,刚好与网络出问题的时间重合。合理推测 Sam 以及 inference 团队的重心花在了黑客松,而没有维护好平台。

这种情况一直持续到 2 月中,网络才开始恢复正常。但恢复正常之后参与挖矿显卡数量远不及 Epoch1。并且单独每张卡获得的任务量也相比 Epoch1 少很多,原因是官方在 Epoch2 限制了多开。根据官网的规定显示,一个 GPU 只能运行一个 worker。实际上是可以单卡多开的。笔者此前已将多开脚本在 github 开源。

配置推荐

以下是经笔者实测,性价比较高的配置组合是 X99 + E5 + RTX3090。此前由于关税战 3090 显卡价格从均价 5700 元涨至 6700 元,现在情况有所好转,市场降温,显卡降低至关税前的价格水平,是一个入手的时机。此外,若读者想参与该项目投资组件矿机,首先会亏损 20-30% ,因为这是设备折旧的支出,电费另算。如果想选择云算力供应商或者中介服务商,应该确保对方具备能力去应对初创项目的不稳定性。

最后做个提醒,Inference 是一个早期的 AI 挖矿项目,并且目前因未知原因,没有公布其融资。网络的运行情况不够稳定,时常出现网络宕机的情况,在未提示的情况下频繁更新导致矿机掉线等等。另外一个风险是收益未知,目前只能获得积分,是否值得花费人力物力参与该项目,请各位自行考量。

主板:X99 双 U 多卡直插平台

CPU:E5 2680V

内存:32GB+(多卡同时启动会短时占据大量内存)

电源根据功耗来定,如 6 卡 3090 配置双电源(需配置电源并联启动线)

硬盘:500GB+(一个进程需要单独下载一个 AI 模型,对硬盘有一定要求)

网络:千兆以上(网络对工作影响非常大,需要是要较好配置)

6卡 3090 平台,单机满负载 3-4kw,实际功耗 1-2kw。(主要看网络运行情况,并不是 7*24 小时全功耗运行)

预算:主版¥700、CPU¥200、电源¥600、6*3090 ¥36,000、机箱等其他配置¥600。一套约为¥38,000。运行meta llama 8b 模型时的算力为约 600 Toks/s,单台理论日推理量 50M,实测在 10-20M 左右。该数据仅供参考。

本页面内容仅供参考,非招揽或要约,也不提供投资、税务或法律咨询。详见声明了解更多风险披露。
  • 赞赏
  • 评论
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)