a16z "Discípulo" Guia Prático de Inference Três: Início do Teste de Incentivos Epoch3, Multicoin Capital Investindo Pesadamente

2025-06-17 04:52:29

Escrito por: J1N, Techub News

A Epoch3 foi oficialmente lançada a 7 de junho de 2025, introduzindo mudanças significativas no protocolo, incluindo melhorias tecnológicas, um novo mecanismo de staking e mudanças operacionais.

Kuzco passou por uma atualização de marca e agora chama-se Inference.

A informação de que o projeto recebeu investimento da Multicoin Capital é verdadeira.

Aumentou o limiar dos dispositivos

Lançar um mecanismo de mineração de staking semelhante ao io.net

Revisão da Epoch2

Recomendações de configuração para participação

Antes de ler, recomenda-se rever os artigos anteriores:

a16z "Discípulo" Kuzco Guia Hands-on: Como Minerar Hashrate AI de forma eficiente? 》

"a16z 'Discípulo' Guia Prático Kuzco II: De Combate Individual a Desdobramento em Grupo"

Multicoin Capital entra em cena

Em dezembro do ano passado, Sam, o fundador da Inference, afirmou no canal do Golden Miner da DC oficial que o projeto recebeu um financiamento de 11,5 milhões de dólares da Multicoin Capital e a16z csx. Esta informação foi recentemente confirmada, podendo-se ver o projeto listado na lista de Portfólio da Multicoin Capital. É verdade que a Inference recebeu investimento da Multicoin Capital. (A Multicoin Capital também foi um dos primeiros investidores da io.net)

Epoch 3 Inicial

Desde o lançamento do Epoch3 em 7 de junho de 2025, a rede está funcionando há 10 dias e, em comparação com as duas fases anteriores, o número de mineradores participantes aumentou significativamente e a quantidade de inferência e estabilidade da rede aumentou significativamente. No momento em que este artigo foi escrito, o número de trabalhadores chegou a 12.100, o que não supera o pico de 14.000 unidades da Epoch1. No entanto, Epoch3 restringe placas gráficas de baixo hashrate e múltiplas aberturas, e é razoável inferir que o número de participantes é várias vezes maior do que nos primeiros dias.

Quais mudanças a Época 3 traz?

Atualização automática de nós

A funcionalidade de atualização automática de nós pode, na verdade, aliviar significativamente a carga de operação e manutenção dos mineradores. Após a experiência de uso do Epoch 1&2, a equipe oficial frequentemente atualiza os arquivos de forma não programada, e as notificações de atualização não são oportunas. Isso leva muitos usuários a terminarem seus processos achando que há um problema com o dispositivo, gastando muito tempo tentando resolver, quando na verdade a razão é que os usuários não atualizaram a tempo.

Motor de Inferência Unificado

O autor executou duas vezes o modelo Llama-3.1-8B da Meta e não encontrou os modelos que o documento oficial indica que podem ser selecionados. Isso é questionável. Além disso, se for possível escolher, é preferível optar pelos modelos com maior taxa de utilização, pois a quantidade de inferências é maior, resultando em pontuações mais altas.

Detecção e validação de GPU aprimoradas

A Inference anunciou já na Epoch 2 que iria remover à força placas gráficas com poder de computação abaixo da RTX 3080, presumivelmente porque estava preocupada com a insatisfação da comunidade, por isso não foi implementada até o final da Epoch 2. Ainda pode ser visto que há um grande número de placas gráficas com poder de computação insuficiente, como 3060 e 3070 para participar da inferência. O autor acredita que dispositivos com poder de computação insuficiente afetarão seriamente a experiência do usuário, e eliminar placas gráficas com poder de computação insuficiente pode trazer melhorias qualitativas para todo o produto.

Inference comunidade DC em chinês

Roteamento de trabalho ponderado por direitos

A rota de trabalho ponderada por direitos calcula a prioridade dos pontos obtidos pelos mineiros, adicionando o parâmetro k na fórmula de pontuação por unidade de trabalho.

Pontuação de prioridade = 1 + k *（ Memória de vídeo do equipamento do minerador / Memória de vídeo total da rede * Total de INT em staking na rede * Peso de reputação do minerador）

Quando k = 0: O roteador adota um método de ciclo, fornecendo pontos equivalentes a todos os mineradores.

Quando a utilização da rede estiver baixa: o valor k será aumentado, o que aumentará as recompensas dos mineradores.

Quando a utilização da rede é alta: o valor de k diminui, fazendo com que as recompensas recebidas por mineradores de diferentes escalas tendam a se igualar.

Através da alteração dinâmica do parâmetro k, é possível alcançar o incentivo mais razoável e a melhor taxa de utilização de recursos sob diferentes condições de operação da rede. Ou seja, para os mineradores, isso significa que durante períodos de baixa demanda, ainda há boas recompensas em pontos. E durante períodos de alta demanda, mesmo os mineradores com pouco poder de participação podem contribuir e ser recompensados.

sistema de dupla moeda

Epoch3 lançou um sistema de dupla moeda, com pontos INT e tokens INT-DEV. Neste momento, os tokens de teste e os pontos não têm valor, servindo apenas para testes.

Os pontos INT são usados principalmente para calcular a quantidade de trabalho dos mineradores, e também são um indicador importante da participação na rede nesta fase atual.

O token INT-DEV é um token da rede de testes Solana Devnet, não possui valor. É utilizado principalmente para testes de airdrops e distribuição de recompensas, e atualmente serve para testar o sistema de staking.

Sistema de Staking

O sistema de staking utiliza o padrão de token SPL do token INT-DEV. Este sistema é semelhante a um acelerador, permitindo que qualquer minerador crie um pool de staking INT, defina a taxa de comissão e atraia outros detentores de INT para participar do staking.

Como criador do pool de staking, quanto mais pessoas e INT estiverem em staking, mais tarefas de inferência poderão ser alocadas na rede. O criador do pool define uma taxa de comissão ao criar o pool. Após a conclusão de cada tarefa de inferência, serão atribuídos pontos ao pool de staking, e após o criador retirar os seus, os pontos restantes serão distribuídos entre os usuários em staking no pool.

Como um usuário com apenas tokens INT e sem mineradoras, você pode apostar os INT que possui em pools com alta distribuição de lucros para obter um retorno maior. O objetivo é encontrar pools com alta capacidade de processamento e poucos apostadores.

O pool de staking do autor, todos são bem-vindos a participar no staking. Neste momento, não há rendimentos com o staking, é apenas para testes.

Aqui está a sombra da Multicoin Capital, que também confirma sua participação no investimento. O mecanismo de staking da Inference é semelhante ao da io.net, visando ampliar a base de investidores. Isso pode ser considerado uma vantagem para projetos de progresso lento, pois o modelo dos projetos líderes na mesma pista pode ser melhorado e utilizado. Mas isso não significa que a introdução do mecanismo de staking possa ter um impacto positivo no preço do token; a performance da IO é clara.

Sistema de Reputação (lançamento posterior ao Época 3)

O sistema de reputação atribui valores de crédito com base no desempenho dos mineradores, avaliando a capacidade de raciocínio e a estabilidade das operações dos mineradores. Na minha opinião, este mecanismo pode promover a descentralização do projeto, o que é muito mais forte do que muitos projetos que simplesmente vendem nós ou permitem a participação no raciocínio apenas por dinheiro; é realmente um projeto que faz coisas.

Revisão da Época 2

Epoch2 começou em novembro do ano passado, e o desempenho inicial do Epoch2 foi bastante ruim, pois nos primeiros três meses a quantidade de inferência na rede foi baixa, apenas 10-20% do habitual. A esse respeito, a equipe oficial já havia respondido no DC antes do início da fase dois, afirmando que "a resposta simples é que os pontos serão convertidos de uma maneira razoável, considerando seu valor em relação a outras partes da rede no momento em que foram adquiridos", o que garante que os primeiros participantes recebam recompensas adequadas, ao mesmo tempo em que considera que precisamos continuar a incentivar os operadores a contribuir com seu poder computacional. Isso significa que os incentivos serão distribuídos de maneira relativamente justa aos participantes, com base na situação real de operação da rede.

O autor faz uma inferência razoável sobre o desempenho insatisfatório da segunda fase:

Naquela época, o oficial prometeu remover a placa gráfica abaixo de RTX3090, mas na verdade, o oficial não o fez, de modo que muitas tarefas foram atribuídas a placas gráficas, como RTX3060 com poder de computação insuficiente, o que levaria a alguns problemas, como no caso de uma quantidade limitada de tarefas, a tarefa foi obtida pelo RTX3060, mas a velocidade de inferência RTX3060 era lenta, e finalmente a placa de alto poder de computação, como RTX3090 e RTX4090 não podia receber a tarefa, e naturalmente não havia quantidade de raciocínio. Leva a uma queda nas pontuações.

Por outro lado, a equipa Inference (anteriormente Kuzco) participou em dezembro do ano passado como parceiro importante no hackathon de IA da Solana, que coincidiu com o momento em que a rede teve problemas. É razoável supor que Sam e a equipa Inference se concentraram no hackathon, em vez de manter a plataforma adequadamente.

Essa situação continuou até meados de fevereiro, quando a rede começou a voltar ao normal. Mas, após a normalização, o número de placas gráficas participando da mineração estava muito abaixo do Epoch1. Além disso, a quantidade de tarefas recebidas por cada placa individualmente também era muito menor em comparação ao Epoch1, pois a oficial limitou a múltiplas instâncias no Epoch2. De acordo com as regras exibidas no site oficial, uma GPU só pode operar um worker. Na prática, é possível executar várias instâncias em uma única placa. O autor já disponibilizou scripts para múltiplas instâncias no GitHub.

Recomendação de configuração

A seguir está a medição real do autor, a combinação de configuração econômica é X99 + E5 + RTX3090. Anteriormente, devido à guerra tarifária, o preço das placas gráficas 3090 subiu de um preço médio de 5700 yuan para 6700 yuan, mas agora a situação melhorou, o mercado arrefeceu e a placa gráfica foi reduzida para o nível de preço antes da tarifa, que é um momento para começar. Além disso, se o leitor quiser participar do projeto para investir em máquinas de mineração de módulos, ele primeiro perderá 20-30%, porque esta é a despesa de depreciação do equipamento, e a conta de luz é calculada separadamente. Se quiser escolher um fornecedor de poder de computação em nuvem ou um prestador de serviços intermediário, deve certificar-se de que a outra parte tem capacidade para lidar com a instabilidade do projeto de arranque.

Por fim, uma lembrança, Inference é um projeto de mineração de IA em estágio inicial e, atualmente, por razões desconhecidas, não divulgou seu financiamento. A operação da rede não é suficientemente estável, frequentemente ocorrendo quedas, e atualizações frequentes sem aviso prévio levam a desconexões dos mineradores, entre outros. Outro risco é a renda desconhecida, atualmente só é possível obter pontos, se vale a pena investir recursos e esforço para participar deste projeto, peço a todos que avaliem por si mesmos.

Placa-mãe: X99 Plataforma de inserção direta de múltiplas placas U duplas

CPU: E5 2680V

Memória: 32GB+ (o arranque simultâneo de várias placas pode ocupar uma grande quantidade de memória durante um curto período)

A fonte de alimentação deve ser determinada com base no consumo, como a configuração de 6 placas 3090 com fonte dupla (é necessário configurar um cabo de ligação em paralelo para a fonte).

Disco rígido: 500GB+ (um processo precisa baixar um modelo de IA separadamente, o que exige um certo espaço no disco rígido)

Rede: acima de um gigabit (a rede tem um grande impacto no trabalho, precisa de uma boa configuração)

6 cartões 3090, carga total da máquina 3-4kw, consumo real 1-2kw. (Principalmente depende da situação da rede, não é funcionamento em plena carga 24*7 horas)

Orçamento: Placa-mãe ￥700, CPU ￥200, Fonte ￥600, 6*3090 ￥36,000, Gabinete e outras configurações ￥600. Um conjunto custa cerca de ￥38,000. A capacidade computacional ao executar o modelo meta llama 8b é de aproximadamente 600 Toks/s, com uma taxa teórica de inferência diária de 50M por unidade, sendo que os testes reais mostram valores entre 10-20M. Esses dados são apenas para referência.

A3.33%

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

Recompensa
curtir
Comentário
Repostar
Compartilhar

Comentário

0/400

Sem comentários

Tema
#Gate & WLFI USD1 Points Program
51k Popularidade
#Trump Allows 401(k) Crypto Investing
26k Popularidade
#Join Copy Trading Share to Win $2,000
20k Popularidade
#Show My Alpha Points
75k Popularidade
#SOL Futures Reach New High
22k Popularidade

Marcar

sitemap