a16z « Disciples » Guide pratique Inference 3 : Lancement du test d'incitation Epoch3, Multicoin Capital entre en force

Rédigé par : J1N, Techub News

Epoch3 a été officiellement lancé le 7 juin 2025, introduisant des changements de protocole majeurs, y compris des améliorations techniques, un nouveau mécanisme de staking et des transformations opérationnelles.

Kuzco a effectué une mise à niveau de la marque et a été renommé Inference.

L'investissement de ce projet par Multicoin Capital est vrai.

Le seuil d'entrée des appareils augmente

Lancer un mécanisme de minage par staking similaire à io.net.

Revue d'Epoch2

Recommandation de configuration de participation

Il est conseillé de revoir les articles précédents avant de lire.

"Le guide pratique de Kuzco "Disciple" de a16z : comment miner efficacement avec la puissance de l'IA ?"

« Guide pratique a16z "Disciple" Kuzco II : de l'opération individuelle au déploiement en essaim »

Multicoin Capital entre réellement dans le jeu

En décembre dernier, Sam, le fondateur d'Inference, a affirmé sur le canal des mineurs d'or du DC officiel que le projet avait obtenu un financement de 11,5 millions de dollars de Multicoin Capital et a16z csx. Cette nouvelle a récemment été confirmée, et le projet figure sur la liste de portefeuille de Multicoin Capital. Il est vrai qu'Inference a reçu un investissement de Multicoin Capital. (Multicoin Capital est également un investisseur précoce d'io.net)

Époque 3 initiale

Depuis le lancement d'Epoch3 le 7 juin 2025, le réseau a fonctionné pendant 10 jours. Par rapport aux deux premières périodes, le nombre de mineurs participants a clairement augmenté, avec une hausse significative du volume de raisonnement et de la stabilité du réseau. À la date de rédaction, le nombre de workers a atteint 12 100 unités. Bien que ce chiffre ne dépasse pas encore le maximum d'Epoch1 de 14 000 unités, Epoch3 a limité les cartes graphiques à faible puissance de calcul et les instances multiples, ce qui permet de déduire raisonnablement que le nombre de participants est plusieurs fois supérieur à celui des débuts.

Quelles sont les changements apportés par l'Époque 3 ?

Mise à jour automatique des nœuds

La fonctionnalité de mise à jour automatique des nœuds peut en fait alléger considérablement la charge opérationnelle des mineurs. Lors de l'expérience d'utilisation de l'Epoch 1&2, l'équipe officielle met souvent à jour les fichiers de manière sporadique, et les notifications de mise à jour ne sont pas à jour. Cela a conduit de nombreux utilisateurs à voir leurs processus se terminer, pensant qu'il s'agissait d'un problème d'équipement, et à perdre beaucoup de temps à essayer de résoudre le problème, alors que la vraie raison est que les utilisateurs n'ont pas effectué les mises à jour à temps.

Gestion du moteur de raisonnement unifié

L’auteur a exécuté le modèle Llama-3.1-8B de Meta dans les deux phases, et il n’y avait aucun document officiel, vous pouvez donc choisir les modèles à exécuter. C’est discutable. De plus, si vous pouvez choisir, privilégiez le modèle avec un taux d’utilisation plus élevé, car plus la quantité de raisonnement est importante, plus le score obtenu est élevé.

Détection et validation GPU améliorées

Inference a annoncé dès l'Époque 2 qu'il allait forcer la suppression des cartes graphiques avec une puissance de calcul inférieure à celle de la RTX 3080. On estime qu'il craignait le mécontentement de la communauté, c'est pourquoi il n'a pas été exécuté jusqu'à la fin de l'Époque 2. On peut encore voir un grand nombre de cartes graphiques insuffisantes comme les 3060, 3070, etc. participer à l'inférence. L'auteur pense que les appareils avec une puissance de calcul insuffisante affecteront gravement l'expérience des utilisateurs, et éliminer les cartes graphiques insuffisantes pourrait apporter une amélioration qualitative à l'ensemble du produit.

Inference communauté DC en chinois

Routage de tâche pondéré par les droits

Le routage des opérations pondérées par les droits calcule la priorité des points obtenus par les mineurs, en ajoutant le paramètre k à la formule de score par unité de travail.

Score de priorité = 1 + k * (Mémoire vidéo de l'équipement minier / Mémoire vidéo totale du réseau * Montant total d'INT staké dans le réseau * Poids de la réputation des mineurs)

Lorsque k = 0 : le routage est effectué de manière circulaire, offrant des points équivalents à tous les mineurs.

Lorsque l'utilisation du réseau est faible : cela augmentera la valeur de k, ce qui augmentera les récompenses des mineurs.

Lorsque l'utilisation du réseau est élevée : la valeur de k sera réduite, ce qui rendra les récompenses des mineurs de différentes tailles plus équilibrées.

En ajustant dynamiquement le paramètre k, on réalise la meilleure incitation et le meilleur taux d'utilisation des ressources dans différentes conditions de fonctionnement du réseau. Cela signifie pour les mineurs qu'il y a toujours de bonnes récompenses de points même en période de faible demande. Et en période de forte demande, même les mineurs ayant peu de droits peuvent contribuer et obtenir des retours.

système à double jeton

Epoch3 a lancé un système à double jeton, les points INT et le jeton INT-DEV. Actuellement, les jetons de test et les points n'ont pas de valeur, ils sont uniquement utilisés pour les tests.

Les points INT sont principalement utilisés pour calculer le travail des mineurs, et ils constituent également un indicateur important de l'engagement dans le réseau à ce stade.

Le jeton INT-DEV est un jeton du réseau de test Solana Devnet, n'ayant aucune valeur. Il est principalement utilisé pour les tests de distribution de largage et de récompenses, et sert actuellement à tester le système de staking.

Système de staking

Le système de staking utilise le standard de jetons SPL des jetons INT-DEV. Ce système ressemble à un accélérateur, permettant à tout mineur de créer un pool de staking INT, de définir un taux de commission et d'attirer d'autres détenteurs d'INT à participer au staking.

En tant que créateur de pool de staking, plus il y a de personnes qui stakent et plus il y a d'INT, plus il pourra recevoir de tâches de raisonnement du réseau. Le propriétaire du pool fixe un taux de commission lors de la création du pool. Après chaque tâche de raisonnement complétée, des points sont attribués au pool de staking, et après que le propriétaire du pool a retiré les siens, les points restants sont attribués aux utilisateurs stakant dans le pool.

En tant qu'utilisateur disposant uniquement de jetons INT sans machines de minage, vous pouvez miser vos INT dans des pools de profit élevés pour obtenir des rendements plus élevés. L'objectif est de trouver des pools avec une puissance de calcul élevée et peu de stakers.

Le pool de staking de l'auteur, tout le monde est le bienvenu pour participer au staking. Actuellement, il n'y a pas de rendement sur le staking, c'est uniquement à des fins de test.

On y voit l'ombre de Multicoin Capital, ce qui confirme également sa participation à l'investissement. Le mécanisme de staking d'Inference est similaire à celui d'io.net pour élargir la base d'investisseurs. Cela peut être considéré comme un avantage pour un projet à progression lente, car le modèle qui émerge des projets leaders dans le même secteur peut être amélioré et utilisé. Cependant, cela ne signifie pas que l'introduction du mécanisme de staking aura un impact positif sur le prix des jetons, comme le montre clairement la performance d'IO.

Système de réputation (lancé à la fin de l'Époque 3)

Le système de réputation attribue des valeurs de crédit en fonction du fonctionnement des mineurs, évaluant leur capacité de traitement des inférences et la stabilité de leurs opérations. Je pense que ce mécanisme peut promouvoir la décentralisation de ce projet, ce qui est beaucoup plus fort que de nombreux projets qui se contentent de vendre des nœuds ou de permettre la participation aux inférences simplement en payant. C'est effectivement un projet qui fait les choses sérieusement.

Revue de l'Époque 2

Epoch2 a commencé en novembre de l'année dernière. Les performances initiales d'Epoch2 étaient plutôt médiocres, car durant les trois premiers mois, le volume d'inférence sur l'ensemble du réseau était faible, atteignant seulement 10 à 20 % des niveaux habituels. À ce sujet, l'équipe officielle a déjà répondu sur DC avant le début de la deuxième phase : « La réponse simple pour l'instant est que les points seront convertis de manière raisonnable, en tenant compte de leur valeur par rapport aux autres parties du réseau au moment de leur obtention. Cela garantit que les premiers participants reçoivent des récompenses appropriées, tout en considérant que nous devons continuer à inciter les opérateurs à contribuer à leur calcul. » Cela signifie que les incitations seront distribuées de manière relativement équitable aux participants, en fonction de la situation réelle du fonctionnement du réseau.

L'auteur fait une hypothèse raisonnable sur la mauvaise performance de la deuxième période :

À l'époque, l'officiel avait promis de retirer les cartes graphiques inférieures à la RTX3090, mais en réalité, l'officiel n'a pas fait cela, ce qui a conduit à ce que de nombreuses tâches soient attribuées à des cartes graphiques insuffisantes en puissance comme la RTX3060, ce qui entraîne certains problèmes. Par exemple, lorsque la charge de travail est limitée, la tâche est attribuée à la RTX3060, mais la RTX3060 est lente en inférence, ce qui fait que des cartes à haute puissance comme la RTX3090 et la RTX4090 ne reçoivent pas de tâches, ce qui entraîne naturellement une absence de volume d'inférence. Cela a entraîné une baisse des scores.

D'autre part, l'équipe Inference (anciennement Kuzco) a participé en décembre dernier en tant que partenaire important au hackathon AI de Solana, coïncidant avec le moment où le réseau a rencontré des problèmes. On peut raisonnablement supposer que Sam et l'équipe inference ont concentré leurs efforts sur le hackathon, au lieu de maintenir correctement la plateforme.

Cette situation a duré jusqu'à la mi-février, lorsque le réseau a commencé à revenir à la normale. Cependant, après le rétablissement, le nombre de cartes graphiques participant au minage était loin d'atteindre celui de l'Epoch1. De plus, la quantité de tâches attribuées à chaque carte était également beaucoup moins importante par rapport à l'Epoch1, car l'officiel a restreint le multi-compte dans l'Epoch2. Selon les règlements affichés sur le site officiel, un GPU ne peut exécuter qu'un seul worker. En réalité, il est possible d'exécuter plusieurs workers avec une seule carte. L'auteur a précédemment publié le script de multi-compte sur GitHub.

Recommandation de configuration

Voici, d'après mes tests, la combinaison de configuration avec un bon rapport qualité-prix est X99 + E5 + RTX3090. Auparavant, en raison de la guerre tarifaire, le prix de la carte graphique 3090 est passé d'un prix moyen de 5700 yuans à 6700 yuans. La situation s'est maintenant améliorée, le marché a refroidi, et les prix des cartes graphiques ont baissé à des niveaux d'avant les droits de douane, ce qui constitue une bonne occasion d'achat. De plus, si les lecteurs souhaitent participer à l'investissement dans des composants de machines minières, ils subiront d'abord une perte de 20 à 30 %, car il s'agit des dépenses d'amortissement de l'équipement, sans compter les frais d'électricité. S'ils souhaitent choisir un fournisseur de puissance de calcul dans le cloud ou un prestataire de services intermédiaire, ils doivent s'assurer que l'autre partie a la capacité de faire face à l'instabilité des projets naissants.

Enfin, un rappel : Inference est un projet de minage AI précoce et, pour des raisons inconnues, n'a pas publié son financement pour le moment. La stabilité du réseau n'est pas suffisante, avec des pannes fréquentes, et des mises à jour fréquentes sans avertissement entraînent la déconnexion des mineurs, etc. Un autre risque est que les gains sont inconnus ; pour l'instant, on ne peut obtenir que des points. Il convient donc à chacun d'évaluer pour lui-même s'il est judicieux d'investir des efforts et des ressources dans ce projet.

Carte mère : plateforme X99 à double U pour plusieurs cartes en insertion directe

CPU : E5 2680V

Mémoire : 32 Go + (le démarrage simultané de plusieurs cartes occupera temporairement une grande quantité de mémoire)

L'alimentation dépend de la consommation d'énergie, par exemple, une configuration à double alimentation pour 6 cartes 3090 (nécessite un câble de démarrage en parallèle pour l'alimentation).

Disque dur : 500 Go + (un processus nécessite de télécharger un modèle AI séparément, ce qui impose certaines exigences au disque dur)

Réseau : plus de gigaoctets (le réseau a un impact très important sur le travail, doit être de bonne configuration)

6 cartes 3090, charge maximale de 3-4kw par machine, consommation réelle de 1-2kw. (Cela dépend principalement de l'état du réseau, et non d'une consommation à pleine capacité 7*24 heures.)

Budget : Carte mère ¥700, CPU ¥200, Alimentation ¥600, 6*3090 ¥36,000, Boîtier et autres configurations ¥600. Une configuration coûte environ ¥38,000. La puissance de calcul lors de l'exécution du modèle meta llama 8b est d'environ 600 Toks/s, avec une capacité théorique d'inférence quotidienne de 50M par machine, mesurée entre 10 et 20M. Ces données sont uniquement à titre de référence.

Voir l'original
Le contenu est fourni à titre de référence uniquement, il ne s'agit pas d'une sollicitation ou d'une offre. Aucun conseil en investissement, fiscalité ou juridique n'est fourni. Consultez l'Avertissement pour plus de détails sur les risques.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)