Nœud. Tests

Tests que vous pouvez effectuer pour vérifier la bonne configuration.

Informations générales

C'est très frustrant quand on a l'impression d'avoir tout fait correctement et qu'on n'arrive quand même pas à entrer dans l'époque.

Il vaut mieux tout vérifier plusieurs fois.

Attention ! Il peut y avoir des erreurs dans le texte, car je ne maîtrise pas très bien la configuration des serveurs. Plus précisément, on peut dire "je ne maîtrise vraiment pas", mais ces tests m'ont aidé.

Vérifiez la bonne installation des clés

Il arrive que plusieurs personnes ayant configuré les nœuds ou que vous ayez confondu la commande d'attribution de la Consensus Public Key fassent que vous ayez des clés différentes sur le nœud et sur le réseau.

Dans ce cas vous n'entrerez certainement pas dans l'époque. Vérifiez !

Vérification de la Consensus Key

🔎 ÉTAPE 1. Connaître la Consensus Public Key sur le nœud

Attention ! La vérification se fait sur le serveur où se trouve le ML Node (ou le Network Node, je ne me suis pas encore complètement clarifié, car pour l'instant ces deux nœuds sont sur le même serveur chez moi).

docker exec node wget -qO- "http://127.0.0.1:26657/status" | jq -r '.result.validator_info.pub_key.value'

vous obtiendrez à peu près :

{
  "value": "AD+NQncKPBzqw0u8KcSmlIMqogg7i4nhDfLIgIkGYiY="
}

👉 Copiez le champ "value".+

🔎 ÉTAPE 2. Connaître la Consensus Public Key sur le réseau

Attention ! La vérification se fait sur le serveur où vous avez créé les clés. C’est-à-dire pas sur le Network Node et pas sur le ML Node.

Maintenant regardez ce que le réseau considère comme votre clé :

curl -s http://node2.gonka.ai:8000/chain-api/productscience/inference/inference/participant/gonka1yplcem8kfe6vm06t4sl8fskm0we2zslxxu90ta | jq

Attention ! Remplacez ce qui est en gras par l'adresse de votre clé Hot.

Vous obtiendrez :

"AD+NQncKPBzqw0u8KcSmlIMqogg7i4nhDfLIgIkGYiY="

En résultat vous recevrez une réponse comme celle-ci :

{ "participant": { "index": "gonka1yplcem8kfe6vm06t4sl8fskm0we2zslxxu90ta", "address": "gonka1yplcem8kfe6vm06t4sl8fskm0we2zslxxu90ta", "weight": -1, "join_time": "1771876365572", "join_height": "2792955", "last_inference_time": "0", "inference_url": "http://203.168.252.195:8000", "status": "ACTIVE", "coin_balance": "0", "validator_key": "7GEr4jV5GjCv+C+jKOq3Eh4bwxMVs7kafm7tcWP0EOo=", "consecutive_invalid_inferences": "0", "worker_public_key": "", "epochs_completed": 0, "current_epoch_stats": { "inference_count": "0", "missed_requests": "0", "earned_coins": "0", "rewarded_coins": "0", "burned_coins": "0", "validated_inferences": "0", "invalidated_inferences": "0", "invalidLLR": { "value": "0", "exponent": 0 }, "inactiveLLR": { "value": "0", "exponent": 0 }, "confirmationPoCRatio": null }

Nous nous intéressons à la valeur "validator_key".

🔎 ÉTAPE 3. Comparez-les. Elles doivent être identiques

Elles doivent correspondre. Mais ici elles ne correspondent pas. Il n'est pas surprenant que nous n'entrions pas dans l'époque ))

Les raisons de cette différence peuvent être diverses. Je pense que vous saurez vous-même comment corriger cela.

Comment corriger : Je pense que vous vous en sortirez. Ce n'est pas compliqué.

---------------------------------------------------------------------------

Connaître le modèle sur votre nœud

curl http://localhost:5000/v1/models

Attention ! Si rien n'apparaît, il se peut que votre ML Node écoute sur un autre port. Possibles variantes :

5000
8000
8080
9200

c’est-à-dire il suffit de remplacer ce chiffre dans la commande.

Réponse attendue :

root@mlnode-308:/app# curl http://localhost:5000/v1/models {"object":"list","data":[{"id":"Qwen/Qwen3-235B-A22B-Instruct-2507-FP8","object":"model","created":1772106402,"owned_by":"vllm","root":"/root/models/Qwen3-235B-A22B-Instruct-2507-FP8","parent":null,"max_model_len":240000,"permission":[{"id":"modelperm-f9056e19f4b1494c9854c8df9887394b","object":"model_permission","created":1772106402,"allow_create_engine":false,"allow_sampling":true,"allow_logprobs":true,"allow_search_indices":false,"allow_view":true,"allow_fine_tuning":false,"organization":"*","group":null,"is_blocking":false}]}]}root@mlnode-308:/app#

Attention ! Après avoir exécuté cette commande vous serez dans le conteneur Docker. Pour continuer à travailler avec la ligne de commande sur le serveur, il faut sortir du conteneur avec la commande : exit

Connaître la configuration du nœud

docker exec -it mlnode-308 cat /proc/238/cmdline | tr '\0' ' '

Réponse attendue :

/usr/bin/python3.12 -m vllm.entrypoints.openai.api_server --model Qwen/Qwen3-235B-A22B-Instruct-2507-FP8 --dtype float16 --port 5001 --host 0.0.0.0 --max-model-len 240000 --enable-auto-tool-choice --tool-call-parser hermes --tensor-parallel-size 4 --pipeline-parallel-size 2 --enable-expert-parallel --quantization fp8 --gpu-memory-utilization 0.846 --kv-cache-dtype fp8 --swap-space 4 --enforce-eager --cpu-offload-gb 4 --model /root/models/Qwen3-235B-A22B-Instruct-2507-FP8 --served-model-name Qwen/Qwen3-235B-A22B-Instruct-2507-FP8 root@ecs-99605001-024:~#

Attention ! Il faut remplacer mlnode-308 par le nom de votre nœud. Si vous l'avez oublié, vous pouvez le découvrir avec la commande :

docker compose ps

Réponse attendue- l'un de ceux-ci :

Vous pouvez afficher les noms de tous les conteneurs :

docker ps --format '{{.Names}}'

Réponse attendue

État du GPU

curl http://localhost:8080/api/v1/gpu/devices | jq

Réponse attendue :

Vérifiez la configuration déclarée

Vérifions la bonne configuration du nœud :

Montre avec quelles options votre ML Node fonctionne. S'exécute apparemment sur le serveur ML Node (si vos nœuds sont séparés).

Attention ! Ces paramètres sont fournis à titre d'exemple. Ils sont certainement obsolètes. Ce sera différent chez vous.

Vérification du nœud avec arrêt

Arrêtez le nœud

curl -sS -X POST "http://127.0.0.1:8080/api/v1/stop" -H "Content-Type: application/json"
sleep 3

Réponse attendue :

{"status":"OK"}

Vérifiez l'état (le statut) du nœud

curl -sS "http://127.0.0.1:8080/api/v1/state"

Réponse attendue :

{"state":"STOPPED"}root@submodel-sxA100-19-14:~/gonka/deploy/join#

Si vous voyez autre chose - répétez l'étape d'arrêt du nœud.

Lancez un test forcé du nœud

BLOCK_HEIGHT=$(curl -s "http://node1.gonka.ai:8000/chain-rpc/status" | jq -r '.result.sync_info.latest_block_height')
BLOCK_HASH=$(curl -s "http://node1.gonka.ai:8000/chain-rpc/status" | jq -r '.result.sync_info.latest_block_hash')

curl -sS -X POST "http://127.0.0.1:8080/api/v1/pow/init/generate" \
  -H "Content-Type: application/json" \
  -d "{
  \"node_id\": 0,
  \"node_count\": 1,
  \"block_hash\": \"D3470A4DDA3D4173BE7C7A55AF52323C19CAC8307DB492CFD004D0C83561068B\",
  \"block_height\": 2753612,
  \"public_key\": \"7GEr4jV5GjCv+C+jK0q3Eh4bwxMVs7kafm7tcWP0E0O=\",
  \"batch_size\": 1,
  \"r_target\": 10.0,
  \"fraud_threshold\": 0.01,
  \"params\": {
    \"dim\": 1792,
    \"n_layers\": 64,
    \"n_heads\": 64,
    \"n_kv_heads\": 64,
    \"vocab_size\": 8196,
    \"ffn_dim_multiplier\": 10.0,
    \"multiple_of\": 8192,
    \"norm_eps\": 1e-5,
    \"rope_theta\": 10000.0,
    \"use_scaled_rope\": false,
    \"seq_len\": 256
  },
  \"url\": \"http://api:9100/v1/poc-batches\"
}"
echo

Réponse attendue

Suivez la progression du test dans les logs

docker logs mlnode-308 --tail 50 -f

Après quelques minutes (généralement 5–15) le résultat final devrait apparaître. Après la fin du PoC :

Réponse attendue :

Il est important que CUDA se charge à 100 %

Pour quitter le test appuyez sur la combinaison CTRL+C

Activation du nœud

curl -sS -X POST "http://127.0.0.1:9200/admin/v1/nodes/node1/enable" -H "Content-Type: application/json"

Réponse attendue

{"message":"node enabled successfully","node_id":"node1"} root@submodel-sxA100-19-14:~/gonka/deploy/join#

Vérifiez l'état de votre nœud :

curl http://localhost:8080/api/v1/state

Réponse attendue :

root@ecs-99605001-024:# curl http://localhost:8080/api/v1/state {"state":"INFERENCE"}root@ecs-99605001-024:#

Connaître le statut PoV de votre nœud :

curl http://localhost:8080/api/v1/pow/status

Réponse inattendue :

"detail":"Cannot run POW because MLNode is currently in ServiceState.INFERENCE mode. Please stop ServiceState.INFERENCE first."}root@ecs-99605001-024:~#

Quel est le "réponse attendue" je ne sais pas encore ))

Vérification des conteneurs

Après le démarrage, il faut d'abord s'assurer que les paramètres que vous avez choisis pour votre node-config.json ont bien été appliqués dans le mlnode

Lançons les logs du conteneur mlnode

docker logs -f --tail=200 mlnode-308

Si l'on voit que le modèle s'est chargé comme sur la capture, en général on peut sortir du conteneur avec la combinaison CTRL+C

Lançons les logs du conteneur node

docker logs -f --tail=200 node

S'exécute sur le Network Node.

Si le nœud n'était pas synchronisé, on devrait voir le téléchargement des "chunks" de la blockchain

625 - nombre total, 160 - dernier chargé

quitter le conteneur avec la combinaison CTRL+C

Vérifiez la synchronisation du nœud avec le réseau

curl -s "http://127.0.0.1:9200/admin/v1/setup/report" | jq '.checks[] | select(.id == "block_sync")'

Réponse attendue

C’est-à-dire ici le chiffre doit être petit. C’est le temps en secondes depuis la création du dernier bloc.

Vérifiez le bloc actuel du réseau

curl -sS http://node1.gonka.ai:8000/chain-rpc/status | jq -r '.result.sync_info.latest_block_height'

Vérifier le bloc sur lequel se trouve notre nœud

Je ne sais pas encore comment )

Et comparez. Ils doivent être proches.

Checklist pour entrer dans l'époque

Aide à comprendre dans quelle direction chercher le problème.

curl -s http://localhost:9200/admin/v1/setup/report | jq '.checks[] | {id,status,message}'

Réponse attendue :

Le champ de vérification marqué par la flèche rouge est celui qui FAIL absolument chez tout le monde. Ce paramètre PASS seulement pour les master-nodes de Gonka (je pense).

Le champ indiqué par la flèche bleue est celui qui peut être FAIL - si vous n'êtes encore jamais entré dans aucune époque.

Liens

Article sur Telegram : Gonka - Lancement. Ou des mineurs en quête de rentabilité. PART_1
Article sur Telegram : Gonka - Lancement. Ou des mineurs en quête de rentabilité. PART_2
Gonka Documentation FAQ https://gonka.ai/FAQ/#how-do-i-fix-errno-validator-signing-info-found-when-starting-from-a-state-sync-snapshot

FIN

PrécédentConteneur Docker SuivantCommandes utiles

Mis à jour il y a 4 jours

hashtagInformations générales

hashtagVérifiez la bonne installation des clés

hashtagVérification de la Consensus Key

hashtag🔎 ÉTAPE 1. Connaître la Consensus Public Key sur le nœud

hashtag🔎 ÉTAPE 2. Connaître la Consensus Public Key sur le réseau

hashtag🔎 ÉTAPE 3. Comparez-les. Elles doivent être identiques

hashtagConnaître le modèle sur votre nœud

hashtagConnaître la configuration du nœud

hashtagÉtat du GPU

hashtagVérifiez la configuration déclarée

hashtagVérification du nœud avec arrêt

hashtagArrêtez le nœud

hashtagVérifiez l'état (le statut) du nœud

hashtagLancez un test forcé du nœud

hashtagSuivez la progression du test dans les logs

hashtagActivation du nœud

hashtagVérifiez l'état de votre nœud :

hashtagVérification des conteneurs

hashtagLançons les logs du conteneur mlnode

hashtagLançons les logs du conteneur node

hashtagVérifiez la synchronisation du nœud avec le réseau

hashtagVérifiez le bloc actuel du réseau

hashtagVérifier le bloc sur lequel se trouve notre nœud

hashtagChecklist pour entrer dans l'époque

hashtagLiens

Informations générales

Vérifiez la bonne installation des clés

Vérification de la Consensus Key

🔎 ÉTAPE 1. Connaître la Consensus Public Key sur le nœud

🔎 ÉTAPE 2. Connaître la Consensus Public Key sur le réseau

🔎 ÉTAPE 3. Comparez-les. Elles doivent être identiques

Connaître le modèle sur votre nœud

Connaître la configuration du nœud

État du GPU

Vérifiez la configuration déclarée

Vérification du nœud avec arrêt

Arrêtez le nœud

Vérifiez l'état (le statut) du nœud

Lancez un test forcé du nœud

Suivez la progression du test dans les logs

Activation du nœud

Vérifiez l'état de votre nœud :

Vérification des conteneurs

Lançons les logs du conteneur mlnode

Lançons les logs du conteneur node

Vérifiez la synchronisation du nœud avec le réseau

Vérifiez le bloc actuel du réseau

Vérifier le bloc sur lequel se trouve notre nœud

Checklist pour entrer dans l'époque

Liens