p-doom · avocadoali · Oct 23, 2025 · Copilot · Oct 23, 2025 · Copilot
diff --git a/jasmine/train_dynamics.py b/jasmine/train_dynamics.py
@@ -1,6 +1,5 @@
 import os
 
-
 os.environ.setdefault("XLA_PYTHON_CLIENT_MEM_FRACTION", "0.98")
 
 from dataclasses import dataclass, field
@@ -686,7 +685,15 @@ def calculate_validation_metrics(val_dataloader, genie, rng):
             # --- Logging ---
             if args.log:
                 if step % args.log_interval == 0 and jax.process_index() == 0:
-                    log_dict = {"loss": loss, "step": step, **metrics}
+                    sequences_seen = step * args.batch_size
+                    frames_seen = step * args.seq_len * args.batch_size
-                    sequences_seen = step * args.batch_size
-                    frames_seen = step * args.seq_len * args.batch_size
+                    sequences_seen = step * args.batch_size * jax.process_count()
+                    frames_seen = step * args.seq_len * args.batch_size * jax.process_count()
-                    sequences_seen = step * args.batch_size
-                    frames_seen = step * args.seq_len * args.batch_size
+                    sequences_seen = step * args.batch_size * jax.process_count()
+                    frames_seen = step * args.seq_len * args.batch_size * jax.process_count()
+                    log_dict = {
+                        "loss": loss,
+                        "step": step,
+                        "sequences_seen": sequences_seen,
+                        "frames_seen": frames_seen,
+                        **metrics,
+                    }
                     if val_results:
                         log_dict.update(val_results["metrics"])
                     wandb.log(log_dict)

diff --git a/jasmine/train_lam.py b/jasmine/train_lam.py
@@ -506,7 +506,15 @@ def calculate_validation_metrics(val_dataloader, lam):
             # --- Logging ---
             if args.log:
                 if step % args.log_interval == 0 and jax.process_index() == 0:
-                    log_dict = {"loss": loss, "step": step, **metrics}
+                    sequences_seen = step * args.batch_size
+                    frames_seen = step * args.seq_len * args.batch_size
-                    sequences_seen = step * args.batch_size
-                    frames_seen = step * args.seq_len * args.batch_size
+                    sequences_seen = step * args.batch_size * jax.process_count()
+                    frames_seen = step * args.seq_len * args.batch_size * jax.process_count()
-                    sequences_seen = step * args.batch_size
-                    frames_seen = step * args.seq_len * args.batch_size
+                    sequences_seen = step * args.batch_size * jax.process_count()
+                    frames_seen = step * args.seq_len * args.batch_size * jax.process_count()
+                    log_dict = {
+                        "loss": loss,
+                        "step": step,
+                        "sequences_seen": sequences_seen,
+                        "frames_seen": frames_seen,
+                        **metrics,
+                    }
                     if val_results:
                         log_dict.update(val_results["metrics"])
                     wandb.log(log_dict)

diff --git a/jasmine/train_tokenizer.py b/jasmine/train_tokenizer.py
@@ -482,7 +482,15 @@ def calculate_validation_metrics(val_dataloader, tokenizer):
             # --- Logging ---
             if args.log:
                 if step % args.log_interval == 0 and jax.process_index() == 0:
-                    log_dict = {"loss": loss, "step": step, **metrics}
+                    sequences_seen = step * args.batch_size
+                    frames_seen = step * args.seq_len * args.batch_size
-                    sequences_seen = step * args.batch_size
-                    frames_seen = step * args.seq_len * args.batch_size
+                    sequences_seen = step * args.batch_size * jax.process_count()
+                    frames_seen = step * args.seq_len * args.batch_size * jax.process_count()
-                    sequences_seen = step * args.batch_size
-                    frames_seen = step * args.seq_len * args.batch_size
+                    sequences_seen = step * args.batch_size * jax.process_count()
+                    frames_seen = step * args.seq_len * args.batch_size * jax.process_count()
+                    log_dict = {
+                        "loss": loss,
+                        "step": step,
+                        "sequences_seen": sequences_seen,
+                        "frames_seen": frames_seen,
+                        **metrics,
+                    }
                     if val_results:
                         log_dict.update(val_results["metrics"])
                     wandb.log(log_dict)