Merge branch 'Refactor/vertical-graph-layout' into feature/edge-zscore-emphasis

d2r3v · web-flow · commit 2fbd79936525 · 2026-03-23T00:14:08.000-07:00
diff --git a/process_model/graphing.py b/process_model/graphing.py
@@ -599,21 +599,31 @@ def main():
         required_files = [in_overall_fp, in_avg_fp, in_zscores_fp, in_freq_fp, in_sess_fp]
         missing = [f for f in required_files if not os.path.exists(f)]
         if missing:
-            print(f"[SKIP] Missing required files:")
+            print(f"[SKIP] Missing required core files:")
             for f in missing:
                 print(f"       - {f}")
-            print(f"       Run zscore_calculation.py (and clustering.py for cluster graphs) first")
+              
+            print(f"       Run transition_edges.py first")
             continue
         
         print(f"[INFO] Loading data...")
-        overall_df  = pd.read_csv(in_overall_fp, low_memory=False)
-        avg_df      = pd.read_csv(in_avg_fp, low_memory=False)       # raw unfiltered
-        zscores_df  = pd.read_csv(in_zscores_fp, low_memory=False)
-        zfilt_df    = pd.read_csv(in_zfilt_fp, low_memory=False) if os.path.exists(in_zfilt_fp) else pd.DataFrame()
-
-        for df in [overall_df, avg_df, zscores_df]:
-            required_cols = {"team_number", "from", "to", "count"}
-            missing_cols = required_cols - set(df.columns)
+        overall_df = pd.read_csv(in_overall_fp, low_memory=False)
+        avg_df = pd.read_csv(in_avg_fp, low_memory=False)
+
+        dfs_to_normalize = [overall_df, avg_df]
+        
+        has_clusters = os.path.exists(in_cluster_fp) and os.path.exists(in_zfilt_fp)
+        if has_clusters:
+            zfilt_df = pd.read_csv(in_zfilt_fp, low_memory=False)
+            dfs_to_normalize.append(zfilt_df)
+        else:
+            zfilt_df = pd.DataFrame()
+
+        # normalize team_number to string
+        for df in dfs_to_normalize:
+            required = {"team_number", "from", "to", "count"}
+            missing_cols = required - set(df.columns)
+
             if missing_cols:
                 print(f"[ERROR] Missing columns: {missing_cols}")
                 break