2026년 5월 2일7 min readJeTech Lab

Agent Model Version Changelog: PPO iTransformer v1

JeTech 운용 후보 모델의 첫 iTransformer v1 preset과 gate 기준을 기록합니다.

Agent Model

iTransformer

PPO

Registry Gate

요약

ppo_itransformer_v1은 JeTech agent registry 후보 모델을 만들기 위한 첫 iTransformer runtime preset입니다. run name은 모델을 식별하기 위한 최소 정보만 담고, 실제 학습 파라미터와 gate 결과는 run 폴더의 config.json, W&B config, 그리고 업로드된 model sidecar metadata에 남깁니다.

Run identity

항목	값
Canonical run name	`ppo_itransformer_v1_{symbol}_{YYYYMMDD_HHMMSS}`
Algorithm	PPO, Stable-Baselines3
Backbone	iTransformer feature extractor
Version	`v1`
Current batch symbols	`BTC`, `ETH`, `SOL`, `XRP`, `DOGE`
Registry artifact scope	gate 통과 모델만 S3 registry 후보로 업로드

Runtime preset

파라미터	값
`window_size`	`128`
`encoder_hidden_size`	`64`
`encoder_layers`	`2`
`encoder_dropout`	`0.1`
`transformer_num_heads`	`4`
`transformer_ffn_dim`	`128`
`features_dim`

Training defaults

항목	값
Synthetic reference period	`5y`
Reference interval	`1d`
Episode length	`1000`
GAN innovation blend	`0.75`
Target rollout batch	`1024`
Eval frequency	rollout batch와 동일
Total timesteps	`102400`
Current batch script	`trading/agents/scripts/train_crypto_batch.sh`
Batch repeat count	심볼별 `30`회

n_envs와 n_steps는 실행 환경 CPU 수에 따라 자동 결정됩니다. 현재 배치 로그 기준으로는 n_envs=4, n_steps=256, rollout_batch=1024가 사용됩니다.

Risk and action controls

파라미터	값
`target_exposure_deadband`	`0.05`
`rebalance_deadband`	`0.05`
`cooldown_bars`	`2`
`drawdown_stop`	`0.40`
`reward_turnover_penalty`	`0.0005`
`reward_downside_penalty`	`0.05`
`reward_running_drawdown_penalty`

Real evaluation and gate

학습 중 real eval은 최근 5y, 1d 데이터를 기준으로 평가합니다. 3개월 단위 20개 window의 수익률, MDD, Sharpe는 계속 기록하지만, registry 통과 여부는 아래 단일 기준으로 판단합니다.

Gate 항목	값
Gate mode	`5y_30d_avg_sharpe`
Pass condition	`5Y 30d Avg Sharpe >= 1.0`
Rolling window	`30` daily returns
Annualization	`365` periods/year
Diagnostic windows	`20 x 3M`, 통과 판단이 아닌 리포트용

통과한 모델의 .meta.json에는 gate.backtest_5y_rolling_sharpe_avg_30d, gate.min_backtest_5y_rolling_sharpe_avg_30d, gate.research_metrics가 포함됩니다. JeTech Lab의 운용모델 관리 화면은 이 sidecar metadata를 읽어 후보 모델의 5Y 30d Avg Sharpe 컬럼을 표시합니다.

W&B logging

W&B에는 train scalar 전체가 아니라 real eval 중심 지표가 올라갑니다.

real_eval/num_timesteps
real_eval/backtest_5y_rolling_sharpe_avg_30d
real_eval/backtest_5y_return_count
real_eval/mean_strategy_window_return
real_eval/mean_market_window_return
real_eval/mean_strategy_window_mdd
real_eval/mean_market_window_mdd
real_eval/mean_strategy_window_sharpe
real_eval/sharpe_window_count
real_eval/sharpe_window_ratio

Change log

날짜	변경
2026-05-02	`ppo_itransformer_v1` batch preset 문서화
2026-05-02	registry gate를 3개월 window count 기준에서 `5Y 30d Avg Sharpe >= 0.5` 기준으로 전환
2026-05-04	registry gate pass threshold를 `5Y 30d Avg Sharpe >= 1.0`으로 상향
2026-05-02	후보 모델 테이블 표시 지표를 `5Y 30d Avg Sharpe`로 통일