리서치 목록
2026년 5월 2일7 min readJeTech Lab

Agent Model Version Changelog: PPO iTransformer v1

JeTech 운용 후보 모델의 첫 iTransformer v1 preset과 gate 기준을 기록합니다.

Agent Model
iTransformer
PPO
Registry Gate

요약

ppo_itransformer_v1은 JeTech agent registry 후보 모델을 만들기 위한 첫 iTransformer runtime preset입니다. run name은 모델을 식별하기 위한 최소 정보만 담고, 실제 학습 파라미터와 gate 결과는 run 폴더의 config.json, W&B config, 그리고 업로드된 model sidecar metadata에 남깁니다.

Run identity

항목
Canonical run nameppo_itransformer_v1_{symbol}_{YYYYMMDD_HHMMSS}
AlgorithmPPO, Stable-Baselines3
BackboneiTransformer feature extractor
Versionv1
Current batch symbolsBTC, ETH, SOL, XRP, DOGE
Registry artifact scopegate 통과 모델만 S3 registry 후보로 업로드

Runtime preset

파라미터
window_size128
encoder_hidden_size64
encoder_layers2
encoder_dropout0.1
transformer_num_heads4
transformer_ffn_dim128
features_dim64
policy_networkmlp
value_networkmlp
policy_hidden_dims[64, 64]
value_hidden_dims[64, 64]

Training defaults

항목
Synthetic reference period5y
Reference interval1d
Episode length1000
GAN innovation blend0.75
Target rollout batch1024
Eval frequencyrollout batch와 동일
Total timesteps102400
Current batch scripttrading/agents/scripts/train_crypto_batch.sh
Batch repeat count심볼별 30

n_envsn_steps는 실행 환경 CPU 수에 따라 자동 결정됩니다. 현재 배치 로그 기준으로는 n_envs=4, n_steps=256, rollout_batch=1024가 사용됩니다.

Risk and action controls

파라미터
target_exposure_deadband0.05
rebalance_deadband0.05
cooldown_bars2
drawdown_stop0.40
reward_turnover_penalty0.0005
reward_downside_penalty0.05
reward_running_drawdown_penalty0.005
reward_drawdown_increment_penalty0.50

Real evaluation and gate

학습 중 real eval은 최근 5y, 1d 데이터를 기준으로 평가합니다. 3개월 단위 20개 window의 수익률, MDD, Sharpe는 계속 기록하지만, registry 통과 여부는 아래 단일 기준으로 판단합니다.

Gate 항목
Gate mode5y_30d_avg_sharpe
Pass condition5Y 30d Avg Sharpe >= 1.0
Rolling window30 daily returns
Annualization365 periods/year
Diagnostic windows20 x 3M, 통과 판단이 아닌 리포트용

통과한 모델의 .meta.json에는 gate.backtest_5y_rolling_sharpe_avg_30d, gate.min_backtest_5y_rolling_sharpe_avg_30d, gate.research_metrics가 포함됩니다. JeTech Lab의 운용모델 관리 화면은 이 sidecar metadata를 읽어 후보 모델의 5Y 30d Avg Sharpe 컬럼을 표시합니다.

W&B logging

W&B에는 train scalar 전체가 아니라 real eval 중심 지표가 올라갑니다.

  • real_eval/num_timesteps
  • real_eval/backtest_5y_rolling_sharpe_avg_30d
  • real_eval/backtest_5y_return_count
  • real_eval/mean_strategy_window_return
  • real_eval/mean_market_window_return
  • real_eval/mean_strategy_window_mdd
  • real_eval/mean_market_window_mdd
  • real_eval/mean_strategy_window_sharpe
  • real_eval/sharpe_window_count
  • real_eval/sharpe_window_ratio

Change log

날짜변경
2026-05-02ppo_itransformer_v1 batch preset 문서화
2026-05-02registry gate를 3개월 window count 기준에서 5Y 30d Avg Sharpe >= 0.5 기준으로 전환
2026-05-04registry gate pass threshold를 5Y 30d Avg Sharpe >= 1.0으로 상향
2026-05-02후보 모델 테이블 표시 지표를 5Y 30d Avg Sharpe로 통일