JaxMARL-HFT: GPU-Accelerated Multi-Agent Reinforcement Learning for High-Frequency Trading

A JAX-based framework for multi-agent reinforcement learning for high-frequency trading, based on the JAX-LOB simulator and an extension of JaxMARL to the financial trading domain.

Key Features

GPU-Accelerated: Built on JAX for high-performance parallel computation with JIT compilation
Two levels of Parallelization: Parallel processing across episodes and agent types using vmap
Multi-Agent RL: Supports market making, execution, and directional trading agents
LOBSTER Data Integration: Real market data support with efficient GPU memory usage
Scalable: Handles thousands of parallel environments
Heterogeneous Agents: Supports different observation/action spaces

Quick Start

Docker Setup

# Set up data directory
mkdir -p ~/data

Note: Configure the Makefile for your specific environment (GPU device, data directory path, etc.)

# Build and run with Docker
make build
make run

Training

# Run IPPO training
python3 gymnax_exchange/jaxrl/MARL/ippo_rnn_JAXMARL.py

Agent Types

Market Making Agents

Purpose: Provide liquidity by posting bid/ask orders
Action Spaces: Multiple discrete action spaces (spread_skew, fixed_quants, AvSt, directional_trading, simple)
Reward Functions: Various PnL-based rewards with configurable inventory penalties

Execution Agents

Purpose: Execute large orders with minimal market impact
Action Spaces: Discrete quantity selection at reference prices (fixed_quants, fixed_prices, complex variants)
Reward Functions: Slippage-based with configurable end-of-episode penalties

Directional Trading

Purpose: Simple directional trading strategy
Action Spaces: Bid/ask at best prices or no action
Reward Function: Portfolio value
Note: Uses the same class as the market making agent

Repository Structure

gymnax_exchange/
├── jaxen/            # Environment implementations
│   ├── marl_env.py  # Multi-agent RL environment
│   ├── mm_env.py    # Market making (and directional trading) environment  
│   └── exec_env.py  # Execution environment
├── jaxrl/           # Reinforcement learning algorithms
│   └── MARL/        # IPPO implementation
├── jaxob/           # Order book implementation
└── jaxlobster/      # LOBSTER data integration

Configuration

The framework uses a comprehensive configuration system with dataclasses for different components:

Core Configuration Classes

MultiAgentConfig: Main configuration combining world and agent settings
World_EnvironmentConfig: Global environment parameters (data paths, episode settings, market hours)
MarketMaking_EnvironmentConfig: Market making and directional trading agent configuration (action spaces, reward functions, observation spaces)
Execution_EnvironmentConfig: Execution agent configuration (task types, action spaces, reward parameters)

Training Configuration

Edit YAML files in gymnax_exchange/jaxrl/MARL/config/ to customize:

Number of parallel environments (default: 4096)
Training parameters (steps, learning rates, etc.)
Agent configurations (action spaces, reward functions)
Market data settings (resolution, episode length)

Requirements

Python 3.8+
CUDA-compatible GPU (recommended)
JAX, Flax, and related dependencies (see requirements.txt)

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
gymnax_exchange		gymnax_exchange
.gitignore		.gitignore
Dockerfile		Dockerfile
Makefile		Makefile
README.md		README.md
__init__.py		__init__.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

JaxMARL-HFT: GPU-Accelerated Multi-Agent Reinforcement Learning for High-Frequency Trading

Key Features

Quick Start

Docker Setup

Training

Agent Types

Market Making Agents

Execution Agents

Directional Trading

Repository Structure

Configuration

Core Configuration Classes

Training Configuration

Requirements

About

Uh oh!

Releases

Packages

Languages

vmohl/JaxMARL-HFT

Folders and files

Latest commit

History

Repository files navigation

JaxMARL-HFT: GPU-Accelerated Multi-Agent Reinforcement Learning for High-Frequency Trading

Key Features

Quick Start

Docker Setup

Training

Agent Types

Market Making Agents

Execution Agents

Directional Trading

Repository Structure

Configuration

Core Configuration Classes

Training Configuration

Requirements

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages