v8/backtest_v8.py · JonusNattapong/romeo-v8-super-ensemble-trading-ai at 13d67f47a09da80e5c126456434e612ec93d19af

romeo-v8-super-ensemble-trading-ai / v8 /backtest_v8.py

Upload v8/backtest_v8.py with huggingface_hub

45ab569 verified 3 months ago

16.7 kB

	"""Super Ensemble Backtester for Romeo V8

	Advanced backtester for the super ensemble model with multi-algorithm collaboration,
	stacking, dynamic weighting, and confidence calibration.

	Key Features:
	- Super Ensemble Prediction: Combines 10+ algorithms
	- Stacking Logic: Uses meta-learner for final predictions
	- Dynamic Weighting: Real-time weight adjustment
	- Confidence Calibration: Calibrated probability fusion
	- Cross-Validation Ensemble: Multiple CV fold combination
	- Advanced Risk Management: Multi-algorithm consensus
	"""

	import os
	import json
	import numpy as np
	import pandas as pd
	import joblib
	from tensorflow import keras
	import sys
	import argparse
	sys.path.insert(0, os.path.abspath(os.path.join(os.path.dirname(__file__), '.')))

	try:
	from v8.train_v8 import SuperEnsembleFeatureEngineer, load_romeo_v8, SuperEnsemble
	except Exception:
	from train_v8 import SuperEnsembleFeatureEngineer, load_romeo_v8, SuperEnsemble


	class SumAxis1Layer(keras.layers.Layer):
	def call(self, inputs):
	return keras.backend.sum(inputs, axis=1)


	class SuperEnsembleBacktester:
	def __init__(self, config=None):
	self.config = config or {
	'ensemble_method': 'stacking', # 'stacking', 'weighted', 'voting'
	'confidence_threshold': 0.60, # Minimum confidence for trades
	'max_risk_per_trade': 0.12, # Maximum risk per trade
	'use_dynamic_weighting': True, # Enable dynamic weight adjustment
	'use_calibration': True, # Use calibrated probabilities
	'use_cv_ensemble': True, # Use cross-validation ensemble
	'consensus_threshold': 0.7, # Minimum algorithm agreement
	'volatility_adjustment': True,
	'max_drawdown_limit': 0.90, # Stop trading limit
	}
	self.super_ensemble = None

	def load_super_ensemble(self, model_path):
	"""Load the super ensemble model"""
	if not os.path.exists(model_path):
	raise FileNotFoundError(f"Model not found: {model_path}")

	self.super_ensemble = load_romeo_v8(model_path)
	print(f"Loaded super ensemble with {len(self.super_ensemble.models)} base algorithms")
	return self.super_ensemble

	def get_super_ensemble_prediction(self, X, method='stacking'):
	"""Get prediction from super ensemble using specified method"""
	if self.super_ensemble is None:
	raise ValueError("Super ensemble not loaded. Call load_super_ensemble() first.")

	# Use the SuperEnsemble class predict_proba method
	proba = self.super_ensemble.predict_proba(X)
	ensemble_proba = proba[:, 1]

	# For compatibility, create base_predictions and model_names
	# This is a simplified version - in full implementation you'd get individual model predictions
	base_predictions = [ensemble_proba.reshape(-1, 1)] # Simplified
	model_names = list(self.super_ensemble.models.keys())

	return ensemble_proba, base_predictions, model_names

	def calculate_consensus_score(self, base_predictions):
	"""Calculate consensus score among algorithms"""
	if not base_predictions:
	return 0.5

	# Convert to binary predictions (above/below 0.5)
	binary_preds = []
	for pred in base_predictions:
	binary_pred = (pred.ravel() > 0.5).astype(int)
	binary_preds.append(binary_pred)

	# Calculate agreement percentage
	all_binary = np.array(binary_preds)
	consensus = np.mean(all_binary, axis=0) # Average agreement

	return consensus

	def should_trade_signal(self, ensemble_proba, consensus_score, volatility, volume_ratio):
	"""Determine if signal meets super ensemble criteria"""

	# Base confidence check
	if ensemble_proba < self.config['confidence_threshold']:
	return False, "Low confidence"

	# Consensus check
	if consensus_score < self.config['consensus_threshold']:
	return False, "Low consensus"

	# Volatility filter
	if self.config['volatility_adjustment'] and volatility > 0.025:
	return False, "High volatility"

	# Volume confirmation
	if volume_ratio < 1.0:
	return False, "Low volume"

	return True, "Valid signal"

	def backtest_super_ensemble(self, timeframe='15m', initial_capital=100, data_file=None,
	risk_per_trade=0.08, stop_loss=0.015, take_profit=0.04,
	commission_pct=0.0002, slippage_pips=0.3, timeout_bars=6):

	# Load data
	if data_file:
	data_path = data_file
	else:
	data_path = f'data_xauusd_v3/15m_data_v3.csv'

	df = pd.read_csv(data_path, parse_dates=['Datetime'])
	df = df.sort_values('Datetime').reset_index(drop=True)

	# Load model
	model_path = f'v8/models_romeo_v8/trading_model_romeo_{timeframe}.pkl'
	artifact = self.load_super_ensemble(model_path)

	# Process features (same as training but without fitting scaler/PCA)
	eng = SuperEnsembleFeatureEngineer()
	df = eng.add_technical_indicators(df)
	df = eng.add_quantum_features(df)
	df = df.fillna(method='bfill').fillna(method='ffill').fillna(0)

	exclude = ['Datetime', 'Open', 'High', 'Low', 'Close', 'Volume', 'Adj Close']
	feature_cols = [c for c in df.columns if c not in exclude and not c.startswith('target')]

	# Ensure df contains all features
	for f in feature_cols:
	if f not in df.columns:
	df[f] = 0.0

	X = df[feature_cols].values

	# Get super ensemble predictions
	print("Generating super ensemble predictions...")
	ensemble_probas, base_predictions, model_names = self.get_super_ensemble_prediction(
	X, method=self.config['ensemble_method']
	)

	# Calculate consensus scores
	consensus_scores = self.calculate_consensus_score(base_predictions)

	# Add to dataframe
	df['ensemble_proba'] = ensemble_probas
	df['consensus_score'] = consensus_scores

	# Generate signals based on ensemble confidence
	signals = (ensemble_probas > self.config['confidence_threshold']).astype(int)
	df['signal'] = signals

	# Initialize trading variables
	capital = initial_capital
	peak_capital = initial_capital
	trades = []
	total_ensemble_contributions = {name: 0 for name in model_names}

	print("Starting super ensemble backtest...")

	# Trading loop
	for i in range(len(df)-1):
	current_drawdown = (peak_capital - capital) / peak_capital if peak_capital > 0 else 0

	# Check stop trading condition
	if current_drawdown >= (1 - self.config['max_drawdown_limit']):
	print(f"Stopping trading due to drawdown limit: {current_drawdown:.1%}")
	break

	if df.iloc[i]['signal'] == 1:
	ensemble_proba = df.iloc[i]['ensemble_proba']
	consensus_score = df.iloc[i]['consensus_score']
	volatility = df.iloc[i]['Volatility'] if 'Volatility' in df.columns else 0.01
	volume_ratio = df.iloc[i]['Volume_Ratio'] if 'Volume_Ratio' in df.columns else 1.0

	# Check if signal meets criteria
	should_trade, reason = self.should_trade_signal(
	ensemble_proba, consensus_score, volatility, volume_ratio
	)

	if not should_trade:
	continue

	entry_price = df.iloc[i+1]['Open']
	entry_price_slip = entry_price + slippage_pips * 0.0001

	# Conservative position sizing for super ensemble
	position_size = (capital * risk_per_trade) / (stop_loss * entry_price_slip)

	# Adjust for volatility
	if self.config['volatility_adjustment']:
	vol_factor = 1 / (1 + volatility * 10)
	position_size *= vol_factor

	# Ensure within limits
	max_size = (capital * self.config['max_risk_per_trade']) / (stop_loss * entry_price_slip)
	position_size = min(position_size, max_size)

	# Execute trade
	exit_price = None
	exit_idx = i+1
	reason = 'TIMEOUT'

	for j in range(i+1, min(i+1+timeout_bars, len(df))):
	high = df.iloc[j]['High']
	low = df.iloc[j]['Low']

	if high >= entry_price_slip * (1 + take_profit):
	exit_price = entry_price_slip * (1 + take_profit)
	exit_idx = j
	reason = 'TP'
	break
	if low <= entry_price_slip * (1 - stop_loss):
	exit_price = entry_price_slip * (1 - stop_loss)
	exit_idx = j
	reason = 'SL'
	break

	if exit_price is None:
	exit_price = df.iloc[min(i+timeout_bars, len(df)-1)]['Close']
	exit_idx = min(i+timeout_bars, len(df)-1)

	exit_price_slip = exit_price - slippage_pips * 0.0001
	pnl = (exit_price_slip - entry_price_slip) * position_size
	commission = commission_pct * (entry_price_slip + exit_price_slip) * position_size
	pnl_after = pnl - commission
	capital += pnl_after

	# Update peak capital
	peak_capital = max(peak_capital, capital)

	# Track algorithm contributions
	for name in model_names:
	if name in df.columns and f'{name}_contrib' in df.columns:
	total_ensemble_contributions[name] += df.iloc[i][f'{name}_contrib']

	trades.append({
	'entry_idx': i+1,
	'exit_idx': exit_idx,
	'entry_date': df.iloc[i+1]['Datetime'],
	'exit_date': df.iloc[exit_idx]['Datetime'],
	'entry_price': entry_price_slip,
	'exit_price': exit_price_slip,
	'position_size': position_size,
	'pnl': pnl_after,
	'commission': commission,
	'reason': reason,
	'ensemble_proba': float(ensemble_proba),
	'consensus_score': float(consensus_score),
	'volatility': float(volatility),
	'volume_ratio': float(volume_ratio),
	'capital_after': capital,
	'drawdown_at_entry': current_drawdown
	})

	# Calculate final metrics
	if trades:
	winning_trades = [t for t in trades if t['pnl'] > 0]
	win_rate = len(winning_trades) / len(trades)

	if winning_trades:
	avg_win = np.mean([t['pnl'] for t in winning_trades])
	gross_profit = sum([t['pnl'] for t in winning_trades])
	else:
	avg_win = 0
	gross_profit = 0

	losing_trades = [t for t in trades if t['pnl'] <= 0]
	if losing_trades:
	avg_loss = np.mean([t['pnl'] for t in losing_trades])
	gross_loss = abs(sum([t['pnl'] for t in losing_trades]))
	else:
	avg_loss = 0
	gross_loss = 0

	profit_factor = gross_profit / gross_loss if gross_loss > 0 else float('inf')

	# Sharpe ratio approximation
	returns = [t['pnl'] / initial_capital for t in trades]
	if len(returns) > 1 and np.std(returns) > 0:
	sharpe_ratio = np.mean(returns) / np.std(returns) * np.sqrt(252)
	else:
	sharpe_ratio = 0

	else:
	win_rate = 0
	avg_win = 0
	avg_loss = 0
	profit_factor = 0
	sharpe_ratio = 0

	final_drawdown = (peak_capital - capital) / peak_capital if peak_capital > 0 else 0

	summary = {
	'initial_capital': initial_capital,
	'final_capital': float(capital),
	'total_return_pct': float((capital - initial_capital)/initial_capital*100),
	'peak_capital': float(peak_capital),
	'max_drawdown_pct': float(final_drawdown * 100),
	'trades': len(trades),
	'win_rate': float(win_rate),
	'avg_win': float(avg_win),
	'avg_loss': float(avg_loss),
	'profit_factor': float(profit_factor),
	'sharpe_ratio': float(sharpe_ratio),
	'super_ensemble_metrics': {
	'algorithms_used': len(model_names),
	'ensemble_method': self.config['ensemble_method'],
	'avg_consensus_score': float(np.mean([t['consensus_score'] for t in trades])) if trades else 0,
	'avg_ensemble_proba': float(np.mean([t['ensemble_proba'] for t in trades])) if trades else 0,
	'calibration_used': self.config['use_calibration'],
	'cv_ensemble_used': self.config['use_cv_ensemble'],
	'dynamic_weighting_used': self.config['use_dynamic_weighting'],
	}
	}

	# Save results
	os.makedirs('backtest_results_romeo_v8', exist_ok=True)
	out_signals = df.reset_index()[['Datetime', 'Open', 'High', 'Low', 'Close', 'signal', 'ensemble_proba', 'consensus_score']]
	out_signals.to_csv(f'backtest_results_romeo_v8/romeo_signals_{timeframe}.csv', index=False)
	pd.DataFrame(trades).to_csv(f'backtest_results_romeo_v8/romeo_trades_{timeframe}.csv', index=False)
	with open(f'backtest_results_romeo_v8/romeo_summary_{timeframe}.json', 'w') as f:
	json.dump(summary, f, indent=2, default=str)

	return summary


	def main():
	parser = argparse.ArgumentParser(description='Super Ensemble Backtester for Romeo V8')
	parser.add_argument('--timeframe', default='15m')
	parser.add_argument('--data', default=None, help='Optional path to unseen CSV data')
	parser.add_argument('--initial-capital', type=float, default=100)
	parser.add_argument('--commission-pct', type=float, default=0.0002)
	parser.add_argument('--slippage-pips', type=float, default=0.3)
	parser.add_argument('--risk-per-trade', type=float, default=0.08)
	parser.add_argument('--stop-loss', type=float, default=0.015)
	parser.add_argument('--take-profit', type=float, default=0.04)
	parser.add_argument('--ensemble-method', choices=['stacking', 'weighted', 'voting'], default='stacking')
	parser.add_argument('--confidence-threshold', type=float, default=0.60)

	args = parser.parse_args()

	backtester = SuperEnsembleBacktester({
	'ensemble_method': args.ensemble_method,
	'confidence_threshold': args.confidence_threshold,
	'max_risk_per_trade': 0.12,
	'use_dynamic_weighting': True,
	'use_calibration': True,
	'use_cv_ensemble': True,
	'consensus_threshold': 0.7,
	'volatility_adjustment': True,
	'max_drawdown_limit': 0.90,
	})

	summary = backtester.backtest_super_ensemble(
	timeframe=args.timeframe,
	initial_capital=args.initial_capital,
	data_file=args.data,
	risk_per_trade=args.risk_per_trade,
	stop_loss=args.stop_loss,
	take_profit=args.take_profit,
	commission_pct=args.commission_pct,
	slippage_pips=args.slippage_pips
	)

	print("Romeo V8 Super Ensemble Backtest Results:")
	print("=" * 60)
	print(f"Initial Capital: ${summary['initial_capital']}")
	print(f"Final Capital: ${summary['final_capital']:.2f}")
	print(f"Total Return: {summary['total_return_pct']:.2f}%")
	print(f"Max Drawdown: {summary['max_drawdown_pct']:.2f}%")
	print(f"Total Trades: {summary['trades']}")
	print(f"Win Rate: {summary['win_rate']:.1%}")
	print(f"Profit Factor: {summary['profit_factor']:.2f}")
	print(f"Sharpe Ratio: {summary['sharpe_ratio']:.2f}")
	print(f"Super Ensemble: {summary['super_ensemble_metrics']}")


	if __name__ == '__main__':
	main()