返回工程作品

工程项目

QuantLab

研究到生产风格的机器学习回测框架,强调防止数据泄漏的验证与考虑交易成本的评估。

Python pandas scikit-learn XGBoost Financial ML Backtesting

问题背景

金融机器学习实验如果缺少严格的时间序列验证、成本假设与基线对照,很容易过拟合且难以信任。

当前状态

作品集骨架版本,后续会加入可复现实验示例。

我构建了什么

  • 设计从市场数据缓存、特征、标签、walk-forward 切分、训练到回测的完整流程。
  • 加入简单基线与 ML 策略的对照。
  • 围绕风险、换手率、交易成本与可复现性组织报告。

架构 / 系统设计

  1. 01

    市场数据

  2. 02

    特征工程

  3. 03

    标签生成

  4. 04

    Walk-Forward 切分

  5. 05

    模型训练

  6. 06

    回测

  7. 07

    指标 / 报告

技术亮点

  • 将验证设计视为系统架构的一部分。
  • 交易成本与风险指标在模型选择前就纳入,而不是事后补充。
  • 实验报告让失败实验也能留下有效信息,而不是消失。

后续计划

  • 加入公开玩具数据集与确定性示例报告。
  • 对比树模型、线性基线与简单规则策略。
  • 记录数据泄漏检查与实验评审标准。

技术栈

Python pandas NumPy scikit-learn XGBoost Matplotlib pytest

演示 / 截图

示例报告只会使用公开或合成数据。

简历要点草稿

  • 构建金融 ML 回测框架,覆盖数据缓存、特征工程、walk-forward 验证、交易成本与可复现实验报告。
  • 使用风险感知指标对比基线与 ML 策略,降低数据泄漏和过拟合风险。