工程项目
QuantLab
研究到生产风格的机器学习回测框架,强调防止数据泄漏的验证与考虑交易成本的评估。
Python pandas scikit-learn XGBoost Financial ML Backtesting
问题背景
金融机器学习实验如果缺少严格的时间序列验证、成本假设与基线对照,很容易过拟合且难以信任。
当前状态
作品集骨架版本,后续会加入可复现实验示例。
我构建了什么
- 设计从市场数据缓存、特征、标签、walk-forward 切分、训练到回测的完整流程。
- 加入简单基线与 ML 策略的对照。
- 围绕风险、换手率、交易成本与可复现性组织报告。
架构 / 系统设计
- 01
市场数据
- 02
特征工程
- 03
标签生成
- 04
Walk-Forward 切分
- 05
模型训练
- 06
回测
- 07
指标 / 报告
技术亮点
- 将验证设计视为系统架构的一部分。
- 交易成本与风险指标在模型选择前就纳入,而不是事后补充。
- 实验报告让失败实验也能留下有效信息,而不是消失。
后续计划
- 加入公开玩具数据集与确定性示例报告。
- 对比树模型、线性基线与简单规则策略。
- 记录数据泄漏检查与实验评审标准。
技术栈
Python pandas NumPy scikit-learn XGBoost Matplotlib pytest
演示 / 截图
示例报告只会使用公开或合成数据。
简历要点草稿
- 构建金融 ML 回测框架,覆盖数据缓存、特征工程、walk-forward 验证、交易成本与可复现实验报告。
- 使用风险感知指标对比基线与 ML 策略,降低数据泄漏和过拟合风险。