工程项目
AtlasML
面向模型注册、推理、评估追踪、异步任务与性能基准测试的 ML 基础设施平台。
FastAPI PostgreSQL SQLAlchemy Redis/RQ Pydantic Docker ML Infra
问题背景
许多机器学习项目停留在 notebook 阶段,而真实工程流程需要可靠的模型元数据、可复现评估、清晰的服务边界与运行可观测性。
当前状态
初始后端架构与作品集版本。
我构建了什么
- 设计 FastAPI 服务层,覆盖模型注册、推理请求、评估运行与基准测试任务。
- 使用 PostgreSQL、SQLAlchemy 与 Pydantic 表达模型版本、产物、指标与任务状态。
- 预留 Redis/RQ worker,用于异步执行评估与基准测试,避免阻塞 API 请求。
架构 / 系统设计
- 01
客户端
- 02
FastAPI API
- 03
模型注册 / 推理服务 / 评估服务
- 04
PostgreSQL
- 05
Redis/RQ Worker
- 06
基准测试脚本
技术亮点
- 清晰区分 API schema、持久化模型与服务逻辑。
- 将评估与基准测试记录作为一等实体,而不是散落的文件。
- 设计兼顾本地开发,并保留容器化部署空间。
后续计划
- 当项目从公开骨架发展为真实服务时,加入带权限的模型产物存储。
- 扩展评估看板与回归检查。
- 加入常见模型服务故障模式的 CI 测试样例。
技术栈
FastAPI PostgreSQL SQLAlchemy Redis/RQ Pydantic Docker pytest
演示 / 截图
公开仓库初版整理后会补充截图与 API 示例。
简历要点草稿
- 构建生产风格 ML 基础设施后端,覆盖模型注册、推理、评估追踪、异步任务与基准测试。
- 设计模型版本、指标、产物与任务编排的服务边界和关系型 schema。