第 1 月:机器学习基础与 Python 工程实践
🎯 学习目标
- 掌握机器学习核心概念:监督学习、非监督学习、过拟合、交叉验证等
- 掌握常见算法:线性回归、逻辑回归、KNN、SVM、决策树、随机森林
- 熟练使用 Python 科学计算工具:NumPy、Pandas、Matplotlib、Scikit-learn
📚 推荐课程
✅ 每周任务安排
Week 1:
- Python 高级语法:函数、迭代器、类与模块
- NumPy 与 Pandas 的使用:数据清洗、缺失值处理、数据合并与透视表
- 练习题:LeetCode 简单算法题(每日 1~2 题)
Week 2:
- 学习监督学习:线性回归与逻辑回归
- 实战项目:用波士顿房价数据集预测房价(LinearRegression)
- 学习过拟合/欠拟合,使用交叉验证调参
Week 3:
- 学习分类模型:KNN、决策树、随机森林、SVM
- 实战项目:Kaggle Titanic 数据分析
- 学会使用 Sklearn 的
GridSearchCV、Pipeline
Week 4:
- 非监督学习简介:KMeans 聚类
- 实战项目:使用 KMeans 对顾客分群(Mall Customers 数据集)
- 用 Matplotlib/Seaborn 展示结果可视化
🛠️ 阶段成果输出
- GitHub 项目仓库:
ml-basics-practice
- 提交内容包括:
- 每个模型代码 & notebook
- 说明文档(README.md)
- 模型效果截图
第 2 月:神经网络与 PyTorch 入门
🎯 学习目标
- 理解神经网络的结构:前向传播、反向传播、激活函数、损失函数
- 掌握 PyTorch 框架基础
- 能手动构建一个图像分类网络(MNIST/CIFAR10)
📚 推荐课程
✅ 每周任务安排
Week 1:
- 理论:神经网络基础、感知器、激活函数(ReLU、Sigmoid)
- 实操:用 Numpy 手写单层神经网络(练习 forward/backward)
- 安装 PyTorch,运行官方示例代码
Week 2:
- 构建多层感知器(MLP),在 MNIST 上进行手写数字分类
- 学习 loss 函数(MSE、CrossEntropy)、优化器(SGD、Adam)
- 学会查看模型参数与梯度
Week 3:
- 使用 CNN 实现图像分类
- 用
torchvision 导入 CIFAR10 数据集
- 学习 Dropout、BatchNorm、数据增强
Week 4:
- 学习模型保存/加载、早停(Early Stopping)
- 实战项目:构建小型猫狗识别器(Kaggle Dogs vs Cats mini)
🛠️ 阶段成果输出
- GitHub 项目仓库:
deep-learning-from-scratch
- 项目内容:
- 自建 MLP/CNN 模型源码
- 训练/测试结果图
- README.md 包括网络结构图、训练日志、模型下载链接
第 3 月:模型部署与端到端项目实战
🎯 学习目标
- 掌握模型 API 封装(使用 Flask/FastAPI)
- 掌握模型部署流程(本地+云端)
- 构建一个可被调用的 AI 服务(如图像识别 / 文本分类)
📚 推荐资源
✅ 每周任务安排
Week 1:
- 学习 Flask 与 FastAPI 的基本用法
- 路由、请求参数、返回 JSON
- 搭建一个“模型服务API”:调用本地训练的模型返回预测结果
Week 2:
- 学习模型序列化与加载(
.pt, .pkl)
- 将 PyTorch 模型封装为 Web 服务(POST 请求上传图像→返回预测)
- 项目示例:图像识别 API
Week 3:
- 学习 Docker 打包部署
- 编写
Dockerfile、构建镜像、启动容器
- 学习使用 Postman 测试 API
- 项目扩展:用 Swagger 文档化你的接口
Week 4:
- 将模型部署到云平台:
- 使用 Render.com / Railway / HuggingFace Spaces / AWS
- 终极实战项目:
- 项目名称:AI 猫狗分类云服务
- 用户上传图片,服务器返回预测种类与概率
🛠️ 阶段成果输出
- GitHub 项目仓库:
ai-image-api-deploy
- 项目内容:
- API 源码(FastAPI + 模型封装)
- Docker 部署脚本
- 在线部署链接(附截图)
- 视频演示(可选,上传到 YouTube 或哔哩哔哩)
第 4 月:MLOps 流程与模型生命周期管理
🎯 学习目标
- 理解 MLOps 核心:版本控制、自动训练、部署监控
- 掌握 MLFlow/Airflow 用于实验追踪与任务调度
- 掌握生产级模型开发流程
📚 推荐资源
✅ 每周任务安排
Week 1:
- 理解 MLOps 概念:数据版本、模型注册、部署监控
- 安装 MLflow,本地进行模型实验记录
- 训练不同超参模型,记录结果对比
Week 2:
- 学习自动化训练任务管理(Airflow)
- 定义 DAG、调度模型定时训练
- 掌握 CI/CD 简单概念:使用 GitHub Actions 触发自动训练
Week 3:
- 构建一个生产级 AI 项目结构
- 按照最佳实践分层管理:data/ model/ api/ scripts/
- 项目实战:新闻文本分类系统 + 模型版本跟踪 + API 接口
Week 4:
- 项目打包发布
- 提交完整文档:架构图、部署流程、环境要求
- 编写使用说明 + 在线体验链接
🛠️ 阶段成果输出
- GitHub 项目仓库:
news-classifier-mlops
- 内容包括:
- 完整目录结构 + API + MLflow 使用记录
- CI/CD 脚本(GitHub Actions 示例)
- README:MLOps 项目文档说明