Skip to content

第 1 月:机器学习基础与 Python 工程实践

🎯 学习目标

  • 掌握机器学习核心概念:监督学习、非监督学习、过拟合、交叉验证等
  • 掌握常见算法:线性回归、逻辑回归、KNN、SVM、决策树、随机森林
  • 熟练使用 Python 科学计算工具:NumPy、Pandas、Matplotlib、Scikit-learn

📚 推荐课程

  • Andrew Ng 机器学习课程(Coursera)[中英双语字幕]
  • 《Python Data Science Handbook》(Jake VanderPlas)[GitHub 免费]
  • Kaggle: Titanic 生存预测(Classification)

✅ 每周任务安排

Week 1:

  • Python 高级语法:函数、迭代器、类与模块
  • NumPy 与 Pandas 的使用:数据清洗、缺失值处理、数据合并与透视表
  • 练习题:LeetCode 简单算法题(每日 1~2 题)

Week 2:

  • 学习监督学习:线性回归与逻辑回归
  • 实战项目:用波士顿房价数据集预测房价(LinearRegression)
  • 学习过拟合/欠拟合,使用交叉验证调参

Week 3:

  • 学习分类模型:KNN、决策树、随机森林、SVM
  • 实战项目:Kaggle Titanic 数据分析
  • 学会使用 Sklearn 的 GridSearchCVPipeline

Week 4:

  • 非监督学习简介:KMeans 聚类
  • 实战项目:使用 KMeans 对顾客分群(Mall Customers 数据集)
  • 用 Matplotlib/Seaborn 展示结果可视化

🛠️ 阶段成果输出

  • GitHub 项目仓库:ml-basics-practice
  • 提交内容包括:
  • 每个模型代码 & notebook
  • 说明文档(README.md)
  • 模型效果截图

第 2 月:神经网络与 PyTorch 入门

🎯 学习目标

  • 理解神经网络的结构:前向传播、反向传播、激活函数、损失函数
  • 掌握 PyTorch 框架基础
  • 能手动构建一个图像分类网络(MNIST/CIFAR10)

📚 推荐课程

  • fast.ai - Practical Deep Learning for Coders(前 4 节)
  • PyTorch 官方教程(60 分钟入门)
  • 《Deep Learning with PyTorch》实战手册

✅ 每周任务安排

Week 1:

  • 理论:神经网络基础、感知器、激活函数(ReLU、Sigmoid)
  • 实操:用 Numpy 手写单层神经网络(练习 forward/backward)
  • 安装 PyTorch,运行官方示例代码

Week 2:

  • 构建多层感知器(MLP),在 MNIST 上进行手写数字分类
  • 学习 loss 函数(MSE、CrossEntropy)、优化器(SGD、Adam)
  • 学会查看模型参数与梯度

Week 3:

  • 使用 CNN 实现图像分类
  • torchvision 导入 CIFAR10 数据集
  • 学习 Dropout、BatchNorm、数据增强

Week 4:

  • 学习模型保存/加载、早停(Early Stopping)
  • 实战项目:构建小型猫狗识别器(Kaggle Dogs vs Cats mini)

🛠️ 阶段成果输出

  • GitHub 项目仓库:deep-learning-from-scratch
  • 项目内容:
  • 自建 MLP/CNN 模型源码
  • 训练/测试结果图
  • README.md 包括网络结构图、训练日志、模型下载链接

第 3 月:模型部署与端到端项目实战

🎯 学习目标

  • 掌握模型 API 封装(使用 Flask/FastAPI)
  • 掌握模型部署流程(本地+云端)
  • 构建一个可被调用的 AI 服务(如图像识别 / 文本分类)

📚 推荐资源

  • Full Stack Deep Learning(FSDL)2023课程
  • Miguel Grinberg 的 Flask 教程(Python 教父)
  • YouTube – Deploying ML Models with FastAPI & Docker

✅ 每周任务安排

Week 1:

  • 学习 Flask 与 FastAPI 的基本用法
  • 路由、请求参数、返回 JSON
  • 搭建一个“模型服务API”:调用本地训练的模型返回预测结果

Week 2:

  • 学习模型序列化与加载(.pt, .pkl
  • 将 PyTorch 模型封装为 Web 服务(POST 请求上传图像→返回预测)
  • 项目示例:图像识别 API

Week 3:

  • 学习 Docker 打包部署
  • 编写 Dockerfile、构建镜像、启动容器
  • 学习使用 Postman 测试 API
  • 项目扩展:用 Swagger 文档化你的接口

Week 4:

  • 将模型部署到云平台:
  • 使用 Render.com / Railway / HuggingFace Spaces / AWS
  • 终极实战项目:
  • 项目名称:AI 猫狗分类云服务
  • 用户上传图片,服务器返回预测种类与概率

🛠️ 阶段成果输出

  • GitHub 项目仓库:ai-image-api-deploy
  • 项目内容:
  • API 源码(FastAPI + 模型封装)
  • Docker 部署脚本
  • 在线部署链接(附截图)
  • 视频演示(可选,上传到 YouTube 或哔哩哔哩)

第 4 月:MLOps 流程与模型生命周期管理

🎯 学习目标

  • 理解 MLOps 核心:版本控制、自动训练、部署监控
  • 掌握 MLFlow/Airflow 用于实验追踪与任务调度
  • 掌握生产级模型开发流程

📚 推荐资源

  • MadeWithML – MLOps 免费教程(https://madewithml.com/)
  • MLflow 入门(官网 + YouTube 演示)
  • Google Cloud AI/ML Engineering Path(可选)

✅ 每周任务安排

Week 1:

  • 理解 MLOps 概念:数据版本、模型注册、部署监控
  • 安装 MLflow,本地进行模型实验记录
  • 训练不同超参模型,记录结果对比

Week 2:

  • 学习自动化训练任务管理(Airflow)
  • 定义 DAG、调度模型定时训练
  • 掌握 CI/CD 简单概念:使用 GitHub Actions 触发自动训练

Week 3:

  • 构建一个生产级 AI 项目结构
  • 按照最佳实践分层管理:data/ model/ api/ scripts/
  • 项目实战:新闻文本分类系统 + 模型版本跟踪 + API 接口

Week 4:

  • 项目打包发布
  • 提交完整文档:架构图、部署流程、环境要求
  • 编写使用说明 + 在线体验链接

🛠️ 阶段成果输出

  • GitHub 项目仓库:news-classifier-mlops
  • 内容包括:
  • 完整目录结构 + API + MLflow 使用记录
  • CI/CD 脚本(GitHub Actions 示例)
  • README:MLOps 项目文档说明