Skip to content

Simon's Blog

第 1 月：机器学习基础与 Python 工程实践

第 1 月：机器学习基础与 Python 工程实践¶

🎯 学习目标¶

掌握机器学习核心概念：监督学习、非监督学习、过拟合、交叉验证等
掌握常见算法：线性回归、逻辑回归、KNN、SVM、决策树、随机森林
熟练使用 Python 科学计算工具：NumPy、Pandas、Matplotlib、Scikit-learn

📚 推荐课程¶

Andrew Ng 机器学习课程（Coursera）[中英双语字幕]
《Python Data Science Handbook》（Jake VanderPlas）[GitHub 免费]
Kaggle: Titanic 生存预测（Classification）

✅ 每周任务安排¶

Week 1：¶

Python 高级语法：函数、迭代器、类与模块
NumPy 与 Pandas 的使用：数据清洗、缺失值处理、数据合并与透视表
练习题：LeetCode 简单算法题（每日 1~2 题）

Week 2：¶

学习监督学习：线性回归与逻辑回归
实战项目：用波士顿房价数据集预测房价（LinearRegression）
学习过拟合/欠拟合，使用交叉验证调参

Week 3：¶

学习分类模型：KNN、决策树、随机森林、SVM
实战项目：Kaggle Titanic 数据分析
学会使用 Sklearn 的 GridSearchCV、Pipeline

Week 4：¶

非监督学习简介：KMeans 聚类
实战项目：使用 KMeans 对顾客分群（Mall Customers 数据集）
用 Matplotlib/Seaborn 展示结果可视化

🛠️ 阶段成果输出¶

GitHub 项目仓库：ml-basics-practice
提交内容包括：
每个模型代码 & notebook
说明文档（README.md）
模型效果截图

第 2 月：神经网络与 PyTorch 入门¶

🎯 学习目标¶

理解神经网络的结构：前向传播、反向传播、激活函数、损失函数
掌握 PyTorch 框架基础
能手动构建一个图像分类网络（MNIST/CIFAR10）

📚 推荐课程¶

fast.ai - Practical Deep Learning for Coders（前 4 节）
PyTorch 官方教程（60 分钟入门）
《Deep Learning with PyTorch》实战手册

✅ 每周任务安排¶

Week 1：¶

理论：神经网络基础、感知器、激活函数（ReLU、Sigmoid）
实操：用 Numpy 手写单层神经网络（练习 forward/backward）
安装 PyTorch，运行官方示例代码

Week 2：¶

构建多层感知器（MLP），在 MNIST 上进行手写数字分类
学习 loss 函数（MSE、CrossEntropy）、优化器（SGD、Adam）
学会查看模型参数与梯度

Week 3：¶

使用 CNN 实现图像分类
用 torchvision 导入 CIFAR10 数据集
学习 Dropout、BatchNorm、数据增强

Week 4：¶

学习模型保存/加载、早停（Early Stopping）
实战项目：构建小型猫狗识别器（Kaggle Dogs vs Cats mini）

🛠️ 阶段成果输出¶

GitHub 项目仓库：deep-learning-from-scratch
项目内容：
自建 MLP/CNN 模型源码
训练/测试结果图
README.md 包括网络结构图、训练日志、模型下载链接

第 3 月：模型部署与端到端项目实战¶

🎯 学习目标¶

掌握模型 API 封装（使用 Flask/FastAPI）
掌握模型部署流程（本地+云端）
构建一个可被调用的 AI 服务（如图像识别 / 文本分类）

📚 推荐资源¶

Full Stack Deep Learning（FSDL）2023课程
Miguel Grinberg 的 Flask 教程（Python 教父）
YouTube – Deploying ML Models with FastAPI & Docker

✅ 每周任务安排¶

Week 1：¶

学习 Flask 与 FastAPI 的基本用法
路由、请求参数、返回 JSON
搭建一个“模型服务API”：调用本地训练的模型返回预测结果

Week 2：¶

学习模型序列化与加载（.pt, .pkl）
将 PyTorch 模型封装为 Web 服务（POST 请求上传图像→返回预测）
项目示例：图像识别 API

Week 3：¶

学习 Docker 打包部署
编写 Dockerfile、构建镜像、启动容器
学习使用 Postman 测试 API
项目扩展：用 Swagger 文档化你的接口

Week 4：¶

将模型部署到云平台：
使用 Render.com / Railway / HuggingFace Spaces / AWS
终极实战项目：
项目名称：AI 猫狗分类云服务
用户上传图片，服务器返回预测种类与概率

🛠️ 阶段成果输出¶

GitHub 项目仓库：ai-image-api-deploy
项目内容：
API 源码（FastAPI + 模型封装）
Docker 部署脚本
在线部署链接（附截图）
视频演示（可选，上传到 YouTube 或哔哩哔哩）

第 4 月：MLOps 流程与模型生命周期管理¶

🎯 学习目标¶

理解 MLOps 核心：版本控制、自动训练、部署监控
掌握 MLFlow/Airflow 用于实验追踪与任务调度
掌握生产级模型开发流程

📚 推荐资源¶

MadeWithML – MLOps 免费教程（https://madewithml.com/）
MLflow 入门（官网 + YouTube 演示）
Google Cloud AI/ML Engineering Path（可选）

✅ 每周任务安排¶

Week 1：¶

理解 MLOps 概念：数据版本、模型注册、部署监控
安装 MLflow，本地进行模型实验记录
训练不同超参模型，记录结果对比

Week 2：¶

学习自动化训练任务管理（Airflow）
定义 DAG、调度模型定时训练
掌握 CI/CD 简单概念：使用 GitHub Actions 触发自动训练

Week 3：¶

构建一个生产级 AI 项目结构
按照最佳实践分层管理：data/ model/ api/ scripts/
项目实战：新闻文本分类系统 + 模型版本跟踪 + API 接口

Week 4：¶

项目打包发布
提交完整文档：架构图、部署流程、环境要求
编写使用说明 + 在线体验链接

🛠️ 阶段成果输出¶

GitHub 项目仓库：news-classifier-mlops
内容包括：
完整目录结构 + API + MLflow 使用记录
CI/CD 脚本（GitHub Actions 示例）
README：MLOps 项目文档说明