图像基础
图像表示与预处理
理解图像的矩阵表示、颜色空间(RGB、HSV、灰度)转换,以及常见预处理方法。
图像增强技术
几何变换、色彩抖动、Cutout、Mixup 等数据增强技术的原理与实践。
图像分类
经典 CNN 架构
从 LeNet 到 VGG 的经典网络演进,理解卷积、池化、全连接的作用与设计原则。
ResNet 与残差学习
理解残差连接如何解决深层网络梯度消失问题,以及 ResNet 的设计哲学。
目标检测
两阶段检测器
从 R-CNN 到 Faster R-CNN,理解 Region Proposal、RoI Pooling 与检测流程。
单阶段检测器
理解 YOLO 的网格划分与端到端检测,以及单阶段与两阶段检测器的权衡。
Anchor Free 检测
理解 Anchor 的局限性,以及 FCOS 等 Anchor-Free 方法的设计思路。
YOLO 最新进展
YOLO 系列的演进路径,以及最新版本中的 CSP、CAN-Focus 等技术改进。
图像分割
语义分割
理解全卷积网络、膨胀卷积与 ASPP 模块,以及如何实现像素级分类。
实例分割与全景分割
理解实例分割与语义分割的区别,以及 Mask R-CNN 的多任务学习设计。
图像生成
GAN 原理
理解生成器与判别器的对抗训练,以及 WGAN、PGGAN 等改进技术。
Diffusion Model
理解前向扩散与反向去噪过程,以及 DDPM、Stable Diffusion 的原理。