计算机视觉

掌握图像处理与视觉理解的核心理论与应用技术

图像基础

🖼️

图像表示与预处理

基础 · 10 分钟

理解图像的矩阵表示、颜色空间（RGB、HSV、灰度）转换，以及常见预处理方法。

图像表示颜色空间预处理

🔧

图像增强技术

数据增强 · 12 分钟

几何变换、色彩抖动、Cutout、Mixup 等数据增强技术的原理与实践。

数据增强 Mixup Cutout

图像分类

📊

经典 CNN 架构

LeNet · AlexNet · VGG · 15 分钟

从 LeNet 到 VGG 的经典网络演进，理解卷积、池化、全连接的作用与设计原则。

CNN VGG 图像分类

🏔️

ResNet 与残差学习

残差网络 · 15 分钟

理解残差连接如何解决深层网络梯度消失问题，以及 ResNet 的设计哲学。

ResNet 残差连接深度网络

目标检测

🎯

两阶段检测器

R-CNN 系列 · 18 分钟

从 R-CNN 到 Faster R-CNN，理解 Region Proposal、RoI Pooling 与检测流程。

Faster R-CNN RoI Pooling Two-Stage

⚡

单阶段检测器

YOLO · SSD · 15 分钟

理解 YOLO 的网格划分与端到端检测，以及单阶段与两阶段检测器的权衡。

YOLO SSD One-Stage

🔍

Anchor Free 检测

FCOS · CenterNet · 12 分钟

理解 Anchor 的局限性，以及 FCOS 等 Anchor-Free 方法的设计思路。

FCOS Anchor-Free

📱

YOLO 最新进展

YOLOv5-v8 · 15 分钟

YOLO 系列的演进路径，以及最新版本中的 CSP、CAN-Focus 等技术改进。

YOLOv8 目标检测

图像分割

✂️

语义分割

FCN · DeepLab · 15 分钟

理解全卷积网络、膨胀卷积与 ASPP 模块，以及如何实现像素级分类。

FCN DeepLab 语义分割

🎭

实例分割与全景分割

Mask R-CNN · Panoptic FPN · 15 分钟

理解实例分割与语义分割的区别，以及 Mask R-CNN 的多任务学习设计。

Mask R-CNN 全景分割

图像生成

🎨

GAN 原理

生成对抗网络 · 18 分钟

理解生成器与判别器的对抗训练，以及 WGAN、PGGAN 等改进技术。

GAN 生成模型 WGAN

🖌️

Diffusion Model

扩散模型 · 20 分钟

理解前向扩散与反向去噪过程，以及 DDPM、Stable Diffusion 的原理。

Diffusion DDPM Stable Diffusion