← 返回首页

计算机视觉

掌握图像处理与视觉理解的核心理论与应用技术

图像基础

🖼️
图像表示与预处理
基础 · 10 分钟
理解图像的矩阵表示、颜色空间(RGB、HSV、灰度)转换,以及常见预处理方法。
图像表示 颜色空间 预处理
🔧
图像增强技术
数据增强 · 12 分钟
几何变换、色彩抖动、Cutout、Mixup 等数据增强技术的原理与实践。
数据增强 Mixup Cutout

图像分类

📊
经典 CNN 架构
LeNet · AlexNet · VGG · 15 分钟
从 LeNet 到 VGG 的经典网络演进,理解卷积、池化、全连接的作用与设计原则。
CNN VGG 图像分类
🏔️
ResNet 与残差学习
残差网络 · 15 分钟
理解残差连接如何解决深层网络梯度消失问题,以及 ResNet 的设计哲学。
ResNet 残差连接 深度网络

目标检测

🎯
两阶段检测器
R-CNN 系列 · 18 分钟
从 R-CNN 到 Faster R-CNN,理解 Region Proposal、RoI Pooling 与检测流程。
Faster R-CNN RoI Pooling Two-Stage
单阶段检测器
YOLO · SSD · 15 分钟
理解 YOLO 的网格划分与端到端检测,以及单阶段与两阶段检测器的权衡。
YOLO SSD One-Stage
🔍
Anchor Free 检测
FCOS · CenterNet · 12 分钟
理解 Anchor 的局限性,以及 FCOS 等 Anchor-Free 方法的设计思路。
FCOS Anchor-Free
📱
YOLO 最新进展
YOLOv5-v8 · 15 分钟
YOLO 系列的演进路径,以及最新版本中的 CSP、CAN-Focus 等技术改进。
YOLOv8 目标检测

图像分割

✂️
语义分割
FCN · DeepLab · 15 分钟
理解全卷积网络、膨胀卷积与 ASPP 模块,以及如何实现像素级分类。
FCN DeepLab 语义分割
🎭
实例分割与全景分割
Mask R-CNN · Panoptic FPN · 15 分钟
理解实例分割与语义分割的区别,以及 Mask R-CNN 的多任务学习设计。
Mask R-CNN 全景分割

图像生成

🎨
GAN 原理
生成对抗网络 · 18 分钟
理解生成器与判别器的对抗训练,以及 WGAN、PGGAN 等改进技术。
GAN 生成模型 WGAN
🖌️
Diffusion Model
扩散模型 · 20 分钟
理解前向扩散与反向去噪过程,以及 DDPM、Stable Diffusion 的原理。
Diffusion DDPM Stable Diffusion