机器学习基础

📈

线性回归详解

算法原理 · 12 分钟

从损失函数到梯度下降，深入理解线性回归数学推导。线性回归是监督学习中最基础的算法之一，理解其原理对学习其他算法至关重要。

回归梯度下降 MSE

🎯

逻辑回归与分类

分类算法 · 10 分钟

理解 sigmoid 函数、交叉熵损失，以及如何将回归问题转化为分类问题。

分类 sigmoid 交叉熵

🌳

决策树

树模型 · 15 分钟

理解信息熵、基尼系数的概念，以及如何通过特征分裂构建决策树。

决策树信息熵基尼系数

🎲

朴素贝叶斯

概率模型 · 8 分钟

基于贝叶斯定理的分类算法，理解条件独立假设与拉普拉斯平滑。

贝叶斯概率 NLP

📊

K-Means 聚类

聚类算法 · 10 分钟

经典的聚类算法，理解 K 值选择、肘部法则与算法收敛性。

聚类 K-Means

🎨

主成分分析 PCA

降维技术 · 12 分钟

理解方差最大化、特征值分解，以及如何进行数据降维与可视化。

降维 PCA 特征工程

🌲

随机森林

Bagging · 12 分钟

理解 Bootstrap 与 Bagging 机制，以及如何通过集成多棵决策树提升模型鲁棒性。

集成随机森林 Bagging

🚀

梯度提升树 GBDT

Boosting · 15 分钟

理解 Boosting 序列学习机制，残差拟合，以及 XGBoost、LightGBM 的核心优化。

Boosting GBDT XGBoost

📏

模型评估指标

工程实践 · 10 分钟

准确率、精确率、召回率、F1、AUC 等指标解读，以及如何根据业务场景选择合适的指标。

评估指标 AUC F1 Score

🔀

交叉验证

模型验证 · 8 分钟

K-Fold、Stratified K-Fold、留一法等验证策略，以及如何避免数据泄露。

交叉验证过拟合

监督学习

无监督学习

集成学习

模型评估与优化