监督学习
线性回归详解
从损失函数到梯度下降,深入理解线性回归数学推导。线性回归是监督学习中最基础的算法之一,理解其原理对学习其他算法至关重要。
逻辑回归与分类
理解 sigmoid 函数、交叉熵损失,以及如何将回归问题转化为分类问题。
决策树
理解信息熵、基尼系数的概念,以及如何通过特征分裂构建决策树。
朴素贝叶斯
基于贝叶斯定理的分类算法,理解条件独立假设与拉普拉斯平滑。
无监督学习
K-Means 聚类
经典的聚类算法,理解 K 值选择、肘部法则与算法收敛性。
主成分分析 PCA
理解方差最大化、特征值分解,以及如何进行数据降维与可视化。
集成学习
随机森林
理解 Bootstrap 与 Bagging 机制,以及如何通过集成多棵决策树提升模型鲁棒性。
梯度提升树 GBDT
理解 Boosting 序列学习机制,残差拟合,以及 XGBoost、LightGBM 的核心优化。
模型评估与优化
模型评估指标
准确率、精确率、召回率、F1、AUC 等指标解读,以及如何根据业务场景选择合适的指标。
交叉验证
K-Fold、Stratified K-Fold、留一法等验证策略,以及如何避免数据泄露。