Processing math: 100%

建炎以来系年要录：总结篇

Posted on 2019-06-22 | Edited on 2019-07-16 | In 统计学习方法 | Comments:

生成模型和判别模型

生成模型

混合高斯模型和其他混合模型
隐马尔可夫模型 (HMM)
朴素贝叶斯
LDA 文档主题生成模型

生成式模型 由数据学习联合概率分布 $P(X, Y)$ ，然后求出条件概率分布 $P(Y|X)=\frac{P(X,Y)}{P(X)}$ 作为预测的模型，即生成模型。

能还原出联合概率分布 $P(X, Y)$
收敛速度更快
当存在隐变量时只能用生成方法学习

判别模型

KNN
感知机
决策树
最大熵模型
Logistic 回归
线性判别分析 (LDA)
支持向量机 (SVM)
Boosting
条件随机场算法 (CRF)
线性回归
神经网络

判别式模型 直接学习决策函数 $f(X)$ 或条件概率分布 $P(Y|X)$ 作为预测的模型。

往往准确率更高
可以简化学习问题

学习策略（损失函数）

学习算法

生成模型朴素贝叶斯和 HMM 的监督学习，最优解即极大似然估计值，可以由概率计算公式直接计算。

判别模型中，感知机，逻辑斯蒂回归，最大熵模型，条件随机场都可以用 SGD，拟牛顿法学习。这些都是无约束最优化问题。
判别模型中 SVM，可以解凸二次规划的对偶问题。有序列最小最优化算法等方法。
判别模型中决策树，是基于启发式算法，正则化的极大似然估计。
判别模型中，提升方法式加法模型，损失函数是 指数损失函数，学习方法是启发式的从前往后逐步学习模型。
判别模型中，EM 算法是利用迭代求解隐变量概率模型。

上述模型中，SVM/LR/ 最大熵 /CRF 四个是凸优化问题，全局最优解保证存在，其他问题不是凸优化问题，不做保证。

Powered By Valine
v1.5.2