贝叶斯网络
朴素贝叶斯
输入: 线性可分训练集 , 其中 .
分别是定义在 上的随机向量和随机变量.
条件独立性
朴素贝叶斯的基本假设是条件独立性:
- 优点: 这是较强的假设. 朴素贝叶斯法简单高效.
- 缺点: 牺牲了一定的分类准确率.
贝叶斯估计
先验概率分布的贝叶斯估计:
条件概率分布的贝叶斯估计:
其中, . 当 时, 是极大似然估计. 当 时, 为拉普拉斯平滑(Laplace smoothing)
Remark
: 贝叶斯派思考问题的模式:
先验分布 + 样本信息 后验分布
贝叶斯定理
- 后验概率分布
- 后验概率最大化 原理: 后验概率最大化, 等价于0-1损失函数的期望风险最小化
Example
(来自北大<机器学习与自然语言处理>的PPT)
其中, 有可能概率为0, 需要去0化
贝叶斯网络
定义
: 贝叶斯网络(Bayesian Network)
:有向无环图 (Directed Acyclic Graphical model, DAG)
的结点:随机变量
的边:结点间的有向依赖
:所有条件概率分布的参数集合
结点的条件概率:
每个结点所需参数的个数:
若结点的数目是,结点和的可取值数目都是
一个简单的贝叶斯网络
- !
全连接贝叶斯网络
- 每一对结点之间都有边连接
一个"正常"的贝叶斯网络
- 有些边缺失
- 独立
- 在给定的条件下独立
条件独立判定
1. tail-to-tail
- 在给定的条件下, 被阻断(blocked), 是独立的
2. head-to-tail
- 在给定的条件下, 被阻断(blocked), 是独立的
3. head-to-head
- 在未知的条件下, 被阻断(blocked), 是独立的
有向分离
推广到结点集, 有向分离(D-separation):
对于任意的结点集A,B,C,考察所有通过A中任意结点到B中任意结点的路径,若要求A,B条件独立,则需要所有的路径都被阻断(blocked),即满足下列两个前提之一:
1) A和B的“head-to-tail型”和“tail-to-tail型”路径都通过C;
2) A和B的“head-to-head型”路径不通过C以及C的子孙;
图(a), 在tail-to-tail中, f没有阻断; 在head-to-head中, e阻断, 然而它的子孙c没有阻断, 即e所在的结点集没有阻断; 因此, 结点a, b关于c不独立. 图(b), 在tail-to-tail中, f阻断; 因此, 结点a,b关于f 独立. 在head-to-head中, e和它的子孙c都阻断; 因此, 结点a,b关于e独立.
特殊的贝叶斯网络
1. 马尔科夫模型
- 结点形成一条链式网络,称作马尔科夫模型
- 由D-separation可知, 当给定时, 与 条件独立; 即, 只与有关,与无关
2. 隐马尔科夫模型
Hidden Markov Model
3. 马尔科夫毯
Markov Blanket : 一个结点的Markov Blanket是它的parents,children以及spouses(孩子的其他parent)
反馈与建议
- 微博:@Girl_AI