贝叶斯网络

朴素贝叶斯

输入: 线性可分训练集 , 其中 .
分别是定义在 上的随机向量和随机变量.

条件独立性

朴素贝叶斯的基本假设是条件独立性:

  • 优点: 这是较强的假设. 朴素贝叶斯法简单高效.
  • 缺点: 牺牲了一定的分类准确率.

贝叶斯估计

  • 先验概率分布的贝叶斯估计:

  • 条件概率分布的贝叶斯估计:

    其中, . 当 时, 是极大似然估计. 当 时, 为拉普拉斯平滑(Laplace smoothing)

Remark: 贝叶斯派思考问题的模式: 先验分布 + 样本信息 后验分布

贝叶斯定理

  • 后验概率分布
  • 后验概率最大化 原理: 后验概率最大化, 等价于0-1损失函数的期望风险最小化

Example

(来自北大<机器学习与自然语言处理>的PPT)

其中, 有可能概率为0, 需要去0化

贝叶斯网络

定义

: 贝叶斯网络(Bayesian Network)

:有向无环图 (Directed Acyclic Graphical model, DAG)

的结点:随机变量

的边:结点间的有向依赖

:所有条件概率分布的参数集合

结点的条件概率:

每个结点所需参数的个数:

若结点的数目是,结点和的可取值数目都是

一个简单的贝叶斯网络

  • !

全连接贝叶斯网络

  • 每一对结点之间都有边连接

    一个"正常"的贝叶斯网络

  • 有些边缺失
  • 独立
  • 给定的条件下独立

条件独立判定

1. tail-to-tail

  • 给定的条件下, 被阻断(blocked), 是独立的

2. head-to-tail

  • 给定的条件下, 被阻断(blocked), 是独立的

3. head-to-head

  • 未知的条件下, 被阻断(blocked), 是独立的

有向分离

推广到结点集, 有向分离(D-separation): 对于任意的结点集A,B,C,考察所有通过A中任意结点到B中任意结点的路径,若要求A,B条件独立,则需要所有的路径都被阻断(blocked),即满足下列两个前提之一: 1) A和B的“head-to-tail型”和“tail-to-tail型”路径都通过C;
2) A和B的“head-to-head型”路径不通过C以及C的子孙;

图(a), 在tail-to-tail中, f没有阻断; 在head-to-head中, e阻断, 然而它的子孙c没有阻断, 即e所在的结点集没有阻断; 因此, 结点a, b关于c不独立. 图(b), 在tail-to-tail中, f阻断; 因此, 结点a,b关于f 独立. 在head-to-head中, e和它的子孙c都阻断; 因此, 结点a,b关于e独立.

特殊的贝叶斯网络

1. 马尔科夫模型

  • 结点形成一条链式网络,称作马尔科夫模型
  • 由D-separation可知, 当给定时, 条件独立; 即, 只与有关,与无关

2. 隐马尔科夫模型

Hidden Markov Model

隐马尔科夫模型

3. 马尔科夫毯

Markov Blanket : 一个结点的Markov Blanket是它的parents,children以及spouses(孩子的其他parent)


反馈与建议

参考文献

results matching ""

    No results matching ""