Bayesian Neural Network（BNN）

Bayesian Neural Network（BNN）

Introduction

一种将Bayes和NN结合的方法，用于量化NN的inference的不确定性，将NN的参数看作为一种符合某种distributed的一种变量，简单的结构如下图所示：

BNN的方法相对于传统的NN存在以下的区别：

传统的NN会去找到weight的参数，但是BNN找的是每一个参数的分布。
estimator不一样，对哦于传统的NN，使用 maximum likelihood estimators （MLE），但是BNN要用maximum a posteriori (MAP，最大后验概率) 或者predictive distribution。
优化的方法不同，传统的NN一般会用基于梯度这一类的微分的方法，但是BNN会使用Markov Chain Monte Carlos（MCMC）、Variational Inference或者Normalizing Flows这一类的方法。

Statical Uncertainty & Epistemic Uncertainty

对于BNN两个重要的指标，Statical Uncertainty主要是指同一个model在多次的inference的时候，每一次都会因为参数的随机导致输出不一样，这个指标反应这种随机性导致的结果的不确定性。

Epistemic Uncertainty也被称为Systematic Uncertainty，表示在经过多次的训练，系统性能的变化。

Property

Advantages

BNN具有非常好的Robust性质，可以很好地避免过拟合。
可以对于uncertainty进行量化。

Limitations

优化的方法很复杂，MCMC比梯度算法要复杂很多。
需要较长的时间收敛。

Reference

WONG, Yeung. 《Why You Should Use Bayesian Neural Network?》 Medium, 2021年10月29日. https://towardsdatascience.com/why-you-should-use-bayesian-neural-network-aaf76732c150.
《Maximum Likelihood Estimation》. 收入 Wikipedia, 2022年8月14日. https://en.wikipedia.org/w/index.php?title=Maximum_likelihood_estimation&oldid=1104423043.