状态空间模型摘要

内容

1. 贝叶斯过滤器

在本文中,我总结了一些著名的状态空间模型。这里我不会详细展开,而是专注于整体地图以获得概览。所有这些状态空间模型都源自贝叶斯滤波器。在这些模型中,考虑了两个随机过程。第一个过程是状态 xₜx_t,第二个过程是观测测量 yₜy_t,其中ₜ表示“时间”,但通常这些过程不仅限于时间序列。我们对状态的真实值感兴趣,但我们只能观察到观测值。因此,状态空间模型旨在基于观测值估计状态。需要解决两种关系:

  • 状态到状态的概率 P(xt∣x1:t−1)P(x_t | x_{1:t-1})
  • 状态到观测的概率 P(yt∣xt)P(y_t | x_t) 任何两个观测之间都没有 直接 关系。一个常见的假设是马尔可夫性质,即假设当前状态仅取决于前一个状态,即 P(xt∣x1:t−1)=P(xt∣xt−1)P(x_t | x_{1:t-1})=P(x_t|x_{t-1})。

2. 预测和更新

状态空间模型具有递归两步的在线算法。预测是基于分布p(xt−1∣y1:t−1)来估计后验分布p(xt∣y1:t−1),其中分布p(xt−1∣y1:t−1)根据状态转移概率P(xt∣xt−1)进行。从数学上讲,

p(xt∣y1:t−1) =∫p(xt∣xt−1)p(xt−1∣y1:t−1)dxt−1 p(x_t|y_{1:t-1})= ∫p(x_t|x_{t-1}) p(x_{t-1}|y_{1:t-1}) dx_{t-1}

更新是基于最新观测 yty_t 更新先前分布。数学上,

p(xt∣y1:t)=p(yt∣xt)p(xt∣y1:t−1)/p(yt)∝p(yt∣xt)p(xt∣y1:t−1) p(x_t | y_{1:t})= p(y_t|x_t) p(x_t|y_{1:t-1}) /p(y_t) \propto p(y_t|x_t) p(x_t|y_{1:t-1})

3. 建模考虑

贝叶斯滤波器通过后验分布p(xt∣y1:t)p(x_t | y_{1:t})估计xtx_t。通常,在建模实际问题时,无法直接获得状态到状态概率和状态到观测概率。相反,它们应该从预测模型xt=f(xt−1)x_t=f(x_{t-1})和测量模型yt=g(xt)y_t=g(x_t)中推断出来。而且必须回答一系列问题:

  • Is state xtx_t discrete or continuous?
  • What is the distribution of xtx_t?
  • Is the prediction model linear or nonlinear?
  • Is the measurement model linear or nonlinear? According to different answers to these questions, we have different filters as follows.

4. 贝叶斯滤波器的分类

根据状态 xtx_t 是离散还是连续,贝叶斯滤波器分为离散滤波器和连续滤波器。当状态 xtx_t 只能取离散值时,状态转移概率可以用转移矩阵 A=[ai,j]A=[a_i,j] 表示,其中 ai,j=P(xt=j∣xt−1=i)。

基于 xtx_t 的分布是否假定为特定格式,连续贝叶斯滤波器分为参数化滤波器和非参数化滤波器。例如,在高斯滤波器中,假定 xtx_t 的分布为多元正态分布。基于这一假设,后验分布 p(xt∣y1:t)p(x_t|y_{1:t}) 可以被明确地以闭合形式表达。另一方面,非参数化滤波器不对 xtx_t 的分布做任何假设,而是使用一些技术来近似分布。例如,xtx_t 的分布可以用直方图(直方图滤波器)或从目标分布中抽取的大量样本(粒子滤波器)来表示。非参数化滤波器近似分布,并且不对预测模型 xt=f(xt−1)x_t=f(x_{t-1}) 和测量模型 yt=g(xt)y_t=g(x_t) 施加任何限制,因此在各种情况下具有灵活性。然而,由于没有闭合形式表达,计算负载很重,近似越好,计算负担就越重。

高斯滤波器假设 xtx_t 的分布为多元正态分布。在经典卡尔曼滤波器中,预测模型 xt=f(xt−1),测量模型 yt=g(xt) 被假定为线性,以保持正态性。具体来说,xt=Atxt−1+ϵt,yt=Bxt+δt。卡尔曼滤波器的衍生物,如扩展卡尔曼滤波器和无迹卡尔曼滤波器,放宽了线性关系的假设,但通过泰勒展开等线性化技术进行近似。信息滤波器及其衍生物与卡尔曼滤波器家族本质上相同,多元正态分布的信息表达为Ω=Σ−1,ξ=Ωμ。

混合滤波器是参数化滤波器和非参数化滤波器的混合体,其中假定某些状态维度以特定格式表示,而其他维度则采用非参数化技术表达。

总结
这篇文章总结了贝叶斯滤波器的相关内容。文章介绍了贝叶斯滤波器的基本概念,包括状态空间模型、预测和更新过程以及建模考虑。贝叶斯滤波器根据状态的离散或连续性分为离散和连续滤波器,连续滤波器又分为参数化和非参数化滤波器。高斯滤波器假设状态服从多元正态分布,而非参数化滤波器则通过直方图或粒子滤波等技术来近似状态分布。文章还提到了卡尔曼滤波器及其衍生物,以及混合滤波器的概念。