・信念
現在までの制御と観測の情報に基づいて、現在の状態の確率分布を予測したもの
bel(xt) = p(xt | u1:t, z1:t)
bel'(xt) = p(xt | u1:t, z1:t-1)
・やりたいこと
時刻tの制御と観測の情報に基づいて、信念を更新したい
・導出手順
bel(xt)をbel'(xt)で表す
bel'(xt)をbel(xt-1)で表す
・導出
bel(xt) = p(xt | u1:t, z1:t)
= p(xt | u1:t, z1:t-1, zt)
= p(zt | xt, u1:t, z1:t-1) * p(xt | u1:t, z1:t-1) / p(zt | u1:t, z1:t-1)
= η * p(zt | xt, u1:t, z1:t-1) * bel'(xt)
= η * p(zt | xt) * bel'(xt)
bel'(xt) = p(xt | u1:t, z1:t-1)
= ∫ p(xt | xt-1, u1:t, z1:t-1) * p(xt-1| u1:t, z1:t-1) dxt-1
= ∫ p(xt | xt-1, ut) * bel(xt-1) dxt-1