・信念
現在までの制御と観測の情報に基づいて、現在の状態の確率分布を予測したもの
bel(xt) = p(xt | u1:t, z1:t)
bel'(xt) = p(xt | u1:t, z1:t-1)

・やりたいこと
時刻tの制御と観測の情報に基づいて、信念を更新したい

・導出手順
bel(xt)をbel'(xt)で表す
bel'(xt)をbel(xt-1)で表す

・導出
bel(xt) = p(xt | u1:t, z1:t)
 = p(xt | u1:t, z1:t-1, zt)
 = p(zt | xt, u1:t, z1:t-1) * p(xt | u1:t, z1:t-1) / p(zt | u1:t, z1:t-1)
 = η * p(zt | xt, u1:t, z1:t-1) * bel'(xt)
 = η * p(zt | xt) * bel'(xt)

bel'(xt) = p(xt | u1:t, z1:t-1)
 = ∫ p(xt | xt-1, u1:t, z1:t-1) * p(xt-1| u1:t, z1:t-1) dxt-1
 = ∫ p(xt | xt-1, ut) * bel(xt-1) dxt-1