{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Kálmán-szűrés 1.\n", "\n", "## Rövid áttekintés\n", "\n", "* Rudolf Emil Kálmán (1930-[2016](http://www.ematlap.hu/index.php/tudomany-tortenet-2016-09/347-kalman-rudolf-es-a-kalman-szuro)) magyar származású amerikai villamosmérnök, matematikus publikálja az elméletet (1960) \n", "* Első alkalmazása: ember nélküli amerikai Hold-szonda (1963)\n", "* Navigációs és mérnöki alkalmazások\n", "* Szenzor adatok fúziója (radar, lézerszkenner, kamera, INS,…)\n", "* GNSS vevők, okostelefonok, számítógépek, játékok, stb. elmaradhatatlan része\n", "* Tőzsde előrejelzés, idősor elemzés, függvény approximáció\n", "\n", "Az eredeti [publikáció](https://www.cs.unc.edu/~welch/kalman/media/pdf/Kalman1960.pdf) közel 25 ezer hivatkozást kapott. Pillantsunk bele:\n", "\n", "\n", "## Meg lehet érteni?\n", "\n", "A Kálmán-szűrés olyan algoritmus, amely valamely lineáris dinamikus rendszerben egzakt következetést tesz lehetővé, amely a rejtett Markov-modellhez hasonló Bayes-féle modell, azonban a rejtett változók állapottere folytonos, és minden rejtett és megfigyelhető változó (gyakran többváltozós) normális eloszlású.\n", "\n", "A fenti definíció korrekt, de a legtöbbünk számára nem teszi érthetővé, hogy **valójában** mi is a Kálmán-szűrő. Ezért a megértés érdekében egyesével sorra vesszük a Kálmán-szűrő legfontosabb sajátosságait:\n", "\n", "* rekurzív\n", "* optimális\n", "* közvetett (rejtett) állapotot becsül\n", "\n", "Ezek után egy geodéziai szempontból talán könnyebben érthető módon levezetjük a Kálmán-szűrő egyenleteit és egy egyszerű navigációs példán keresztül mutatjuk be a Kálmán-szűrő működését." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Rekurzív becslés\n", "\n", "A legegyszerűbb példa az, amikor valamely egyetlen $x$ változóval jellemezhető rendszer állapotát mérjük egymás utáni $t_1, t_2, ... , t_n$ időpontokban. \n", "\n", "A méréseink legyenek $x_1, x_2, ... , x_n$.\n", "\n", "Az állapot legjobb becslése ez esetben (Gauss-eloszlást feltételezve) a jól ismert számtani közép vagy *átlag*:\n", "\n", "$$ \\mu_n = \\frac{1}{n} \\sum_{i=1}^n x_i.$$\n", "\n", "Tegyük fel, hogy van egy új mérésünk, $x_{n+1}$, és a célunk az állapot becslése ezen új mérés felhasználásával. Ez az $n+1$ mérésből számított átlag lesz:\n", "\n", "$$ \\mu_{n+1} = \\frac{1}{n+1} \\sum_{i=1}^{n+1} x_i.$$\n", "\n", "Viszont sokkal hatékonyabb az az eljárás, amikor felhasználjuk a már kiszámított $\\mu_n$ átlagot és csak ezt \"frissítjük\" az új mérés felhasználásával:\n", "\n", "$$ \\mu_{n+1} = \\frac{n}{n+1} \\left( \\frac{1}{n} \\sum_{i=1}^n x_i + \\frac{1}{n} x_{n+1} \\right) = \\frac{n}{n+1}\\mu_n + \\frac{1}{n+1} x_{n+1}.$$\n", "\n", "Igazából így működik a zsebszámológépünk `STAT` funkciója is: az egymás után bevitt adatok segítségével folyamatosan \"frissíti\" az átlag értékét. Ez a *rekurzív becslés* lényege: a már meglévő becslést az újabb adatok beérkezése után mindig módosítjuk, \"aktualizáljuk\". Példánkban a rekurzív állapot becslés így írható fel kicsit más alakban:\n", "\n", "$$\\mu_{n+1} = \\frac{n}{n+1}\\mu_n + \\frac{1}{n+1} x_{n+1} = \\mu_n + K(x_{n+1} - \\mu_n),$$\n", "\n", "ahol \n", "\n", "$$K = \\frac{1}{n+1}$$\n", "\n", "az ún. *erősítés*, amelyik megmondja, hogy mekkora lesz a régi átlag, azaz a $\\mu_n$ korrekciója, illetve\n", "\n", "$$x_{n+1} - \\mu_n,$$\n", "\n", "amelyik az *új információ* (idegen szóval: *innováció*), hiszen ettől függ, hogy egyáltalán változik-e az előző becslés. Ugyanis ha az új $x_{n+1}$ mérés megegyezik a régi $\\mu_n$ átlaggal, a becslésünk egyáltalán nem fog változni.\n", "\n", "Nézzük meg mindezt az alábbi számpéldán keresztül:" ] }, { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [ { "data": { "image/png": "", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "import numpy as np\n", "import matplotlib.pyplot as plt\n", "\n", "\"\"\" Kálmán-szűrő: rekurzív átlag becslés\n", "\"\"\"\n", "\n", "npt = 200\n", "x = 5 + np.random.randn(npt)\n", "n = np.arange(1,npt+1)\n", "K = 1.0/(n+1)\n", "mu = np.zeros((npt))\n", "mu[0] = x[0]\n", "\n", "for i in range(1,npt):\n", " mu[i] = mu[i-1] + K[i-1]*(x[i]-mu[i-1])\n", "\n", "plt.plot(n,x,'o',label='mérések')\n", "plt.plot(n,mu,label='átlag becslés')\n", "plt.legend()\n", "plt.title('Átlag rekurzív becslése')\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "A példa jól bemutatta a Kálmán-szűrő egyik nagyon fontos jellemzőjét: **rekurzív becslést** szolgáltat a mérések függvényében a rendszer állapotára.\n", "\n", "Most vegyük szemügyre a Kálmán-szűrés másik fontos sajátosságát: a szűrő a különböző információkat *optimális* módon hasznosítja a becslés során." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Különböző információk optimális felhasználása\n", "\n", "Tegyük fel, hogy $x$-et *két különböző eszközzel* mérjük (pl. ha $x$ távolság, akkor megmérjük mérőszalaggal és kézi lézer távmérővel is). Legyen az első eszközzel végzett mérés eredménye $x_1$, a másiké pedig $x_2$. A két mérőeszköz nem azonos pontossággal dolgozik. Ezt a tényt a méréseik különböző $\\sigma_1$ illetve $\\sigma_2$ szórásaival (középhibáival) fejezhetjük ki.\n", "\n", "Célunk az, hogy *optimális* becslést adjunk $x$-re a két $x_1$, $x_2$ mérés és $\\sigma_1$, $\\sigma_2$ szórásaik segítségével. Legyen ez a becslés a két mérés *súlyozott átlaga*:\n", "\n", "$$\\hat{x} = wx_1 + (1-w)x_2.$$\n", "\n", "A kérdés tehát az, hogy milyen $w$ súly esetén lesz az $\\hat{x}$ becslés $\\hat\\sigma$ szórása minimális?\n", "\n", "Mivel feltételezzük azt, hogy mind $x_1$, mind $x_2$ *Gauss-eloszlású*, ezért a valószínűségszámítás [nevezetes eredménye](https://www.statlect.com/probability-distributions/normal-distribution-linear-combinations) szerint a lineáris kombinációjuk is normális eloszlású lesz, amelynek a szórása\n", "\n", "$$\\hat\\sigma^2 = w^2\\sigma_1^2 + (1-w)^2 \\sigma_2^2.$$\n", "\n", "Az optimális $w_{opt}$ súly ennek a kifejezésnek a minimuma lesz, vagyis ahol a $w$ szerinti derivált zérus:\n", "\n", "$$\\frac{\\partial \\hat\\sigma^2}{\\partial w} = 2w_{opt}\\sigma_1^2-2(1-w_{opt})\\sigma_2^2 = 0.$$\n", "\n", "Az optimális súly tehát\n", "\n", "$$ w_{opt} = \\frac{\\sigma_2^2}{\\sigma_1^2+\\sigma_2^2}.$$\n", "\n", "Ezek után megadhatjuk $x$ optimális $\\hat{x}$ becslését:\n", "\n", "$$ \\hat{x} = \\frac{\\sigma_2^2}{\\sigma_1^2+\\sigma_2^2} x_1 + \\frac{\\sigma_1^2}{\\sigma_1^2+\\sigma_2^2} x_2.$$\n", "\n", "Az optimális becslés szórását is kiszámíthatjuk az alábbi összefüggéssel:\n", "\n", "$$ \\hat\\sigma^2 = \\frac{\\sigma_1^2\\sigma_2^2}{\\sigma_1^2+\\sigma_2^2}.$$\n", "\n", "Számunkra, földmérők számára egyébként ez a jól ismert súlyozott legkisebb négyzetes becslés, hiszen $\\hat{x}$ minimalizálja a javítások súlyozott négyzetösszegét:\n", "\n", "$$\\hat{x} = \\underset{x}{\\arg \\min} = \\left[ p_1 (x_1 - x)^2 + p_2 (x_2 - x)^2 \\right],$$\n", "\n", "ahol $p_1$, $p_2$ a súlyok, melyek arányosak a szórásnégyzetek reciprokaival. Valóban, a fenti kifejezést $x$ szerint deriválva és a deriváltat zérussal egyenlővé téve a \n", "\n", "$$ p_1(x_1-\\hat{x}) + p_2(x_2-\\hat{x}) = 0$$\n", "\n", "egyenletet kapjuk, melynek megoldása $\\hat{x}$-re\n", "\n", "$$ \\hat{x} = \\frac{1}{p_1+p_2}(p_1 x_1 + p_2 x_2)$$\n", "\n", "lesz, ami megegyezik a korábbi megoldással, ha $p_1=1/\\sigma_1^2$ és $p_2=1/\\sigma_2^2$." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Rekurzív optimális becslés\n", "\n", "Az előző optimális becslést fogalmazzuk át úgy, hogy rendelkezzünk először az $x_1$ méréssel, és ezt \"frissítsük\" az új $x_2$ mérés beérkezése után egy korrekcióval. Nyilván az első lépésben $\\hat{x_1} = x_1$, $\\hat\\sigma_1^2=\\sigma_1^2$, ahol az alsó index a lépésre utal. A második lépésben frissítsük a becslést\n", "\n", "$$\\hat{x}_2 = \\hat{x}_1 + \\frac{\\hat{\\sigma}_1^2}{\\hat{\\sigma}_1^2 + \\sigma_2^2} (x_2 - \\hat{x}_1),$$\n", "\n", "$$\\hat{\\sigma}_2^2 = \\left( 1 - \\frac{\\hat{\\sigma}_1^2}{\\hat{\\sigma}_1^2 + \\sigma_2^2} \\right) \\hat{\\sigma}_1^2.$$\n", "\n", "A zárójelben található $(x_2 - \\hat{x}_1)$ tényező az *új információ* (innováció), az előtte található szorzótényező, \n", "\n", "$$\\frac{\\hat{\\sigma}_1^2}{\\hat{\\sigma}_1^2 + \\sigma_2^2}$$\n", "\n", "pedig a $K$ *erősítési tényező*. Foglaljuk most össze a rekurzív optimális becslésre vonatkozó egyenleteinket:\n", "\n", "$$\\hat{x}_2 = \\hat{x}_1 + K(x_2 - \\hat{x}_1),$$\n", "\n", "$$\\hat{\\sigma}_2^2 = ( 1 - K ) \\hat{\\sigma}_1^2,$$\n", "\n", "$$K = \\frac{\\hat{\\sigma}_1^2}{\\hat{\\sigma}_1^2 + \\sigma_2^2}.$$\n", "\n", "Láthatjuk, hogy ez alakjára nézve teljesen hasonlít a korábbi rekurzív becslésre, amely így nézett ki\n", "\n", "$$\\mu_{n+1} = \\mu_n + K(x_{n+1} - \\mu_n),$$\n", "\n", "csak most sikerült megtalálni a $K$ erősítési tényező *optimális* értékét annak érdekében, hogy a becslés hibája (szórása) a lehető legkisebb legyen. Ezt az optimális becslést folyamatosan elő tudjuk állítani mindig amikor egy új mérés érkezik.\n", "\n", "Már most megjegyezzük, hogy amikor az állapotot nem egyetlen $x$ változóval, hanem több változóból álló $\\mathbf{x} = (x_1, x_2, ...)$ vektorral írhatjuk le, akkor is hasonló az eljárás, csak ez esetben varianciák helyett kovariancia mátrixokkal fogunk dolgozni. Ez többek között azt vonja majd maga után, hogy reciprok képzés helyett inverz képzésre lesz szükség." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Közvetett állapot becslés\n", "\n", "Idáig feltételeztük azt, hogy a rendszer $x$ állapota *közvetlenül* mérhető. A gyakorlatban sokszor erre nincs lehetőségünk, csak arra, hogy a rendszer állapotától függő valamilyen $\\mathbf{z}$ mennyiségeket megmérjünk. A geodéziában ezt a helyzetet igen jól ismerjük: ez a közvetett mérések feldolgozásának (II. kiegyenlítési csoport) esete. Ezt a feladatot oldja meg a Kálmán-szűrő is: a közvetlenül nem mérhető (vagyis \"rejtett\") rendszer állapotot szeretnénk becsülni a méréseink alapján. \n", "\n", "Először a *statikus* rendszerekkel foglalkozunk, vagyis olyanokkal, amelyekben a rendszer állapota időben nem változik. De mind a statikus, mind a dinamikus (időben változó állapotú) rendszerek esetében feltételezünk egy nagyon fontos dolgot: a rendszer $\\mathbf{x}$ állapota **lineáris** modellen keresztül kapcsolódik a mérhető $\\mathbf{z}$ mennyiségekhez:\n", "\n", "$$ \\mathbf{z} = \\mathbf{H} \\mathbf{x} + \\mathbf{r}.$$\n", "\n", "Ebben az összefüggésben a $\\mathbf{H}$ mátrix a mérési modell (számunkra ez a jól ismert alakmátrix), továbbá $\\mathbf{r}$ a zérus átlagú ($\\bar{\\mathbf{r}}=\\mathbf{0}$) és Gauss-eloszlású mérési hibákat (mérési zajt) jellemzi. Ezeket a hibákat (zajt) az $\\mathbf{R}$ *zaj kovariancia mátrix* írja le\n", "\n", "$$ \\mathbf{R} = \\mathbb{E}\\left[ (\\mathbf{r} - \\bar{\\mathbf{r}}) (\\mathbf{r} - \\bar{\\mathbf{r}})^T \\right]$$\n", "\n", "ahol $\\mathbb{E}[.]$ a várható értéket jelöli. Célunk optimális $\\hat{\\mathbf{x}}$ becslést adni a rendszer állapotára, amely minimalizálja a kovariancia mátrix inverzével súlyozott mérési zajt (mérési hibákat). Ez az igen jól ismert paraméteres kiegyenlítés (a paraméterek vektora most a rendszer $\\mathbf{x}$ állapota), ahol a $\\mathbf{P}$ súlymátrix arányos a zaj kovariancia mátrix $\\mathbf{R}^{-1}$ inverzével." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Rekurzív becslés**\n", "\n", "A hagyományos paraméteres kiegyenlítéssel szemben most tételezzük fel azt, hogy a mérések folyamatosan (nem egyszerre) érkeznek. Minden egyes $k$ mérési időpontban érkezik egy új $\\mathbf{z}_k$ mérés és szeretnénk a rendszer $\\hat{\\mathbf{x}}_k$ állapotára, illetve a rendszer állapot $\\hat{\\mathbf{P}}_k$ kovariancia mátrixára optimális becslést adni Ezt a minimalizációs feladatot kell tehát megoldani:\n", "\n", "$$\\hat{\\mathbf{x}}_k = \\underset{x}{\\arg \\min} = \\left[ (\\mathbf{z}_k-\\mathbf{H}_k \\mathbf{x})^T \\mathbf{R}_k^{-1} (\\mathbf{z}_k-\\mathbf{H}_k \\mathbf{x}) \\right].$$\n", "\n", "Ennek a minimalizációs feladatnak a megoldása a *statikus Kálmán-szűrő*. A szűrő kiszámítja az új $\\hat{\\mathbf{x}}_k$ becslést és annak $\\hat{\\mathbf{P}}_k$ kovariancia mátrixát az előző $\\hat{\\mathbf{x}}_{k-1}$, $\\hat{\\mathbf{P}}_{k-1}$ becslésekből és a $\\mathbf{z}_k$ mérésből valamint annak $\\mathbf{R}_k$ kovariancia mátrixából. \n", "\n", "Megemlítjük, hogy tipikus példa a statikus Kálmán-szűrésre a fix helyzetű GNSS vevő méréseinek a feldolgozása. Ez esetben a rejtett állapot ($\\mathbf{x}$ paraméter vektor) a vevő ismeretlen koordinátája és a vevő órájának igazítatlansága. A $\\mathbf{z}$ mérések pedig a műhold-vevő áltávolságok. Ha az összes mérés egyszerre rendelkezésre áll, akkor ez a hagyományos legkisebb négyzetes kiegyenlítéssel megoldható. Amennyiben a mérések epochánként folyamatosan érkeznek, akkor rekurzív kiegyenlítésre, vagyis statikus Kálmán-szűrésre van szükség.\n", "\n", "A következőkben levezetjük a statikus Kálmán-szűrő egyenleteit a geodéziában ismert *csoportokban történő kiegyenlítés* segítségével. Látni fogjuk, hogy a statikus Kálmán szűrő összefüggései igazából teljesen megegyeznek a közvetítő egyenletekkel törénő kiegyenlítés során alkalmazott folyamatos csoportképzés egyenleteivel.\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Statikus Kálmán-szűrő egyenletei\n", "\n", "A levezetésben követni fogjuk Detrekői: Kiegyenlítő számítások tankönyvének 5.8.2-es pontjában alkalmazott gondolatmenenetet. A jelöléseket viszont a Kálmán-szűrő esetében szokásos jelöléshez közelítjük, így könnyebben látjuk majd a kapcsolatot a két eljárás között. Csak a lineáris esetre korlátozódunk, tehát nincs szükség a közvetítő egyenleteknek a paraméterek előzetes értékei helyén végzett linearizációjára.\n", "\n", "A folyamatos csoportképzés esetében a méréseket különböző időben végezzük, s a később végzett mérések kiegyenlítésekor felhasználjuk a korábban végzett mérések eredményeit is. Abból indulunk ki, hogy az $i=1$ alkalommal a $\\mathbf{z}_1$ mérési eredmények ($n$ db.) alapján meghatároztuk a kiegyenlített $\\mathbf{x}_1$ paramétereket és azok $\\mathbf{P}_{11}$ kovariancia mátrixát a mérések $\\mathbf{R}_{11}$ kovariancia mátrixát felhasználva, a \n", "\n", "$$ \\mathbf{r}_1 = \\mathbf{z}_1 - \\mathbf{H}_1\\mathbf{x}_1 $$\n", "\n", "lineáris javítási (reziduál) egyenletekből kiindulva az\n", "\n", "$$ \\mathbf{N}_1 \\mathbf{x}_1 - \\mathbf{H}_1^T\\mathbf{R}_{11}^{-1}\\mathbf{z}_1 = \\mathbf{0}$$\n", "\n", "normálegyenletek alapján. Ha az $ \\mathbf{N}_1= \\mathbf{H}_1^T\\mathbf{R}_{11}^{-1}\\mathbf{H}_1$ normálegyenlet együtthatómátrixa nem szinguláris, akkor az ismeretlen paraméterek értéke\n", "\n", "$$\\mathbf{x}_1 = \\mathbf{N}_1^{-1}\\mathbf{H}_1^T\\mathbf{R}_{11}^{-1}\\mathbf{z}_1 .$$\n", "\n", "A kiegyenlített paraméterek kovariancia mátrixa\n", "\n", "$$ \\mathbf{P}_{11} = \\mathbf{N}_1^{-1} = (\\mathbf{H}_1^T\\mathbf{R}_{11}^{-1}\\mathbf{H}_1)^{-1}.$$\n", "\n", "A kiegyenlítés elvégzése után az $i+1=2$ alkalommal további ($s$ db.) mérést végzünk, ezek eredménye $\\mathbf{z}_2$, kovariancia mátrixa $\\mathbf{R}_{22}$. Tételezzük fel, hogy ezek a mérések függetlenek a korábbi mérésektől. Határozzuk meg az új $\\mathbf{x}_2$ paramétervektort, a javítások (reziduálok) új $\\mathbf{r}_r$ vektorát és a kiegyenlített paraméterek új $\\mathbf{P}_{22}$ kovariancia mátrixát." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Az együttes feldolgozáskor a normálegyenlet\n", "\n", "$$ (\\mathbf{H}_1^T\\mathbf{R}_{11}^{-1}\\mathbf{H}_1 + \\mathbf{H}_2^T\\mathbf{R}_{22}^{-1}\\mathbf{H}_2)\\mathbf{x}_2 - ( \\mathbf{H}_1^T\\mathbf{R}_{11}^{-1}\\mathbf{z}_1 + \\mathbf{H}_2^T\\mathbf{R}_{22}^{-1}\\mathbf{z}_2) = \\mathbf{0}.$$\n", "\n", "A megoldás érdekében vezessük be az új $\\mathbf{y}$ ($s$ méretű) paramétert:\n", "\n", "$$ \\mathbf{y}= \\mathbf{R}_{22}^{-1}\\mathbf{r}_2 = \\mathbf{R}_{22}^{-1}\\mathbf{z}_2 -\\mathbf{R}_{22}^{-1}\\mathbf{H}_2 \\mathbf{x}_2 .$$\n", "\n", "Ekkor az $\\mathbf{y}$ segítségével a\n", "\n", "$$ \\mathbf{r}_2 = \\mathbf{z}_2 - \\mathbf{H}_2\\mathbf{x}_2 $$\n", "\n", "javítási (reziduál) egyenlet átalakítható csak paramétereket tartalmazó kényszerfeltételi egyenletté:\n", "\n", "$$ \\mathbf{R}_{22}\\mathbf{y}= \\mathbf{z}_2 - \\mathbf{H}_2\\mathbf{x}_2,$$\n", "\n", "amiből a szokásos felépítésű kényszerfeltételi egyenlethez jutunk:\n", "\n", "$$ \\mathbf{z}_2 - \\mathbf{H}_2\\mathbf{x}_2 - \\mathbf{R}_{22}\\mathbf{y} = \\mathbf{0}$$\n", "\n", "A bevezetett $\\mathbf{y}$ vektort felhasználva a normálegyenlet átalakítható:\n", "\n", "$$(\\mathbf{H}_1^T\\mathbf{R}_{11}^{-1}\\mathbf{H}_1)\\mathbf{x}_2 - \\mathbf{H}_2^T\\mathbf{y} - \\mathbf{H}_1^T\\mathbf{R}_{11}^{-1}\\mathbf{z}_1 = \\mathbf{0}$$" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "A kényszerfeltételi egyenleteket hozzávéve ehhez az átalakított normálegyenlethez a következő $n+s$ méretű blokkos egyenletrendszerhez jutunk:\n", "\n", "$$\\begin{bmatrix} \\mathbf{H}_1^T\\mathbf{R}_{11}^{-1}\\mathbf{H}_1 & - \\mathbf{H}_2^T \\\\ - \\mathbf{H}_2 & - \\mathbf{R}_{22}\\end{bmatrix} \\begin{bmatrix} \\mathbf{x}_2\\\\ \\mathbf{y}\\end{bmatrix} = \\begin{bmatrix} \\mathbf{H}_1^T\\mathbf{R}_{11}^{-1}\\mathbf{z}_1\\\\ -\\mathbf{z}_2\\end{bmatrix}. $$\n", "\n", "Az $\\mathbf{x}_2$-re vonatkozó megoldás meghatározása érdekében invertáljuk az egyenletrendszer $\\mathbf{A}$ blokkos együttható mátrixát. Ehhez a Gauss-Jordan kiküszöbölést fogjuk alkalmazni. Az inverz meghatározása során kiindulunk a kibővített\n", "\n", "$$\\begin{bmatrix} \\mathbf{A} & | & \\mathbf{I} \\end{bmatrix} $$\n", "\n", "mátrixból és a Gauss-Jordan eliminációval ebből kihozzuk a\n", "\n", "$$\\begin{bmatrix} \\mathbf{I} & | & \\mathbf{A}^{-1} \\end{bmatrix} $$\n", "\n", "alakot ($\\mathbf{I}$ az egységmátrixot jelöli).\n", "\n", "A kiinduló kibővített mátrix (az egyszerűsítés érdekében $\\mathbf{N}=\\mathbf{N}_1$)\n", "\n", "$$\\begin{bmatrix} \\mathbf{N} & - \\mathbf{H}_2^T & \\mathbf{I} & \\mathbf{0} \\\\ - \\mathbf{H}_2 & - \\mathbf{R}_{22} & \\mathbf{0} & \\mathbf{I}\\end{bmatrix} $$\n", "\n", "első sorát szorozzuk végig balról $\\mathbf{N}^{-1}$-el, majd adjuk hozzá a második sorhoz az $\\mathbf{H}_2$-vel balról szorzott első sort. Mivel $\\mathbf{H}_2\\mathbf{I}=\\mathbf{H}_2$, ha az $\\mathbf{I}$ $r\\times r$ méretű egységmátrix, eredményül a\n", "\n", "$$\\begin{bmatrix} \\mathbf{I} & - \\mathbf{N}^{-1}\\mathbf{H}_2^T & \\mathbf{N}^{-1} & \\mathbf{0} \\\\ \\mathbf{0} & - \\mathbf{R}_{22}- \\mathbf{H}_2\\mathbf{N}^{-1}\\mathbf{H}_2^T & \\mathbf{H}_2\\mathbf{N}^{-1} & \\mathbf{I}\\end{bmatrix} $$\n", "\n", "kibővített mátrixot kapjuk. Vezessük be az $\\mathbf{S} = (\\mathbf{R}_{22}+ \\mathbf{H}_2\\mathbf{N}^{-1}\\mathbf{H}_2^T)^{-1}$ jelölést. Balról a második sort $-\\mathbf{S}$-el végigszorozva a\n", "\n", "$$\\begin{bmatrix} \\mathbf{I} & - \\mathbf{N}^{-1}\\mathbf{H}_2^T & \\mathbf{N}^{-1} & \\mathbf{0} \\\\ \\mathbf{0} & \\mathbf{I} & -\\mathbf{S}\\mathbf{H}_2\\mathbf{N}^{-1} & -\\mathbf{S}\\end{bmatrix} $$\n", "\n", "mátrixot kapjuk meg. Végül adjuk hozzá az első sorhoz a balról $\\mathbf{N}^{-1}\\mathbf{H}_2^T$-vel szorzott második sort. Eredményül a\n", "\n", "$$\\begin{bmatrix} \\mathbf{I} & \\mathbf{0} & \\mathbf{N}^{-1} - \\mathbf{N}^{-1}\\mathbf{H}_2^T\\mathbf{S}\\mathbf{H}_2\\mathbf{N}^{-1} & -\\mathbf{N}^{-1}\\mathbf{H}_2^T\\mathbf{S} \\\\ \\mathbf{0} & \\mathbf{I} & -\\mathbf{S}\\mathbf{H}_2\\mathbf{N}^{-1} & -\\mathbf{S}\\end{bmatrix} $$\n", "\n", "kibővített mátrixot kapjuk, amelynek jobb oldalán a keresett inverz mátrix áll.\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Ezzel az inverz mátrixszal balról végigszorozva a megoldandó egyenletrendszert megkapjuk a keresett megoldást\n", "\n", "$$\\begin{bmatrix} \\mathbf{x}_2\\\\ \\mathbf{y}\\end{bmatrix} = \\begin{bmatrix} \\mathbf{N}^{-1} - \\mathbf{N}^{-1}\\mathbf{H}_2^T\\mathbf{S}\\mathbf{H}_2\\mathbf{N}^{-1} & -\\mathbf{N}^{-1}\\mathbf{H}_2^T\\mathbf{S} \\\\ -\\mathbf{S}\\mathbf{H}_2\\mathbf{N}^{-1} & -\\mathbf{S}\\end{bmatrix} \\begin{bmatrix} \\mathbf{H}_1^T\\mathbf{R}_{11}^{-1}\\mathbf{z}_1\\\\ -\\mathbf{z}_2\\end{bmatrix}. $$\n", "\n", "Ha a továbbiakban a $\\mathbf{K} =\\mathbf{N}^{-1}\\mathbf{H}_2^T\\mathbf{S} $ jelölést alkalmazzuk, akkor az $\\mathbf{x}_2$-re vonatkozó megoldás\n", "\n", "$$ \\mathbf{x}_2 = \\mathbf{N}^{-1}\\mathbf{H}_1^T\\mathbf{R}_{11}^{-1}\\mathbf{z}_1 - \\mathbf{K}\\mathbf{H}_2\\mathbf{N}^{-1}\\mathbf{H}_1^T\\mathbf{R}_{11}^{-1}\\mathbf{z}_1 + \\mathbf{K}\\mathbf{z}_2.$$\n", "\n", "Ezt egyszerűsíteni tudjuk, ha figyelembe vesszük, hogy $\\mathbf{x}_1 = \\mathbf{N}_1^{-1}\\mathbf{H}_1^T\\mathbf{R}_{11}^{-1}\\mathbf{z}_1 $. Végeredményben\n", "\n", "$$ \\mathbf{x}_2 = \\mathbf{x}_1 - \\mathbf{K}\\mathbf{H}_2\\mathbf{x}_1 + \\mathbf{K}\\mathbf{z}_2 = \\mathbf{x}_1 + \\mathbf{K}(\\mathbf{z}_2 - \\mathbf{H}_2\\mathbf{x}_1 ).$$\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Az $\\mathbf{S}$ mátrixot visszaírva (mivel $\\mathbf{N}^{-1}=\\mathbf{P}_{11}$)\n", "\n", "$$ \\mathbf{K} = \\mathbf{P}_{11}\\mathbf{H}_2^T(\\mathbf{R}_{22} + \\mathbf{H}_2 \\mathbf{P}_{11} \\mathbf{H}_2^T)^{-1}.$$\n", "\n", "A kiegyenlített paraméterek kovariancia mátrixa pedig az invertált hipermátrix bal felső blokkja (vagyis az $\\mathbf{x}_2$-höz tartozó blokk)\n", "\n", "$$ \\mathbf{P}_{22} = (\\mathbf{I} - \\mathbf{K}\\mathbf{H}_2) \\mathbf{P}_{11}.$$\n", "\n", "Ezek megegyeznek a statikus Kálmán-szűrő egyenleteivel. A $\\mathbf{K}$ a Kálmán-féle erősítési mátrix, $\\mathbf{H}$ a mérési mátrix, $\\mathbf{x}$ pedig a rendszer állapota. A szűrő minden új mérés után frissíti a rendszer állapot becslését és az állapot becslésének $ \\mathbf{P}$ kovariancia mátrixát.\n", "\n", "A *dinamikus* Kálmán-szűrő egyenletei mindössze annyiban térnek el ettől, hogy a rendszer $ \\mathbf{x}$ állapota is változik:\n", "\n", "$$\\mathbf{x}_{k+1} = \\mathbf{F}\\mathbf{x}_k + \\mathbf{B}\\mathbf{u}_k + \\mathbf{q}$$\n", "\n", "a $k$-adik időpontról a $k+1$-edik időpontra, ahol $\\mathbf{F}$ az állapot átmenet mátrixa, $\\mathbf{u}$ a rendszer gerjesztése, $\\mathbf{B}$ a gerjesztés (vezérlés) mátrixa és $\\mathbf{q}$ a zérus átlagú rendszer zaj, aminek $\\mathbf{Q}$ a kovariancia mátrixa.\n", "\n", "A dinamikus rendszer állapot-átmenete utáni $\\mathbf{P}^-$ kovariancia mátrixot egyszerűen a jól ismert kovariancia terjedéssel (hibaterjedés) számíthatjuk ki:\n", "\n", "$$\\mathbf{P}^-_k = \\mathbf{H} \\mathbf{P}_{k-1} \\mathbf{H}^T + \\mathbf{Q}.$$" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Érdemes megjegyezni, hogy a Kálmán-szűrő egyenleteit valószínűségszámítási megfontolások alapján közvetlenül is le lehet vezetni (lásd [Pradu](https://math.stackexchange.com/questions/840662/an-explanation-of-the-kalman-filter) válaszát)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Példa a Kálmán-szűrésre: járműnavigáció\n", "\n", "Példaként vegyünk egy egyenes úton haladó járművet. A modellünkben a rendszer (jármű) $x$\n", "állapotát a $p$ helyzete és $v$ sebessége jellemzi. Az $u$ bemenetet az általunk alkalmazott ismert gyorsulások jelentik és az $y$ kimenet a mért helyzetinformációval azonosítható. Mondjuk azt, hogy gyorsulásokkal vezéreljük a rendszert és a helyzetét $T$ másodperces időközönként mérjük. Ez esetben az elemi kinematikai ismereteink szerint a $v$ sebesség a következő egyenlettel írható le:\n", "\n", "$$v_{k+1} = v_k + Tu_k.$$\n", "\n", "Viszont ez a modell még nem teljes. Ugyanis a sebesség véletlenszerűen is megváltozhat elkerülhetetlen külső tényezők miatt. A sebesség $\\tilde{v}_k$ zaja időfüggő valószínűségi változó, ezért \n", "\n", "$$v_{k+1} = v_k + Tu_k + \\tilde{v}_k$$\n", "\n", "a sebességre vonatkozó modellünk. Ehhez hasonló egyenletet írhatunk fel a $p$ helyzetre:\n", "\n", "$$p_{k+1} = p_k + Tv_k + \\frac{1}{2}T^2u_k + \\tilde{p}_k,$$\n", "\n", "ahol $\\tilde{p}_k$ a helyzet bizonytalansága (zaja). Az állapotvektor mint említettük a helyzetből és a sebességből áll:\n", "\n", "$$x_k = \\left[ p_k \\atop v_k \\right].$$\n", "\n", "Mivel tudjuk, hogy a mért $z$ mennyiség a jármű helyzete, az alábbi lineáris rendszeregyenleteket írhatjuk fel:\n", "\n", "$$x_{k+1} = \\begin{bmatrix}1 & T\\\\0 & 1 \\end{bmatrix} x_k + \\begin{bmatrix}T^2/2\\\\T \\end{bmatrix} u_k + w_k$$\n", "\n", "$$y_k =\\begin{bmatrix}1 & 0\\end{bmatrix} x_k + \\nu_k.$$\n", "\n", "A mérés $\\nu_k$ zaja a mérőeszköz hibájából adódik. Célunk pedig a jármű $x$ állapotának minél pontosabb megismerése.\n", "\n", "A Kálmán-szűrés esetében viszonylag könnyű a mérési zaj, esetünkben a jármű pozíciója hibájának ($R$ \"mátrix\", mely egyetlen elemből álló skalár) a meghatározása, mivel a felhasznált mérőeszköz pontosságát általában ismerjük. Legye a példánkban a helyzet meghatározás szórása ± 3 méter. Nehezebb feladat a rendszer zaj $Q$ kovariancia mátrixának felvétele. Erre az ún. diszkrét fehérzaj gyorsulás modellt (DWNA) alkalmazzuk. Ha ismerjük a gyorsulás $w_{acc}$ mérési zaját (legyen ez a példánkban ± 0.2 m/$\\mathrm{s}^2$) akkor a rendszer zaj kovariancia mátrixa\n", "\n", "$$Q = \\begin{bmatrix}¼T^4 & ½T^3\\\\½T^3 & T^2 \\end{bmatrix} w_{acc}^2.$$\n", "\n", "A jármű helyzetének és sebességének becslését a `kalman(duration,dt)` függvény végzi el Kálmán-szűréssel, és a jármű pontos, mért valamint becsült helyzetét egy ábrán szemléltetjük a szimuláció lefutása után. Az ábráról jól látszik, hogy miért is nevezhető ez az eljárás szűrésnek." ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [ { "data": { "image/png": "", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "import numpy as np\n", "import matplotlib.pyplot as plt\n", "\n", "def kalman(duration, dt, accelnoise = 0.2):\n", " ## function kalman(duration, dt) - Kalman filter simulation\n", " ## duration = length of simulation (seconds)\n", " ## accelnoise = acceleration noise (m/sec**2)\n", " ## dt = step size (seconds)\n", "\n", " measnoise = 3 ## position measurement noise (m)\n", "\n", " F = np.array([[1, dt],[0, 1]]) ## state transition matrix\n", " H = np.array([[1, 0]]) ## measurement matrix\n", " x = np.array([[0, 0]]).T ## initial state vector\n", " xhat = x ## initial state estimate\n", "\n", " Q = accelnoise**2 * np.array([[dt**4/4, dt**3/2],[dt**3/2, dt**2]]) ## process noise covariance\n", " P = Q ## initial estimation covariance\n", " R = measnoise**2 ## measurement error covariance\n", "\n", " dimt = int(duration/dt) ## number of epochs\n", " pos = np.zeros(dimt) ## true position array\n", " poshat = np.zeros(dimt) ## estimated position array\n", " posmeas = np.zeros(dimt) ## measured position array\n", "\n", " k = 0\n", " for t in np.arange(0,duration,dt): \n", " ## Simulate process\n", " ProcessNoise = accelnoise * np.array([[(dt**2/2)*np.random.normal(), dt*np.random.normal()]]).T\n", " x = np.dot(F,x) + ProcessNoise\n", " ## Simulate measurement z at epoch t\n", " MeasNoise = measnoise * np.random.normal() \n", " z = np.dot(H,x) + MeasNoise \n", " ## Innovation: z - H.xh\n", " Inn = z - np.dot(H,xhat) \n", " ## Covariance of Innovation: S = H.P.H' + R\n", " S = np.dot(np.dot(H,P),H.T) + R \n", " ## Gain matrix K = F.P.H'.inv(S)\n", " K = np.dot(np.dot(np.dot(F,P),H.T),np.linalg.inv(S))\n", " ## State estimate: xh = F.xh + K.Inn \n", " xhat = np.dot(F,xhat) + np.dot(K,Inn) \n", " ## Covariance of prediction error: P = F.P.F' + Q - K.H.P.F'\n", " P = np.dot(np.dot(F,P),F.T) + Q - np.dot(np.dot(np.dot(K,H),P),F.T) \n", " ## Save some parameters in vectors for plotting later\n", " pos[k] = x[0] \n", " posmeas[k] = z \n", " poshat[k] = xhat[0]\n", " k = k + 1\n", "\n", " return pos,posmeas,poshat \n", "\n", "## Simulate\n", "\n", "duration = 100\n", "dt = 0.5\n", "p,pm,phat = kalman(duration,dt)\n", "\n", "## Plot the results\n", "t = np.arange(0,duration,dt)\n", "plt.figure(figsize=(8,6))\n", "plt.plot(t,pm,label='measured')\n", "plt.plot(t,p,label='true')\n", "plt.plot(t,phat,label='estimated')\n", "plt.legend()\n", "plt.xlabel('time (s)')\n", "plt.ylabel('position (m)')\n", "plt.title('Kalman filter performance')\n", "plt.show() " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Ez az egyszerű példa jól bemutatta a Kálmán-szűrés alapvető algoritmusát. A gyakorlatban azonban általában a mérések függése az állapottól nem lineáris, vagyis nem írható le egyszerűen egy $\\mathbf{H}$ mérési mátrixszal. Ezzel az esettel a továbbiakban foglalkozunk, ami el fog vezetni a kibővített Kálmán-szűrés (Extended Kalman Filter, EKF) és a szagtalan Kálmán-szűrés (Unscented Kalman Filter, UKF) eseteihez." ] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.9.16" } }, "nbformat": 4, "nbformat_minor": 2 }