9.4 KiB
title | description |
---|---|
Zpracování obrazu pomocí PDE | TODO |
Note
Difúzní filtrování (lineární difuze, nelineární izotropní a nelineární anizotropní difuze). Level set metody (pohyb ve směru normály, pohyb řízený křivostí a pohyb ve vnějším vektorovém poli). Fast marching algoritmus.
PA166
-
Divergence
Operace, která nám říká, jak moc vektorové pole míří ven z daného bodu. Pokud je\text{div} j > 0
, pak se v daném bodě hodnota časem snižuje, pokud je\text{div} j < 0
, pak se hodnota zvyšuje.\text{div} j = \nabla^T j = (\partial_x, \partial_y) \cdot (j_1, j_2) = \partial_x j_1 + \partial_y j_2
. -
Laplacian $\Delta$
Jak se mění teplota v daném místě s časem, proto to odpovídá derivaci teploty podle času.Laplacian je vlastně divergence gradientu:
\Delta u = \text{div}(\nabla f) = (\partial_x, \partial_y) \cdot (\partial_x u, \partial_y u) = \partial_{xx} u + \partial_{yy} u = u_{xx} + u_{yy}
.
Difuze
Imituje šíření tepla v 1D tyči / 2D ploše / ... Řídí se také rovnicí pro šíření tepla: u_t = \Delta u = u_{xx} + u_{yy}
(kde \Delta
je Laplaceův operátor).
- Teplo se v takové ploše může šířit různými způsoby v závislosti na vlastnostech materiálu. Je možné že:
- Celý materiál ve všech směrech vede teplo stejně = lineární difuze (LD).
- Materiál vede v různých místech teplo různě, ale vždy ve všech směrech stejně = nelineární izotropní difuze (NID).
- Materiál vede teplo různě v různých směrech = nelineární anizotropní difuze (NAD).
Lineární difuze
Pokud aplikujeme lineární difuzi na obrázek, dojde k jeho rozmazání (Gaussovský filtr).
Pokud vezmeme prostor všech různých Gaussovských rozmazání v různých časem, dostáváme "Gaussovský prostor měřítek" (Gaussian scale space). Pro ten platí
- Zachování průměrné hodnoty šedé
- Princip maxima a minima - se zvyšujícím se t se maximum jedině snižuje a minimum jedině zvyšuje
- Řešení je nezávislé na
- Posuvu hodnoty šedé - “posun po ose Y”
- Translaci - “posun po ose X”
- Škálování
- Vlastnost porovnání - pokud
u \leq v \rightarrow (T_tu) \leq (T_tv)
- Pro dimenze
\geq 2
mohou vznikat nové extrémy
Chceme vypočítat u_{ij}^{k + 1}
pomocí aproximace Taylorova rozvoje:
u_t = \frac{u_{ij}^{k + 1} - u_{ij}^k}{\Delta t} + O(\Delta t)\\
u_{xx} = u_{i + 1, j}^k - 2u_{ij}^k + u_{i - 1, j}^k + O(\Delta x^2)\\
u_{yy} = u_{i, j + 1}^k - 2u_{ij}^k + u_{i, j - 1}^k + O(\Delta y^2)
A z této rovnice už vyjádříme u_{ij}^{k + 1}
. (\Delta t
je časový krok, \Delta x
a \Delta y
jsou prostorové kroky)
Nelineární izotropní difuze
Zobecníme funkci pro difuzi kombinací Fick’s law a Mass preservation: \partial_t u = \text{div} (g \cdot \nabla u)
, kde \div
je divergence.
- Lineární
g = 1
- Rozmazání ve všech bodech stejně ve všech směrech
- Nelineární izotropní
g =
skalární funkce- Rozmazání stejně ve všech směrech, ale v každém bodě jinak
- Nelineární anizotropní
g =
maticová funkce- Rozmazání v každém bodě a směru jinak
Pro NID chceme typicky zabránit rozmazání na výrazných hranách. Chceme tedy, aby fce g
byla na hranách (tam, kde je velký gradient) co nejmenší a jinde co největší. Existuje několik různých vzorců:
- Perona-Malik difuzivita
g(\nabla u) = \frac{1}{1 + |\nabla u|^2 / \lambda^2}
. - Charbonnier difuzivita
g(\nabla u) = \frac{1}{\sqrt{1 + |\nabla u|^2 / \lambda^2}}
. - Exponenciální difuzivita
g(\nabla u) = e^\frac{-|\nabla u|^2}{2\lambda^2}
.
Nelineární anizotropní difuze
NID nechával "chlupaté hrany", protože kolem hran nerozmazával vůbec. NAD dokáže kolem hran rozmazat jen v tom správném směru, neboť g
je v tomto případě matice.
-
Symetrická matice
Reprezentuje otočení, roztažení a otočení zpátky:A= \begin{pmatrix} u_1 & v_1\\ u_2 & v_2 \end{pmatrix} \begin{pmatrix} \lambda_1 & 0\\ 0 & \lambda_2 \end{pmatrix} \begin{pmatrix} u_1 & u_2\\ v_1 & v_2 \end{pmatrix}
- Vlastní vektory kolmé na sebe
- Vlastní čísla jsou reálná
Díky symetrickým maticím můžeme sestavit sami maticky s předem danými vlastními vektory a čísly.
-
Edge-enhancing difuzivita (difuzivita zvýrazňující hrany)
My chceme matici, co má následující vlastnosti:v_1 \parallel \nabla u_\sigma, \lambda_1 = g(|\nabla u_\sigma|^2) \\ v_2 \perp \nabla u_\sigma, \lambda_2 = 1
Kde funkce
g
je funkce nepřímé úměry. Tím zajistíme, že rozmazání podél hran bude maximální a v ostatních směrech bude minimální. -
Coherence-enhancing difuzivita (difuzivita zvýrazňující koherenci)
Potřebujeme vypočítat difuzní tenzor a podle něj potom aplikujeme rozmazání. Tenzor je dán jako:D = \nabla u_\sigma \nabla u_\sigma^T
My opět vytvoříme matici s vlastními vektory a čísly. Tentokrát vektory vezmeme z tensoru: Vlastní vektor tensoru s větším vl. číslem vede přes strukturu -> Dáme mu malé číslo blízko nuly; vlastní vektor s menším vl. číslem vede kolmo -> Dáme mu číslo podle rozdílu koherence (pokud je koherentní, nechceme rozmazávat tolik, může to být roh).
Level set metody
Level set metody využívají implicitní reprezentace křivek.
-
Implicitní reprezentace
Představme si funkci, která má uvnitř křivky záporné hodnoty, na křivce nulu a venku kladné hodnoty. Potom můžeme křivku reprezentovat, jako (nulovou) vrstevnici funkce.Při takovéto reprezentaci nemáme přístup přímo k hranici, ale můžeme jí získat například pomocí marching squares (cubes) algoritmu. Zároveň musíme mít uloženou hodnotu funkce pro celý obraz, což může být nevýhoda. Výhodou je, že můžeme snadno měnit topologii křivky (přidávat díry, spojovat křivky, ...).
Toto všechno funguje i ve 3D, kde se ale bavíme o povrchu.
Vývoj křivky můžeme definovat, jako \frac{\partial C}{\partial t} = \beta n
(kde n
je normála a \beta
řídí rychlost evoluce). Pokud ho chceme definovat v rámci obalující funkce u
, můžeme ho zapsat, jako \partial_t u = \beta |\nabla u|
. \beta
v této rovnici ovlivňuje směr a rychlost pohybu křivky, |\nabla u|
je velikost gradientu.
Level set metody se snaží řešit tuto rovnici.
-
Typy pohybu
Existují 3 základní typy pohybu křivky:- Pohyb ve směru normály -
\beta = a
= dilatace / eroze - Pohyb řízený křivostí -
\beta = - \epsilon \kappa
= vyhlazování křivky - Pohyb ve vnějším vektorovém poli -
\beta = V(x, y, t) \cdot n
, kdeV
je vnější vektorové pole
- Pohyb ve směru normály -
-
Pohyb ve vnějším vektorovém poli
\beta = V(x, y, t) \cdot n
popisuje pohyb ve vektorovém poli definovaném parametremV
. Aproximujeme opět pomocí Taylorova rozvoje. -
Pohyb řízený křivostí
Chceme, aby se křivka vyhlazovala, protože křivost je vlastně druhá derivace.\beta = - \epsilon \kappa
popisuje pohyb křivky ve směru opačném k její křivosti.\kappa
je křivost a\epsilon
je parametr, který řídí rychlost vyhlazování. -
Pohyb ve směru normály
Chceme, aby se křivka rozšiřovala, nebo smršťovala.\beta = a
popisuje pohyb křivky ve směru normály.a
je parametr, který řídí rychlost pohybu.
Všechny typy pohybu můžeme zapsat do jedné rovnice: u_t = -V \cdot \nabla u - a |\nabla u| + \epsilon \kappa |\nabla u|
a aproximovat pomocí Taylorova rozvoje.
Fast marching algoritmus
FMA je specifický případ Level set metody s pouze jedním typem pohybu ve směru normály \partial_t u = a |\nabla u|
.
Pro různé případy můžeme volit různé hodnoty a
.
-
Euklidovská vzdálenost
Pro výpočet vzdálenosti od křivky ke všem bodům obrazu zvolímea = 1
. -
Geodesická vzdálenost
Chceme-li změřit vzdálenost od daného bodu uvnitř objektu, zvolímea = 1
uvnitř objektu aa \rightarrow 0
venku. -
Segmentace
Můžeme jednoduše segmentovat obraz, pokud zvolímea = g(|\nabla f|)
(kdef
je obraz ag
je nějaká funkce, například Perona-Malik). Potomg
jde k 0 při vysokém gradientu a k 1 při nízkém gradientu.
Samotný výpočet algoritmu je trošku složitější, uděláme si 3 množiny
- Trial (co chceme testovat, init. kontura)
- Far (neobjevené, init. všechno krom kontury)
- Known (vyřešené, init. prázdná množina)
Vždy najdeme v Trial nejmenší hodnotu, přehodíme ji do Known a pro její sousedy vypočítáme nový arrival time minimalizací T_{new} = \tau(v_1, v_2) + v_1 T_1 + v_2 T_2
, kde \tau
je časový krok, T_1, T_2
jsou hodnoty v Known a v_1, v_2
jsou souřadnice bodu X, které chceme minimalizovat (v_1 + v_2 = 1, v_1, v_2 \geq 0
).
Konkrétní výpočet je ve slidech, nebo v notionu, ale myslím, že je celkem zbytečný.
Složitost je v řádu O(n \log n)
, kde n
je počet pixelů v obrazu.