{"worksheets": [{"cells": [{"cell_type": "markdown", "metadata": {}, "source": ["Le traitement num rique des images", "==================================", "", "*Important:* Please read the [installation page](http://gpeyre.github.io/numerical-tours/installation_python/) for details about how to install the toolboxes.", "$\\newcommand{\\dotp}[2]{\\langle #1, #2 \\rangle}$", "$\\newcommand{\\enscond}[2]{\\lbrace #1, #2 \\rbrace}$", "$\\newcommand{\\pd}[2]{ \\frac{ \\partial #1}{\\partial #2} }$", "$\\newcommand{\\umin}[1]{\\underset{#1}{\\min}\\;}$", "$\\newcommand{\\umax}[1]{\\underset{#1}{\\max}\\;}$", "$\\newcommand{\\umin}[1]{\\underset{#1}{\\min}\\;}$", "$\\newcommand{\\uargmin}[1]{\\underset{#1}{argmin}\\;}$", "$\\newcommand{\\norm}[1]{\\|#1\\|}$", "$\\newcommand{\\abs}[1]{\\left|#1\\right|}$", "$\\newcommand{\\choice}[1]{ \\left\\{  \\begin{array}{l} #1 \\end{array} \\right. }$", "$\\newcommand{\\pa}[1]{\\left(#1\\right)}$", "$\\newcommand{\\diag}[1]{{diag}\\left( #1 \\right)}$", "$\\newcommand{\\qandq}{\\quad\\text{and}\\quad}$", "$\\newcommand{\\qwhereq}{\\quad\\text{where}\\quad}$", "$\\newcommand{\\qifq}{ \\quad \\text{if} \\quad }$", "$\\newcommand{\\qarrq}{ \\quad \\Longrightarrow \\quad }$", "$\\newcommand{\\ZZ}{\\mathbb{Z}}$", "$\\newcommand{\\CC}{\\mathbb{C}}$", "$\\newcommand{\\RR}{\\mathbb{R}}$", "$\\newcommand{\\EE}{\\mathbb{E}}$", "$\\newcommand{\\Zz}{\\mathcal{Z}}$", "$\\newcommand{\\Ww}{\\mathcal{W}}$", "$\\newcommand{\\Vv}{\\mathcal{V}}$", "$\\newcommand{\\Nn}{\\mathcal{N}}$", "$\\newcommand{\\NN}{\\mathcal{N}}$", "$\\newcommand{\\Hh}{\\mathcal{H}}$", "$\\newcommand{\\Bb}{\\mathcal{B}}$", "$\\newcommand{\\Ee}{\\mathcal{E}}$", "$\\newcommand{\\Cc}{\\mathcal{C}}$", "$\\newcommand{\\Gg}{\\mathcal{G}}$", "$\\newcommand{\\Ss}{\\mathcal{S}}$", "$\\newcommand{\\Pp}{\\mathcal{P}}$", "$\\newcommand{\\Ff}{\\mathcal{F}}$", "$\\newcommand{\\Xx}{\\mathcal{X}}$", "$\\newcommand{\\Mm}{\\mathcal{M}}$", "$\\newcommand{\\Ii}{\\mathcal{I}}$", "$\\newcommand{\\Dd}{\\mathcal{D}}$", "$\\newcommand{\\Ll}{\\mathcal{L}}$", "$\\newcommand{\\Tt}{\\mathcal{T}}$", "$\\newcommand{\\si}{\\sigma}$", "$\\newcommand{\\al}{\\alpha}$", "$\\newcommand{\\la}{\\lambda}$", "$\\newcommand{\\ga}{\\gamma}$", "$\\newcommand{\\Ga}{\\Gamma}$", "$\\newcommand{\\La}{\\Lambda}$", "$\\newcommand{\\si}{\\sigma}$", "$\\newcommand{\\Si}{\\Sigma}$", "$\\newcommand{\\be}{\\beta}$", "$\\newcommand{\\de}{\\delta}$", "$\\newcommand{\\De}{\\Delta}$", "$\\newcommand{\\phi}{\\varphi}$", "$\\newcommand{\\th}{\\theta}$", "$\\newcommand{\\om}{\\omega}$", "$\\newcommand{\\Om}{\\Omega}$"]}, {"cell_type": "markdown", "metadata": {}, "source": ["Cette page reprend", "<http://images.math.cnrs.fr/Le-traitement-numerique-des-images.html", "l'article publi  sur le site web Images des math matiques>.", "", "", "Les appareils num riques photographient de mani re tr s pr cise le monde", "qui nous entoure. L'utilisateur souhaite pouvoir stocker avec un encombrement", "minimal ses photos sur son disque dur. Il souhaite  galement pouvoir les retoucher", "afin d'am liorer leur qualit . Cet article pr sente les outils math matiques et", "informatiques qui permettent d'effectuer ces diff rentes t ches.", "", "", "Cet article pr sente quelques concepts du <http://fr.wikipedia.org/wiki/Traitement_d'images traitement>", "math matique des", "images num riques. Ces traitements permettent de stocker plus facilement", "les images et d'am liorer leur qualit . Les math matiques utilis es dans", "cet article correspondent au niveau de la classe de troisi me. Les mots", "cl s en rouge pointent vers les pages <http://fr.wikipedia.org/ Wikip dia>", "correspondantes. Ils sont", "repris   la fin de l'article dans un glossaire.", "", "", "_Mot clefs :_ image, bits, carr , racine carr e, inverse, logarithme, moyenne, m diane."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["from __future__ import division", "import nt_toolbox as nt", "from nt_solutions import introduction_6_elementary_fr as solutions", "%matplotlib inline", "%load_ext autoreload", "%autoreload 2"]}, {"cell_type": "markdown", "metadata": {}, "source": ["Les pixels d'une image", "----------------------", "Une <http://fr.wikipedia.org/wiki/Image_num%C3%A9rique image num rique>", "en niveaux de gris est un tableau de valeurs. Chaque", "case de ce tableau, qui stocke une valeur, se nomme un <http://fr.wikipedia.org/wiki/Pixel pixel>.", "En notant $n$ le nombre de lignes et $p$ le nombre de colonnes de l'image,", "on manipule ainsi un tableau de $n \\times p$ pixels.", "", "", "", "La figure ci-dessous montre une visualisation d'un tableau carr  avec", "$n=p=240$, ce qui repr sente  $240\\times 240$=57600 pixels. Les", "<http://fr.wikipedia.org/wiki/Appareil_photographique_num%C3%A9rique appareils photos num riques>", "peuvent enregistrer des images beaucoup plus grandes,", "avec plusieurs <http://en.wikipedia.org/wiki/Gigapixel_image millions de pixels>."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["n = 256", "name = 'hibiscus'", "f = load_image(name, n)", "f = rescale(sum(f, 3))", "", "imageplot(f)"]}, {"cell_type": "markdown", "metadata": {}, "source": ["Les valeurs des pixels sont enregistr es dans <http://fr.wikipedia.org/wiki/Ordinateur l'ordinateur> ou", "<http://fr.wikipedia.org/wiki/Appareil_photographique_num%C3%A9rique l'appareil photo num rique>", "sous forme", "de <http://fr.wikipedia.org/wiki/Entier_relatif nombres entiers> entre 0 et 255,", "ce qui fait 256 valeurs possibles pour chaque pixel.", "", "", "La valeur 0 correspond au noir, et la valeur 255 correspond au blanc. Les", "valeurs interm diaires correspondent   des <http://fr.wikipedia.org/wiki/Niveau_de_gris niveaux de gris>", "allant du noir au blanc.", "", "", "La figure ci-dessous montre un sous-tableau de $6 \\times 6$ pixels extrait de", "l'image pr c dente. On peut voir   la fois les valeurs qui composent le tableau et les niveaux de gris qui permettent d'afficher l'image   l' cran."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["selx = 19: 24", "sely = 62: 67", "", "image(f(selx, sely)*255); axis image; axis off", "disp(floor(255*f(selx, sely)))"]}, {"cell_type": "markdown", "metadata": {}, "source": ["Les valeurs de l'images extraite sont:", "$$", "\\left[", "\\begin{array}{ccc}", "  43    &43   & 43  &  41  &  40 &   39 \\\\", "  48    &49   & 46  &  42 &   44  &  43\\\\", "  110   & 79  &  54 &   47  &  48 &   45\\\\", "  190   &192  & 190  & 153  &  99 &   54\\\\", "  150   &166  & 189 &  203  & 183 &  170\\\\", "  131   &140  & 145 &  161  & 165 &  178\\\\", "\\end{array}", "\\right]", "$$", "", "Stocker une image", "-----------------", "Stocker de grandes images sur le <http://fr.wikipedia.org/wiki/Disque_dur disque dur>", "d'un ordinateur prend", "beaucoup de place. Les nombres entiers sont stock s", "en <http://fr.wikipedia.org/wiki/Syst%C3%A8me_binaire  criture binaire>,", "c'est- -dire sous la forme d'une succession", "de 0 et de 1. Chaque 0 et chaque 1 se stocke sur une unit   l mentaire", "de stockage, appel e <http://fr.wikipedia.org/wiki/Bit bit>.", "", "", "Pour obtenir l' criture binaire d'un pixel ayant comme valeur 179,", "il faut d composer cette valeur comme somme de puissances de deux.", "On obtient ainsi", "$$ 179=2^7+2^5+2^4+2+1, $$", "o  l'on a pris soin d'ordonner les puissances de deux par ordre", "d croissant. Afin de faire mieux appara tre l' criture binaire,", "on ajoute \"$1 \\times$\" devant chaque puissance qui appara t dans l' criture,", "et \"$0\\times$\" devant les puissances qui n'apparaissent pas", "$$ 179=1 \\times 2^7 + 0 \\times 26 + 1 \\times 2^5 + 1 \\times 24 +", "  0 \\times 2^3 + 0 \\times 22 + 1 \\times 2^1 + 1 \\times 2^0. $$", "", "", "Avec une telle  criture,", "la valeur de chaque pixel, qui est un nombre entre 0 et 255, n cessite", "$$ \\log_2(256) = 8 \\text{ bits}. $$", "La fonction $\\log_2$ est le logarithme en base 2, et ce calcul exprime", "le fait que", "$$ 256=2^8 = 2 \\times 2 \\times 2 \\times 2 \\times 2 \\times 2 \\times 2 \\times 2.  $$", "L' criture binaire de la valeur 179 du pixel est ainsi $(1,0,1,1,0,0,1,1)$,", "o  chaque 1 et chaque 0 correspond au facteur multiplicatif qui appara t devant chaque puissance.", "", "", "On peut  crire toute valeur entre 0 et 255 de cet mani re,", "ce qui n cessite d'utilisation de 8 bits. Il y a en effet", "256 valeurs possibles, et $256=2^8$. Pour stocker l'image compl te, on a donc besoin de", "$$ n \\times p \\times 8 \\text{ bits}. $$", "", "", "Pour stocker l'image compl te, on a donc besoin de", "$$ n \\times p \\times 8  \\text{ bits}. $$", "Pour l'image montr e aux figure pr c dentes, on a ainsi besoin de", "$$ 256 \\times 256 \\times 8 = 524288 \\text{ bits}. $$", "", "", "Pour l'image montr e   la premi re figure, on a ainsi besoin de", "$$ 240 \\times 240 \\times 8 = 460800 \\text{ bits.} $$", "On utilise le plus souvent <http://fr.wikipedia.org/wiki/Octet l'octet> (8 bits) comme unit ,", "de sorte que cette image n cessite 57,6ko (kilo octets).", "", "La r solution d'une image", "-------------------------", "Afin de r duire la place de stockage d'une image, on peut r duire sa", "<http://fr.wikipedia.org/wiki/R%C3%A9solution_(imagerie_num%C3%A9rique) r solution>,", "c'est- -dire diminuer le nombre de pixels.", "", "", "La fa on la plus simple d'effectuer cette r duction consiste   supprimer des lignes et des colonnes dans l'image de d part.", "", "", "La figure suivante montre ce que l'on obtient si l'on retient une ligne sur 4 et une colonne sur 4."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["sub = lambda f, k: f(1: k: end, 1: k: end)"]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["imageplot(sub(f, 4))"]}, {"cell_type": "markdown", "metadata": {}, "source": ["On a ainsi divis  par $4 \\times 4 = 16$ le nombre de pixels de l'image,", "et donc  galement r duit par 16 le nombre de bit n cessaire pour stocker l'image sur", "un disque dur.", "", "", "La figure suivante montre les r sultats obtenus en enlevant de plus en", "plus de lignes et de colonnes. Bien entendu, la qualit  de l'image se", "d grade vite."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["klist = [2 4 8 16]", "", "for i in 1: length(klist):", "    k = klist(i)", "    imageplot(clamp(sub(f, k)), ['1 ligne/ colonne sur ' num2str(k)], 2, 2, i)"]}, {"cell_type": "markdown", "metadata": {}, "source": ["Quantifier une image", "--------------------", "Une autre fa on de r duire la place m moire n cessaire pour le stockage", "consiste   utiliser moins de nombres entirers pour chaque valeur.", "", "", "On peut par exemple utiliser uniquement des nombres entier entre 0 et 3,", "ce qui donnera une image avec uniquement 4 niveau de gris.", "", "", "On peut effectuer une conversion de l'image d'origine vers une image avec", "3 niveau de valeurs en effectuant les remplacements:", "", "", "- les valeurs dans $0,1,\\ldots,63$ sont remplac es par la valeur 0,", "", "- les valeurs dans $64,1,\\ldots,127$ sont remplac es par la valeur 1,", "", "- les valeurs dans $128,1,\\ldots,191$ sont remplac es par la valeur 2,", "", "- les valeurs dans $192,\\ldots,255$ sont remplac es par la valeur 3.", "", "", "Une telle op ration se nomme <http://fr.wikipedia.org/wiki/Quantification_(signal) quantification>.", "", "", "La figure suivante montre l'image r sultante avec 4 niveaux de couleurs.", "Les 4 valeurs sont affich es en utilisant 4 niveaux de gris allant du noir", "au blanc."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["quant = lambda f, q: (round(q*rescale(f, 1e-3, 1-1e-3)-1/ 2) + 1/ 2)/ q", "", "imageplot(quant(f, 4), '4 niveaux de gris')"]}, {"cell_type": "markdown", "metadata": {}, "source": ["Nous avons d j  vu que l'on pouvait repr senter toute valeur entre 0 et", "255   l'aide de 8 bits en utilisant l' criture binaire. De fa on similaire,", "on v rifie que toute valeur entre 0 et 3 peut se repr senter   l'aide de 2 bits.", "On obtient ainsi une r duction d'un facteur 8/2=4 de la place", "<http://fr.wikipedia.org/wiki/M%C3%A9moire_(informatique) m moire> n cessaire", "pour le stockage de l'image sur un disque dur.", "", "", "La figure suivante montre les r sultats obtenus en utilisant de moins en", "moins de niveaux de gris."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["qlist = [16, 4, 3, 2]", "", "for i in 1: length(qlist):", "    q = qlist(i)", "    f1 = quant(f, q); f1(1) = 0; f1(2) = 1", "    imageplot(f1, [num2str(q) ' niveaux de gris'], 2, 2, i)"]}, {"cell_type": "markdown", "metadata": {}, "source": ["Tout comme pour la r duction du nombre de pixels, la r duction du nombre", "de niveaux de gris influe beaucoup sur la qualit  de l'image.", "Afin de r duire au maximum la taille d'une image sans modifier sa qualit ,", "on utilise des m thodes plus complexes de", "<http://fr.wikipedia.org/wiki/Compression_d%27image compression d'image>. La m thode", "la plus efficace s'appelle", "<http://fr.wikipedia.org/wiki/Jpeg_2000 JPEG-2000>.", "Elle utilise la th orie des <http://fr.wikipedia.org/wiki/Ondelettes ondelettes>.", "Pour en savoir plus   ce sujet, vous pouvez consuler cet", "<http://images.math.cnrs.fr/Compression-d-image.html article d'Erwan Le", "Pennec>.", "", "Enlever le bruit par moyennes locales", "-------------------------------------", "Les images sont parfois de mauvaise qualit . Un exemple typique de d faut", "est le <http://fr.wikipedia.org/wiki/Bruit_num%C3%A9rique bruit>", "qui apparait quand une photo est", "<http://fr.wikipedia.org/wiki/Exposition_(photographie) sous-expos e>, c'est- -dire", "qu'il n'y a pas assez de luminosit . Ce bruit se manifeste par de petites", "flucturation <http://fr.wikipedia.org/wiki/Suite_al%C3%A9atoire al atoires>", "des niveaux de gris. La figure ci-dessous montre", "une image bruit e."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["name = 'boat'", "f = rescale(load_image(name, n))", "sigma = .08", "f = f + randn(n)*sigma", "", "imageplot(f)"]}, {"cell_type": "markdown", "metadata": {}, "source": ["Afin d'enlever le bruit dans les images, il convient de faire subir une", "modification aux valeurs de pixels.", "L'op ration la plus simple consiste   remplacer la valeur", "$a$ de chaque pixel par la <http://fr.wikipedia.org/wiki/Moyenne moyenne> de", "$a$ et des 8 valeurs $b,c,d,e,f,g,h,i$ des 8 pixels voisins de a.", "", "", "Les valeurs des pixels sont positionn es comme suit :", "$$", "\\left[", "\\begin{array}{ccc}", "      g & c & h \\\\", "      b & a & d \\\\", "      f & e & i", "\\end{array}", "\\right]", "  =", "\\left[", "\\begin{array}{ccc}", "      79 & 54 & 47 \\\\", "      192 & 190 & 153 \\\\", "      166 & 189 & 203", "\\end{array}", "\\right]", "$$", "", "", "On obtient ainsi une image modifi e en rempla ant a par", "$$ \\frac{a+b+c+d+e+f+g+h+i}{9} $$", "puisque l'on fait la moyenne de 9 valeurs.", "Dans notre exemple, cette moyenne vaut", "$$ \\frac{190+192+79+54+47+153+203+189+166}{9} \\approx 141,4. $$", "En effectuant cette op ration pour chaque pixel, on supprime une partie", "du bruit, car ce bruit est constitu  de fluctuations al atoires, qui sont", "diminu es par un calcul de moyennes. La figure ci-dessous montre l'effet d'un tel calcul.", "", "", "La figure ci-dessous montre l'effet d'un tel moyennage."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["filt_moy = lambda f, k: perform_convolution(f, ones(2*k + 1)/ (2*k + 1)^2, 'sym')", "", "imageplot(clamp(f), 'Image bruit e', 1, 2, 1)", "imageplot(clamp(filt_moy(f, 1)), 'Image moyenn e', 1, 2, 2)"]}, {"cell_type": "markdown", "metadata": {}, "source": ["Tout le bruit n'a pas  t  enlev  par cette op ration. Afin d'enlever plus", "de bruit, on peut moyenner plus de valeurs autour de chaque pixel.", "La figure suivante montre le r sultat obtenu en moyennant de plus en plus", "de valeurs."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["klist = [1 2 3 4]", "", "for i in 1: length(klist):", "    k = klist(i)", "    f1 = filt_moy(f, k)", "    imageplot(clamp(f1), ['Moyenne de ' num2str((2*k + 1)^2) ' pixels'], 2, 2, i)"]}, {"cell_type": "markdown", "metadata": {}, "source": ["Le moyennage des pixels est tr s efficace pour enlever le bruit dans les", "images, malheureusement il d truit  galement une grande partie de", "l'information de l'image. on peut en effet s'appercevoir que les images", "obtenues par moyennage sont <http://fr.wikipedia.org/wiki/Flou,_nettet%C3%A9_et_contraste floues>. Ceci est en particulier visible pr s", "des contours, qui ne sont pas nets.", "", "", "Enlever le bruit par m diane", "----------------------------", "Afin de r duire ce flou, il faut remplacer le moyennage par une op ration", "un peu plus complexe, que l'on nomme <http://fr.wikipedia.org/wiki/M%C3%A9diane mediane>.", "", "", "Etant donn  la valeur $a$ d'un pixel, et les valeurs", "$b,c,d,e,f,g,h,i$, on commence par les classer", "par <http://fr.wikipedia.org/wiki/Ordre_croissant ordre croissant>.", "", "", "Dans l'exemple du voisinage de 9 pixels utilis    la section pr c dente,", "on obtient les 9 valeurs class es", "$$ 47,54,79,153,166,189,190,192,203. $$", "La m diane des neuf valeurs $a,b,c,d,e,f,g,h,i$", "est la $5^\\text{e}$ valeur de ce classement (c'est- -dire la", "valeur centrale de ce classement).", "", "", "Dans notre cas, la m diane est donc 166. Notez que ce nombre est en g n ral", "diff rent de la moyenne, qui vaut, pour notre exemple 141,4.", "", "", "La figure ci-dessous compare le d bruitage obtenu en effectuant la", "moyenne et la m diane de 9 pixels voisins."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["filt_med = lambda f, k: perform_median_filtering(f, k)", "", "imageplot(clamp(filt_moy(f, 1)), 'Moyenne de 9 nombres', 1, 2, 1)", "imageplot(clamp(filt_med(f, 1)), 'M diane de 9 nombres', 1, 2, 2)"]}, {"cell_type": "markdown", "metadata": {}, "source": ["Afin d'enlever plus de bruit, il suffit de calculer la m diane sur un", "nombre plus grand de pixels voisins, comme montr    la figure suivante."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["klist = [1 2 3 4]", "", "for i in 1: length(klist):", "    k = klist(i)", "    f1 = filt_med(f, k)", "    imageplot(clamp(f1), ['M diane de ' num2str((2*k + 1)^2) ' pixels'], 2, 2, i)"]}, {"cell_type": "markdown", "metadata": {}, "source": ["On constate que cette m thode est plus performante que le calcul de", "moyennes, car les images r sultantes sont moins floues. Cependant, tout comme", "avec le calcul de moyennes, si l'on prend des voisinages trop grands, on perd", "aussi de l'information de l'image, en particulier les bords des objets sont d grad s.", "", "", "D tecter les bords des objets", "-----------------------------", "Affin de localiser des objets dans les images, il est n cessaire de", "d tecter les <http://fr.wikipedia.org/wiki/D%C3%A9tection_de_contours bords>", "de ces objets. Ces bords correspondent   des", "zones de l'image o  les valeurs des pixels changent rapidement. C'est le", "cas par exemple lorsque l'on passe de la coque du bateau (qui est sombre,", "donc avec des valeurs petites)   la mer (qui est claire, donc avec des", "valeurs grandes).", "", "", "Afin de quantifier combien un pixel avec une valeur $a$ est un bord,", "on prend en compte les valeurs $b,c,d,e$ de ses quatre voisins (deux", "horizontallement et deux verticalements). Dans le cas consid r", "pr c demment, on obtient :", "$$", "\\left[", "\\begin{array}{ccc}", "       & c &  \\\\", "      b & a & d \\\\", "       & e &", "\\end{array}", "\\right]", "  =", "\\left[", "\\begin{array}{ccc}", "       & 54 &  \\\\", "      192 & 190 & 153 \\\\", "       & 189 &", "\\end{array}", "\\right]", "$$", "", "", "Notons que l'on utilise ici seulement 4 voisins, ce qui est diff rent du", "calcul de moyennes et de m dianes o  l'on utilisait 8 voisins.", "Ceci est important afin de d tecter aussi pr cis ment que possible les bords des objets.", "", "", "On calcule une valeur $\\ell$ suivant la formule", "$$ \\ell = \\sqrt{ (b-d)^2 + (c-e)^2 }.  $$", "Dans notre exemple, on obtient donc", "$$ \\ell= \\sqrt{ (192 - 153)^2 + (189 - 54)^2 } = \\sqrt{19746} \\approx 140,5. $$", "", "", "On peut remarquer que si $\\ell=0$, alors on a $b=c$", "et $d=e$. Au contraire, si", "$\\ell$ est grand, ceci signifie que les pixels voisins ont des valeurs tr s", "diff rentes, le pixel consid r  est donc probablement sur le bord d'un objet.", "", "", "La figure suivante montre l'image obtenue en calculant la valeur $\\ell$", "associ e   chaque pixel. On a affich  ces valeurs avec du noir quand", "$\\ell=0$,  du blanc quand $\\ell$ est grand,", "et on a utilis  des niveaux de gris interm diaire pour les valeurs entre 0 et 1."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["n = 256", "name = 'hibiscus'", "f = load_image(name, n)", "f = rescale(sum(f, 3))"]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["s1 = [1 1: n-1]; s2 = [2: n n]", "edge = lambda f: sqrt((f(s1, : ) - f(s2, : )).^2 + (f(: , s1) - f(: , s2)).^2)"]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["imageplot(f, 'Image', 1, 2, 1)", "imageplot(edge(f), 'Carte de l', 1, 2, 2)"]}, {"cell_type": "markdown", "metadata": {}, "source": ["On peut voir que dans l'image de droite, les contours des objets", "ressortent en blanc, car ils correspondent aux grandes valeurs de $\\ell$.", "", "Les images couleurs", "-------------------", "Une <http://fr.wikipedia.org/wiki/Couleur image couleur>", "est en r alit  compos e de trois images ind pendantes,", "afin de repr senter le", "<http://fr.wikipedia.org/wiki/Rouge_vert_bleu rouge, le vert, et le bleu>.", "Chacune de ces trois", "image s'appelle un <http://fr.wikipedia.org/wiki/Codage_informatique_des_couleurs canal>.", "Cette repr sentation en rouge, vert et bleu mime le fonctionnement du", "syst me visuel humain.", "", "", "La figure suivante montre une image couleur, qui est d compos e en ses", "trois canaux constitutifs."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["name = 'hibiscus'", "f = rescale(load_image(name, n))"]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["f1 = cat(3, f(: , : , 1), zeros(n), zeros(n))", "f2 = cat(3, zeros(n), f(: , : , 2), zeros(n))", "f3 = cat(3, zeros(n), zeros(n), f(: , : , 3))"]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["imageplot({f f1 f2 f3}, ...", "        {'Image couleur' 'Canal rouge' 'Canal vert' 'Canal bleu'}, 2, 2)"]}, {"cell_type": "markdown", "metadata": {}, "source": ["Chaque pixel de l'image couleur contient ainsi trois nombres $ (r,v,b) $,", "chacun  tant un nombre entier entre 0 et 255.", "Si le pixel est  gal   $(r,v,b)=(255,0,0)$, il ne contient que de l'information", "rouge, et est affich  comme du rouge.", "De fa on similaire, les pixels valant $(0,255,0)$ et $(0,0,255)$ sont", "respectivement affich s vert et bleu.", "", "", "On peut afficher   l' cran une image couleur", "partir de ses trois canaux $(r,v,b)$ en utilisant les r gles de la", "<http://fr.wikipedia.org/wiki/Synth%C3%A8se_additive synth se additive des couleurs>.", "La figure suivante montre les r gles de composition", "cette synth se additive des couleurs.", "Par exemple un pixel avec les valeurs", "$(r,v,b)=(255,0,255)$ est un m lange de rouge et de vert, il est donc", "affich  comme du jaune.", "", "", "On peut calculer une image en niveau de gris   partir d'une image couleur", "en moyennant les trois cannaux. On calcule donc une valeur", "$$ a = \\frac{r+v+b}{3} $$", "qui s'appelle la <http://fr.wikipedia.org/wiki/Luminance luminance> de la couleur.", "", "", "La figure suivante montre le passage d'une image couleur   une image de luminance en", "niveau de gris."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["imageplot({f sum(f, 3)}, {'Couleur' 'Luminance'})"]}, {"cell_type": "markdown", "metadata": {}, "source": ["Une autre repr sentation courante pour les images couleurs utilise", "comme couleurs de base le cyan, le magenta et le jaune. On calcule", "les trois nombres $(c,m,j)$ correspondant   chacun de ces trois canaux", "partir des canaux rouge, vert et bleu $(r,v,b)$ comme suit", "$$ c=255-r, \\quad m=255-v, \\quad j=255-b. $$", "Par exemple, un pixel de bleu pur", "$(r,v,b)=(0,0,255)$ va devenir", "$ (c,m,j)=(255,255,0) $. La figure suivante montre les trois canaux", "$(c,m,j)$ d'une image couleur."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["g = 1-f", "f1 = cat(3, f(: , : , 1),     f(: , : , 2)*0 + 1, f(: , : , 3)*0 + 1)", "f2 = cat(3, f(: , : , 1)*0 + 1, f(: , : , 2)    , f(: , : , 3)*0 + 1)", "f3 = cat(3, f(: , : , 1)*0 + 1, f(: , : , 2)*0 + 1, f(: , : , 3))"]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["imageplot({f f1 f2 f3}, ...", "        {'Image couleur' 'Canal cyan' 'Canal magenta' 'Canal jaune'}, 2, 2)"]}, {"cell_type": "markdown", "metadata": {}, "source": ["Afin d'afficher une image couleur   l' cran   partir des trois canaux", "$(c,m,j)$, on doit utiliser la synth se soustractive des", "couleurs. La figure suivante montre les r gles de composition", "cette synth se soustractive. Notons que ces r gles sont celles que", "l'on utilise en peinture, lorsque l'on m lange des pigments color s. Le cyan,", "le magenta et le jaune sont appel s couleurs primaires.", "", "", "", "On peut donc stocker sur un disque dur une image couleur en stockant les", "trois canaux, correspondant aux valeurs $(r,g,b)$ ou $(c,m,j)$.", "On peut modifier les images couleur tout comme les images en niveaux de", "gris. La fa on la plus simple de proc der consiste   appliquer la modification", "  chacun des canaux.", "", "", "Changer le contraste d'une image", "--------------------------------", "Il est possible de faire subir diff rentes modifications   l'image afin de", "changer son <http://fr.wikipedia.org/wiki/Contraste contraste>."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["name = 'hibiscus'", "f = rescale(load_image(name, n))", "f = rescale(sum(f, 3))"]}, {"cell_type": "markdown", "metadata": {}, "source": ["Un exemple simple consiste   remplacer chaque valeur $a$ d'un pixel", "d'une image par $255-a$ ce qui correspond   la couleur oppos e. Le blanc", "devient noir et vice-et-versa, ce qui donne un effet similaire   celui", "des <http://fr.wikipedia.org/wiki/Film_n%C3%A9gatif n gatifs>", "<http://fr.wikipedia.org/wiki/Argentique d'appareils photos argentiques>."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["imageplot(-f)"]}, {"cell_type": "markdown", "metadata": {}, "source": ["Sans aller jusqu'  des modifications aussi extr mes, on peut assombrir une image", "en rempl ant la valeur $a$ de chaque pixel par son", "<http://fr.wikipedia.org/wiki/Carr%C3%A9_(alg%C3%A8bre) carr > $a^2 = a \\times a$.", "", "", "Ce faisant, les valeurs r sultantes ne sont", "plus dans $0,\\ldots,255$ mais dans $0,\\ldots,255^2=65025$. Afin", "d'afficher l'image   l' cran on va donc utiliser des niveaux de gris", "allant du noir pour 0 au blanc pour 65025."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["imageplot(f.^2, 'Carr ')"]}, {"cell_type": "markdown", "metadata": {}, "source": ["Afin d' claircir l'image, on peut remplacer chaque valeur $a$ par", "sa _racine carr e_ $b = \\sqrt{a}$. Cette valeur $b$ est un nombre, qui n'est plus", "n cessairement entier, qui satisfait $b \\times b = a$.", "", "", "La figure suivante montre l' claircissement obtenu.", "Les valeurs de l'image  claircie sont dant", "$0,\\ldots,\\sqrt{255} \\approx 16$, et on utilise donc des niveaux", "de gris allant du noir (pour 0) au blanc (pour 16)."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["imageplot(sqrt(f), 'Remplacement de a par sqrt(a)')"]}, {"cell_type": "markdown", "metadata": {}, "source": ["On pourra noter que l'on a", "$$ \\sqrt{a} \\times \\sqrt{a} = a", "\\quad\\text{et}\\quad \\sqrt{a \\times a}=a $$", "de sorte que si l'on r alise un  clairsissement suivit d'un", "assombrissement (ou dans le sens inverse) on retrouve l'image d'origine.", "Ces deux op rations sont", "<http://fr.wikipedia.org/wiki/Inverse inverses> l'une de l'autre.", "", "", "On peut  galement changer le contraste d'une image couleur en changeant sa", "composante de luminance."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["name = 'hibiscus'", "f = rescale(load_image(name, n))"]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["m = lambda f: repmat(mean(f, 3), [1 1 3])", "contrast = lambda f, gamma: clamp(m(f).^gamma + f-m(f))"]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["gamma_list = [.5 .75 1 1.5 2 3]", "", "for i in 1: length(gamma_list):", "    subplot(2, 3, i)", "    image(contrast(f, gamma_list(i))); axis image; axis off", "    title(['\\gamma = ' num2str(gamma_list(i))])", "    colormap jet(256)"]}, {"cell_type": "markdown", "metadata": {}, "source": ["Transformations g om triques", "----------------------------", "Une image est un tableau de nombres, avec $n$ lignes et $p$", "colonnes. Il est donc facile d'effectuer", "certaines <http://fr.wikipedia.org/wiki/Transformation_g%C3%A9om%C3%A9trique transformations g om triques>", "sur l'image.", "", "", "Les valeurs des pixels qui composent ce tableau (not  $A$) peuvent  tre", "repr sent es sous la forme $ A = ( a_{i,j} )_{i,j} $", "ou l'index $i$ d crit l'ensemble des nombres $ \\{1,\\ldots,n\\} $", "(les entiers entre 1 et n) et l'index", "$j$ les nombres $ \\{1,\\ldots,p\\} $.", "One dit que $a_{i,j}$ est la valeur du pixel   la position $(i,j)$.", "", "", "Le tableau de pixels ainsi index  peut se repr senter sous la fa on", "suivante", "$$", "A =", "\\begin{pmatrix}", "a_{1,1} &           &           &   & a_{1,p}\\\\", "       &           &  \\vdots   &   &  \\\\", "\t   &           & a_{i-1,j} &   & \\\\", "\\ldots & a_{i,j-1} & a_{i,j}   & a_{i,j+1} & \\ldots\\\\", "\t   &           & a_{i+1,j} &   & \\\\", "       &           &  \\vdots   &   &  \\\\", "a_{n,1} &           &           &   & a_{n,p}\\\\", "\\end{pmatrix}", "$$", "ce qui montre que le pixel en haut   gauche de l'image correspond   la", "valeur $a_{1,1}$. Ceci correspond   la repr sentation de l'image sous", "forme d'une <http://fr.wikipedia.org/wiki/Matrice_(math%C3%A9matiques) matrice>.", "", "", "Si l'on  change le r le des lignes et des colonnes, on d finit un autre", "tableau $B$ avec $p$ lignes et $n$ colonnes. La formule qui d finit", "le tableau $B = ( b_{j,i} )_{i,j}$ est", "$$ b_{j,i} = a_{i,j}. $$", "Ceci correspond   la <http://fr.wikipedia.org/wiki/Matrice_transpos%C3%A9e transposition> de la matrice correspondant   l'image.", "", "", "Pour une image couleur, on effectue cette modification sur chacune de ses", "trois composantes couleur R, V et B.", "", "", "La figure suivante montre l'image correspondant au tableau $A$ et", "l'image correspondant au tableau $B$. On peut constater que la", "modification correspond   faire sur l'image une", "<http://fr.wikipedia.org/wiki/Sym%C3%A9trie_(transformation_g%C3%A9om%C3%A9trique) sym trie> par rapport", "la <http://fr.wikipedia.org/wiki/Diagonale diagonale>", "qui joint le coin haut/gauche au coin bas/droite."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["A = rescale(load_image('flowers', 512))", "B = permute(A, [2 1 3])", "", "imageplot({A B}, {'Image A' 'Image B'}, 1, 2, 1)"]}, {"cell_type": "markdown", "metadata": {}, "source": ["On peut  galement effectuer une <http://fr.wikipedia.org/wiki/Rotation rotation>", "d'un quart de tour dans le sens d'une montre", "l'image. Ceci est effectu  en d finissant une image $C = (c_{i,j})_{j,i}$ de", "$p$ lignes et $n$", "colonnes dont le tableau", "de nombre est calcul  par", "$$ c_{j,i} =  a_{n-i+1,j}.$$"]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["C = A", "C = C(end: -1: 1, : , : ); C = permute(C, [2 1 3])", "", "imageplot({A C}, {'Image A' 'Image C'}, 1, 2, 1)"]}, {"cell_type": "markdown", "metadata": {}, "source": ["Fondu entres deux images", "------------------------", "On souhaite effectuer une <http://fr.wikipedia.org/wiki/Fondu transition entre deux images>", "$A$ et $B$ de m me", "taille. On suppose donc que chaque image a le m me nombre $n$ de lignes", "et le m me nombre $p$ de colonnes.", "", "", "La figure ci-dessous montre les deux images entre lesquelles on souhaite", "calculer une transition."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["A = rescale(load_image('flowers', 512))", "B = rescale(load_image('hibiscus', 512))", "", "imageplot({A B}, {'Image A', 'Image B'})"]}, {"cell_type": "markdown", "metadata": {}, "source": ["One note $A = (a_{i,j})_{i,j}$ les pixels de l'image $A$ et", "$B = (b_{i,j})_{i,j}$ les pixels de l'image $B$.", "", "", "Pour une valeur $t$ fix e entre $0$ et $1$, on d finit l'image", "$C = (c_{i,j})_{i,j}$ comme", "$$ c_{i,j}  = (1-t) a_{i,j} + t b_{i,j}.$$", "Il s'agit de la formule d'une", "<http://fr.wikipedia.org/wiki/Interpolation_lin%C3%A9aire interpolation lin aire>", "entre les deux images.", "", "", "Si l'image est une image couleur, on applique cette formule   chacun des", "canaux R, V et B.", "", "", "On peut constater que pour $t=0$, l'image $C$ est  gale   l'image", "$A$. Pour $t=1$, l'image $c$ est  gale   l'image", "$B$. Lorsque la valeur $t$ progresse de 0   1, on obtient ainsi un", "effet de fondu, puisque l'image, qui au d part est proche de l'image $A$", "ressemble de plus en plus   l'image $B$.", "", "", "La figure suivante montre 5 valeurs de $t$ r parties entre 0 et 1."]}, {"cell_type": "code", "language": "python", "metadata": {}, "outputs": [], "collapsed": false, "input": ["p = 6", "t = linspace(0, 1, p)", "", "for i in 1: p:", "    imageplot(t(i)*A + (1-t(i))*B, ['t = ' num2str(t(i), 2)], 2, p/ 2, i)"]}, {"cell_type": "markdown", "metadata": {}, "source": ["Conclusion", "----------", "Cet article n'a fait qu'effleurer l'immense liste des traitements que l'on", "peut faire subir   une image. Le traitement math matique des images est un domaine", "tr s actif, o  les avanc es th oriques se concr tisent sous la forme d'algorithmes", "rapides de calcul qui ont des applications importantes pour la manipulation des contenus", "num riques.", "", "", "Les personnes int ress es pourront consulter le site web", "<http://www.numerical-tours.com/ A Numerical Tour of Signal Processing>", "pour de nombreux exemples de traitements d'images. On y", "trouve  galement des liens vers d'autres ressources disponibles en ligne.", "", "Glossaire", "---------", "", "", "- *Al atoire* : valeur impr visible souvent due au hazard, comme par exemple le bruit qui perturbe les images de mauvaises qualit s.", "", "- *Bit* : unit   lementaire de stockage de l'information sous forme de 0 et de 1 dans un ordinateur.", "", "- *Canal* : une des trois images  l mentaires qui composent une image couleur.", "", "- *Bords* : zone d'une image o  les valeurs des pixels varient beaucoup, qui correspond aux contours des objets qui forment l'image.", "", "- *Bruit* : petites perturbations qui d gradent la qualit  d'une image.", "", "- *Carr * : le carr  $b$ d'une valeur $a$ est $a \\times a$. Il est not  $a^2$.", "", "- *Contraste* : quantit  informelle qui indique la diff rence entre les zones claires et les zones sombres d'une image.", "", "- *Compression d'image* : m thode permettant de r duire la place m moire n cessaire au stockage sur le disque dur d'une image.", "", "- *Ecriture binaire* :  criture de valeurs num riques   l'aide uniquement de 0 et de 1.", "", "- *Flou* : d gradation d'une image qui rend les contours des objets peu net, et donc difficile   localiser pr cis ment.", "", "- *Fondu* : interpolation lin aire entre deux images.", "", "- *Image couleur* : ensemble de trois images en niveau de gris, qui peut  tre affich    l' cran en couleur.", "", "- *Image num rique* : tableau de valeurs que l'on peut afficher   l' cran en assignant un niveau de gris   chaque valeur.", "", "- *Inverse* : op ration ramenant une image dans son  tat d'origine.", "", "- *JPEG-2000* : m thode r cente de compression d'images qui utilise une transformation en ondelettes.", "", "- *Luminance* : moyenne des diff rents canaux d'une image, qui indique la puissance lumineuse du pixel.", "", "- *Matrice* : tableau de valeurs, repr sent  sous la forme $(a_{i,j})_{i,j}$.", "", "- *M diane* : valeur centrale lorsque l'on classe par ordre croissant un ensemble de valeurs.", "", "- *Moyenne* : la moyenne d'un ensemble de valeurs est leur somme divis e par leur nombre.", "", "- *Niveaux de gris* : nuances de gris utilis es pour afficher   l' cran une image num rique.", "", "- *Nombres entiers* : nombres 0, 1, 2, 3, 4 ...", "", "- *Octet* : ensemble de huit bits cons cutifs.", "", "- *Ondelettes* : transformation de l'image qui est utilis e par la m thode JPEG-2000 de compression d'images.", "", "- *Ordre croissant* : classement d'un ensemble de valeurs de la plus petite   la plus grande.", "", "- *Pixel* : une case dans un tableau de valeurs correspondant   une image num rique.", "", "- *Quantification* : proc d  consistant   r duire l'ensemble des valeurs possibles d'une image num rique.", "", "- *Racine carr e* : la racine carr e $b$ d'une valeur positive $a$ est la valeur positive $b$ v rifiant $a=b \\times b$. On la note $\\sqrt{a}$.", "", "- *R solution* : taille d'une image (nombre de pixels).", "", "- *Sous-expos e* : photographie d'une sc ne trop sombre pour laquelle l'objectif photographique n'est pas rest  assez longtemps ouvert.", "", "- *Synth se additive* : r gle permettant de construire une couleur quelconque   partir des trois couleurs rouge, vert et bleu. C'est la r gle qui r git le m lange des couleurs de faisceaux lumineux utilis s pour l' clairage d'un mur blanc.", "", "- *Synth se soustractive* : r gle permettant de construire une couleur quelconque   partir des trois couleurs cyan, magenta et jaune. C'est la r gle qui r git le m lange des couleurs en peinture."]}]}], "nbformat": 3, "metadata": {"name": ""}, "nbformat_minor": 0}