{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "$\\newcommand{\\si}{\\sigma}\n", "\\newcommand{\\al}{\\alpha}\n", "\\newcommand{\\tta}{\\theta}\n", "\\newcommand{\\Tta}{\\Theta}\n", "\\newcommand{\\bet}{\\beta}\n", "\\newcommand{\\Ga}{\\Gamma} \n", "\\newcommand{\\Si}{\\Sigma}\n", "\\newcommand{\\ld}{\\ldots}\n", "\\newcommand{\\cd}{\\cdots}\n", "\\newcommand{\\cN}{\\mathcal{N}}\n", "\\newcommand{\\R}{\\mathbb{R}}\n", "\\newcommand{\\p}{\\mathbb{P}}\n", "\\newcommand{\\f}{\\frac}\n", "\\newcommand{\\ff}{\\frac{1}}\n", "\\newcommand{\\E}{\\op{\\mathbb{E}}}\n", "\\newcommand{\\Var}{\\operatorname{Var}}\n", "\\newcommand{\\ds}{\\displaystyle}\n", "\\newcommand{\\bE}{\\mathbf{E}}\n", "\\newcommand{\\bF}{\\mathbf{F}}\n", "\\newcommand{\\ii}{\\mathrm{i}}\n", "\\newcommand{\\me}{\\mathrm{e}}\n", "\\newcommand{\\hsi}{\\hat{\\sigma}}\n", "\\newcommand{\\hmu}{\\hat{\\mu}}\n", "\\newcommand{\\ste}{\\, ;\\, }\n", "\\newcommand{\\op}{\\operatorname} \n", "\\newcommand{\\argmax}{\\op{argmax}}\n", "\\newcommand{\\lfl}{\\lfloor}\n", "\\newcommand{\\ri}{\\right}\n", "$\n", "\n", "\"Open\n", "\n", "\n", "# Simulation par inversion de la fonction de répartition\n", "\n", "On rappelle que l'algorithme de simulation par inversion de la fonction de répartition consiste à simuler une v.a. $X$ de fonction de répartition $F_X$ dont on sait calculer la pseudo-inverse $F_X^{-1}$ en \n", " 1. Simulant $U\\sim \\mathcal{U}([0,1])$.\n", " 2. Puis en posant $X=F^-(U)$.\n", " \n", "\n", "\n", "## Loi exponentielle\n", "Soit $X\\sim \\mathcal{E} (1)$, sa densité s'écrit $f_X(x) = e^{-x}\\mathbf{1}_{x\\geq 0}$ et sa fonction de répartition s'écrit $$F_X(x)=1 - e^{-x}.$$ \n", "Son inverse est $$F_X^-(u)= -\\log (1-u).$$ \n", "On en déduit que si $U$ suit une loi uniforme sur $[0,1]$, $-\\log U$ suit une loi $\\mathcal{E} (1)$, ce qui nous permet de simuler facilement selon la loi exponentielle." ] }, { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ "import numpy as np\n", "import matplotlib.pyplot as plt\n", "import scipy.stats as sps\n", "%matplotlib inline" ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [], "source": [ "from TP_simulation import *" ] }, { "cell_type": "code", "execution_count": 3, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "simu_loi_expo(int(1e5))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Loi de Cauchy\n", "La *loi de Cauchy de paramètre $a$* est la loi de densité \n", "$$f_a(x) = \\frac 1 {\\pi}\\frac{a}{x^2+a^2}$$ sur $\\mathbb{R}$. \n", "\n", "1. Calculer la fonction de répartition $F_a$ de cette loi, ainsi que son inverse $F_a^{-1}$.\n", "2. Simuler un grand nombre de variables aléatoires de loi de Cauchy de paramètre $a$, représenter l'histogramme associé et le comparer à la densité. Que se passe-t-il lorsque $a$ s'approche de $0$ ?" ] }, { "cell_type": "code", "execution_count": 4, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "simu_loi_cauchy(int(1e5),3)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Simulation par la méthode du rejet\n", "\n", "On rappelle le principe de la simulation par méthode du rejet. On note $f$ la densité sous laquelle on cherche à simuler. On fait l'hypothèse qu'on connaît une densité $g$ sous laquelle on sait facilement simuler (par exemple une loi uniforme), et telle qu'il existe une constante $c$ telle que $$f(x) \\leq c g(x) \\;\\;\\forall x.$$\n", "L'algorithme du rejet poru simuler suivant $f$ consiste alors en les étapes suivantes :\n", "1. Simuler $X$ suivant $g$\n", "2. Simuler $U$ avec une loi uniforme sur $[0,c]$\n", "3. Accepter la valeur de $X$ uniquement si $U\\leq \\frac{f(X)}{g(X)}$ et sinon recommencer à l'étape 1.\n", "\n", "En pratique, pour que cet algorithme soit efficace, on a intérêt à choisir $c$ le plus petit possible tel que $f\\leq c g$ soit vérifiée. L'algorithme est d'autant plus efficace que le taux d'acceptation est grand, il perd vite de son intérêt quand la dimension de l'espace augmente." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Méthode de rejet pour la loi de Wigner\n", "La *loi de Wigner* est la loi de support $[-2, 2]$ et de densité $$\\frac 1 {2\\pi} \\sqrt{4 - x^2}.$$ \n", "1. Simuler un grand nombre de variables aléatoires de loi de Wigner grâce à la méthode du rejet\n", "2. Représenter l'histogramme associé et le comparer à la densité. " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "#### Correction \n", "D'abord, on remarque que la densité est maximale quand $x=0$ et vaut $\\frac 1 {\\pi}$. Si on choisit \n", "$$g(x) = \\frac 1 4 \\mathbf{1}_{[-2,2]}(x),$$ la densité de la loi de Wigner est donc majorée par $\\frac{4}{\\pi}\\times g$, donc on peut appliquer l'algorithme de rejet avec $c = \\frac{4}{\\pi}$." ] }, { "cell_type": "code", "execution_count": 5, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "simu_loi_wigner(int(1e5))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Méthode de rejet pour les lois beta\n", "\n", "Le but de cet exercice est d'utiliser la méthode du rejet pour simuler selon la loi Beta de paramètres $\\alpha>1$ and $\\beta>1$ définie sur l'intervalle $[0, 1]$ par sa densité \n", "$$\n", "f(x; \\alpha, \\beta) =\\frac{ x^{\\alpha-1}(1 - x)^{\\beta-1}}{B(\\al,\\bet)},\\qquad\\qquad \\text{ où } \\qquad \\;\\;B(\\al,\\bet):=\\f{\\Ga(\\al)\\Ga(\\bet)}{\\Ga(\\al+\\bet)}\n", "$$\n", "en utilisant une méthode de rejet. Rappelons que l'espérance, le mode est la variance de cette loi sont respectivement :\n", "\\begin{eqnarray}\n", "\t\\E[X] &= &\\frac{\\alpha}{\\alpha + \\beta}\\\\\n", "\t\\argmax_{x\\in[0,1]} \\ f(x; \\alpha, \\beta)& =& \\frac{\\alpha-1}{\\alpha + \\beta-2}\\\\\n", "\t\\Var(X) &=& \\frac{\\alpha\\beta}{(\\alpha +\\beta)^2(\\alpha+\\beta+1)}\n", "\\end{eqnarray}\n", "\n", "1. Comme la distribution de la loi est définie sur l'intervalle [0,1], on se propose tout d'abord d'utiliser comme loi $g$ la loi uniforme sur cet intervalle. \n", " + Prouver que cela est possible et coder l'algorithme de rejet pour la loi Beta. Simuler un grand nombre de variables aléatoires et comparer avec la densité cible.\n", "\t + Donner une condition sur les paramètres de la loi cible Beta pour laquelle la méthode est la plus efficace.\n", "2. Lorsque les paramètres satisfont $$\\alpha= \\beta,$$ la densité de la loi Beta ressemble à  une cloche. Pour cette raison, on peut dans ce cas utiliser la loi normale comme loi de proposition. \n", " + Quelles valeurs de moyenne et variance $\\mu$, $\\sigma^2$ semblent raisonnables pour cette loi normale ?\n", " + Pour ces valeurs, comment choisir la constante de domination $c$ de la méthode de rejet en fonction de $\\alpha = \\beta$ ?\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "#### Correction avec la loi uniforme\n", "On pose $g$ la densité de la loi uniforme sur [0,1]. Soit \n", "$$c = f\\left(\\frac{\\alpha-1}{\\alpha + \\beta-2},\\alpha,\\beta\\right),$$ la densité de la loi Beta est dominée par $c\\times g$." ] }, { "cell_type": "code", "execution_count": 6, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "simu_loi_beta(int(1e5),1.5,1.3)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "L'algorithme est le plus efficace lorsque la probabilité de rejet est faible, donc lorsque l'aire entre les courbes de $f$ et $c\\times g$ est faible. C'est le cas lorsque $\\alpha$ et $\\beta$ tendent tous les 2 vers $1$. " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "#### Correction avec la loi normale lorsque $\\alpha = \\beta$\n", "On pose $g$ la densité de la loi normale centrée en $\\mu = \\frac{\\alpha}{\\alpha + \\beta}$ et de variance $\\sigma^2 = \\frac{\\alpha\\beta}{(\\alpha +\\beta)^2(\\alpha+\\beta+1)}$. Soit \n", "$$c = f\\left(\\frac{\\alpha-1}{\\alpha + \\beta-2},\\alpha,\\beta\\right),$$ la densité de la loi Beta est dominée par $c\\times g$." ] }, { "cell_type": "code", "execution_count": 7, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "simu_loi_beta2(int(1e5),3)" ] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.8.5" } }, "nbformat": 4, "nbformat_minor": 2 }