{"cells":[{"cell_type":"markdown","id":"61cdb911-1692-4548-9c1c-d909ecf27899","metadata":{},"source":"Econometría Aplicada. Lección 1\n===============================\n\n**Author:** Marcos Bujosa\n\n"},{"cell_type":"markdown","id":"d7986f33-5b04-4841-af4f-5399d16b4271","metadata":{},"source":["
\n

\nEn esta lección veremos algunas transformaciones de los datos para\n\"hacerlos estacionarios\"; y daremos interpretación a los datos transformados.\n

\n\n
\n\n- [lección en html](https://mbujosab.github.io/EconometriaAplicada-SRC/Lecc01.html)\n- [lección en mybinder](https://mybinder.org/v2/gh/mbujosab/EconometriaAplicada-SRC/HEAD?labpath=Lecc01.ipynb)\n\n"]},{"cell_type":"markdown","id":"47e7ed85-f454-4012-83fa-b73ba549fbb5","metadata":{"slideshow":{"slide_type":"skip"}},"source":["#### Carga de algunos módulos de python\n\n"]},{"cell_type":"code","execution_count":1,"id":"8bde424b-fa3a-4609-9ef3-1b7bc1119b04","metadata":{"slideshow":{"slide_type":"skip"}},"outputs":[],"source":["# Para trabajar con los datos y dibujarlos necesitamos cargar algunos módulos de python\nimport numpy as np # linear algebra\nimport pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)\nimport matplotlib as mpl\n# definimos parámetros para mejorar los gráficos\nmpl.rc('text', usetex=False)\nimport matplotlib.pyplot as plt # data visualization"]},{"cell_type":"markdown","id":"5203d3dd-f0f6-48d1-aa8d-37dc6c833a53","metadata":{"slideshow":{"slide_type":"slide"}},"source":["## Procesos estocásticos y datos de series temporales\n\n"]},{"cell_type":"markdown","id":"c2900509-9a0b-476a-9795-88f9d86515f4","metadata":{},"source":["- **Proceso estocástico:** es una secuencia de variables aleatorias,\n $X_t$ donde el índice $t$ recorre el conjunto de números enteros\n $(\\mathbb{Z})$. $$\\boldsymbol{X}\\;=\\;\n (\\ldots,X_{-2},X_{-1},X_0,X_1,\\ldots)\\;=\\; \n (X_t \\mid t\\in\\mathbb{Z});$$\n\n- **Muestra:** es una secuencia finita de datos\n \n $$\\boldsymbol{x} = (x_1, x_2,\\ldots x_n)$$\n \n - Consideraremos cada dato $x_t$ como una *realización de* $X_t$.\n \n - Consecuentemente, consideraremos que una *muestra* es una\n *realización de un tramo finito* de un proceso estocástico:\n \n $$(x_1, x_2,\\ldots x_n) \\text{ es una realización de }(X_t \\mid t=1:n).$$\n\n"]},{"cell_type":"markdown","id":"1ec13790-fcc0-4f3e-9214-25ebf979cbb1","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["### Datos de sección cruzada vs datos de series temporales\n\n"]},{"cell_type":"markdown","id":"24f691f1-3c0b-4617-b8ac-e0bbe8eb6df5","metadata":{},"source":["Consideremos dos tipos de muestras $\\boldsymbol{x} = (x_1, x_2,\\ldots x_n):$\n\n- **Sección cruzada:** el índice NO es cronológico. La numeración (la\n indexación) de cada dato es solo una asignación arbitraria de\n *etiquetas* que identifican a cada individuo, empresa, objeto,\n etc. que ha sido medido. Consecuentemente:\n - *el orden en el que aparecen los datos de la muestra es irrelevante*.\n - conocer el índice de un dato no permite deducir nada respecto de\n cualquier otro dato.\n\n"]},{"cell_type":"markdown","id":"92c12ef1-bb4b-4e57-85da-c47fd4d264bd","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["- **Series temporales:** Corresponden a mediciones de un mismo objeto a\n lo largo del tiempo. El índice indica el instante de cada medición.\n *Es habitual que el orden cronológico de los datos sea importante*\n para explicar cada uno de ellos.\n - con frecuencia la medición en un instante de tiempo está\n relacionada con otras mediciones próximas en el tiempo. En tal\n caso…\n \n - no debemos asumir que las variables aleatorias del\n proceso estocástico subyacente, \n $\\boldsymbol{X}=(X_t \\mid t\\in\\mathbb{Z})$, \n sean independientes entre sí.\n\n"]},{"cell_type":"markdown","id":"609e3eb7-82bf-498b-b449-26f378e76697","metadata":{"slideshow":{"slide_type":"slide"}},"source":["### El desafío\n\n"]},{"cell_type":"markdown","id":"4ba4696d-1187-46a5-829a-d661e8bc0216","metadata":{},"source":["El análisis de *series temporales* trata sobre la inferencia\nestadística de muestras que **frecuentemente NO podemos asumir que sean\nrealizaciones** de variables aleatorias *i.i.d.* (*independientes e\nidénticamente distribuidas*).\n\n"]},{"cell_type":"markdown","id":"8d9a1872-6388-4eec-8c6d-23a9e3db17a2","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["Además,\n\n- Aunque el marco ideal es que la serie temporal analizada \"**sea estacionaria**\"\n \n (*abuso del lenguaje que expresa que podemos asumir que la serie es\n una realización de un proceso estocástico estacionario, es decir,\n cuyos momentos no dependen del índice $t$*)\n- lo habitual es que, por distintos motivos, **NO lo sea**\n\n"]},{"cell_type":"code","execution_count":1,"id":"39fbc5a8-1493-410a-9b3d-bd4372fde6f7","metadata":{"slideshow":{"slide_type":"skip"}},"outputs":[],"source":["path = './datos/'\ndf1 = pd.read_csv(path+'PIB_UEM.csv')\ndf2 = pd.read_csv(path+'ProduccionCemento.csv')\ndf3 = pd.read_csv(path+'IBEX35.csv')\ndf4 = pd.read_csv(path+'ExportacionDeAcero.csv')\n#print(df1.head())"]},{"cell_type":"code","execution_count":1,"id":"99554f7f-d465-4c01-ab6b-113352844df0","metadata":{"slideshow":{"slide_type":"skip"}},"outputs":[],"source":["df1.plot(x='obs',xlabel='',title='PIB UEM', figsize=(15,4))"]},{"cell_type":"markdown","id":"1071d071-a716-4c71-974e-5612097a49b8","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["![img](./img/lecc01/PIB_UEM.png)\n\n"]},{"cell_type":"code","execution_count":1,"id":"ba38a6fb-9f12-4539-b1af-7a60dd75bef8","metadata":{"slideshow":{"slide_type":"skip"}},"outputs":[],"source":["df2.plot(x='obs',xlabel='',title='Producción de cemento en España', figsize=(15,4))"]},{"cell_type":"markdown","id":"289f2d84-b77a-4504-9cfe-8e7085a5272b","metadata":{},"source":["![img](./img/lecc01/ProduccionCemento.png)\n\n"]},{"cell_type":"code","execution_count":1,"id":"82b08148-e9ce-4f55-a0b4-b45582a2d221","metadata":{"slideshow":{"slide_type":"skip"}},"outputs":[],"source":["df3.plot(x='obs',xlabel='',title='Rendimiento porcentual diario del IBEX 35', figsize=(15,4))"]},{"cell_type":"markdown","id":"1ebf3d1f-02b3-40b2-8242-740e76a883bc","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["![img](./img/lecc01/IBEX35.png)\n\n"]},{"cell_type":"code","execution_count":1,"id":"3357129b-c903-4ad0-a6ac-128ca9049a85","metadata":{"slideshow":{"slide_type":"skip"}},"outputs":[],"source":["df4.plot(x='obs',xlabel='',title='Exportaciones españolas de acero', figsize=(15,4))"]},{"cell_type":"markdown","id":"ec712b2e-20cc-440e-b283-3613a5c86149","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["![img](./img/lecc01/ExportacionDeAcero.png)\n\n"]},{"cell_type":"markdown","id":"c6bf4089-3a82-4741-bb45-a5c6b9637b2f","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["El desafío para el analista es\n\n- **primero:** transformar los datos para lograr que sean \"***estacionarios***\"\n- **y después:** transformar los datos estacionarios en \"***ruido blanco***\"\n \n (*nuevo abuso del lenguaje que expresa que podemos asumir dichos\n datos transformados son realizaciones de un proceso de ruido blanco,\n i.e. de media cero e incorrelado.*)\n\n"]},{"cell_type":"markdown","id":"f48d0044-d388-43c8-91d1-852f3dd2c0bf","metadata":{"slideshow":{"slide_type":"slide"}},"source":["## Estacionariedad\n\n"]},{"cell_type":"markdown","id":"bb974bad-46f1-4b9b-9fd9-abd23878999d","metadata":{},"source":["El mayor objetivo del *análisis de series temporales* es inferir la\ndistribución de $\\boldsymbol{X}=(X_t \\mid t\\in\\mathbb{Z})$ usando una\nmuestra finita (serie temporal) $\\boldsymbol{x}=(x_t \\mid t=1:n)$. \n\nAsí podremos\n\n- **Predecir:** datos futuros\n- **Controlar:** datos futuros\n\nPero esto es casi imposible si los datos son inestables a lo largo del\ntiempo\n\nPor tanto, algún tipo de estabilidad o estacionariedad es\nnecesaria.\n\n"]},{"cell_type":"markdown","id":"1dea4da8-06ba-4768-828f-b5d16f84b9cd","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["### Estacionariedad en sentido débil\n\n"]},{"cell_type":"markdown","id":"b33178e4-757f-4f5a-9d95-92b594a9058e","metadata":{},"source":["Un proceso estocástico $\\boldsymbol{X}$ se dice **estacionario** (*en\nsentido débil*) si para todo $t,k\\in\\mathbb{Z}$\n\n\\begin{equation}\n\\label{orgde20a06}\nE(X_t) = \\mu\n\\end{equation}\n\n\\begin{equation}\n\\label{org7509fa2}\nCov(X_t,X_{t-k}) = \\gamma_k \n\\end{equation}\n\n- ([1](#orgde20a06)) sugiere que las realizaciones de\n $\\boldsymbol{X}$ generalmente oscilan entorno a $\\mu$.\n\n- ([2](#org7509fa2)) entre otras cosas, sugiere que la\n variabilidad de las realizaciones de $\\boldsymbol{X}$ entorno a\n $\\mu$ es constante, pues para el caso particular $k=0$\n \n $$Cov(X_t,X_{t-0})=Var(X_t) = \\gamma_0\\quad\\text{ para todo } t$$\n \n Por tanto, $\\gamma_0$ es la varianza común a todas las variables\n aleatorias del proceso.\n\n"]},{"cell_type":"markdown","id":"33b30a60-42a2-4d1b-845b-9ccbc133a495","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["Es más, la desigualdad de Chebyshev\n$$P\\left(|X_t-\\mu|\\geq c\\sigma\\right)\\leq\\frac{1}{c^2},\\quad\\text{ donde } \\sigma=\\sqrt{\\gamma_0}$$\nsugiere que para cualquier proceso estacionario (y un $c$ grande), al\npintar una realización, tan solo un pequeño porcentaje de los datos\ncaerán fuera de la franja $\\left(\\mu-c\\sigma, \\mu+c\\sigma\\right)$.\n\n"]},{"cell_type":"code","execution_count":1,"id":"e0e568e5-f353-462c-86ea-4fb386a952ca","metadata":{"slideshow":{"slide_type":"skip"}},"outputs":[],"source":["import statsmodels.api as sm\nnp.random.seed(12345)\narparams = np.array([.75, -.25])\nmaparams = np.array([.65, .35])\nar = np.r_[1, -arparams] # add zero-lag and negate\nma = np.r_[1, maparams] # add zero-lag\ny = sm.tsa.arma_generate_sample(ar, ma, 250)\nplt.figure(figsize=(15,5))\nplt.plot(y)\n#plt.savefig(\"./img/lecc01/stationaryTimeSeriesExample.png\")"]},{"cell_type":"markdown","id":"52edc5ab-44c0-4c56-864f-47a7930211f8","metadata":{},"source":["![img](./img/lecc01/stationaryTimeSeriesExample.png)\n\n"]},{"cell_type":"markdown","id":"39bc833a-044b-4438-b940-009b837907ee","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["### Función de autocovarianzas y función de autocorrelación\n\n"]},{"cell_type":"markdown","id":"632c5f18-0988-45f5-960f-6315f8345e8c","metadata":{},"source":["Cuando $\\boldsymbol{X}$ es un proceso estocástico (débilmente) **estacionario** \n\n- La secuencia $\\;(\\gamma_k \\mid k\\in\\mathbb{Z}),\\;$ donde \n $\\;\\gamma_k = Cov(X_t,X_{t-k})\\;$\n se denomina *función de autocovarianzas*\n\n"]},{"cell_type":"markdown","id":"93f792f4-fca4-4c4c-b9f6-724ba0be5bba","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["Debido a la estacionariedad, la correlación entre $X_t$ y $X_{t+k}$ no\ndepende de $t$; tan solo depende de la distancia temporal $k$ entre\nambas variables.\n\n- La secuencia $\\;(\\rho_k \\mid k\\in\\mathbb{Z}),\\;$ donde\n $\\;\\rho_k=\\frac{Cov(X_t,X_{t-k})}{\\sqrt{Var(X_t)Var(X_{t-k})}}=\\frac{\\gamma_k}{\\gamma_0}\\;$\n se denomina *función de autocorrelación* (ACF).\n\n"]},{"cell_type":"markdown","id":"d25d26cd-1e8c-4dc8-9ab1-9e67b495b126","metadata":{"slideshow":{"slide_type":"slide"}},"source":["## Transformaciones de realizaciones de procesos estocásticos NO estacionarios\n\n"]},{"cell_type":"markdown","id":"538095f8-9f24-4084-93ba-93a0ca8d8c46","metadata":{},"source":["Un proceso estocástico $\\boldsymbol{X}=(X_t \\mid t\\in\\mathbb{Z})$ puede ser\n\n- **NO estacionario en media:** porque $E(X_t)$ depende de $t$.\n\n- **NO estacionario en covarianza:** porque $Cov(X_t,X_{t-k})$ depende de $t$.\n\nSeparar o distinguir ambos tipos de no estacionariedad no es sencillo.\n\n"]},{"cell_type":"markdown","id":"0877f936-a447-4f8a-9d1a-df77a0361ab6","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["Veamos un ejemplo de serie temporal para la que \n\n- no podemos asumir que sea realización de un proceso estocástico\n *estacionario*\n- y algunos intentos de transformación para obtener datos\n \"**estacionarios**\" (\\*)\n \n (*recuerde que esta expresión, aunque extendida, es un abuso del\n lenguaje*).\n\n"]},{"cell_type":"markdown","id":"d5967453-8401-4341-821f-5e5b058d9895","metadata":{"slideshow":{"slide_type":"slide"}},"source":["### Internat. airline passengers: monthly totals in thousands. Jan 49 – Dec 60\n\n"]},{"cell_type":"code","execution_count":1,"id":"409396f9-dbd0-4840-be17-07eaa8186628","metadata":{"slideshow":{"slide_type":"skip"}},"outputs":[{"name":"stdout","output_type":"stream","text":"Passengers\nMonth \n1949-01-01 112\n1949-02-01 118\n1949-03-01 132\n1949-04-01 129\n1949-05-01 121"}],"source":["# Leemos los datos de un fichero csv y generamos un dataframe de pandas.\nOrigData = pd.read_csv('./database/Datasets-master/airline-passengers.csv')\nOrigData['Month']=pd.to_datetime(OrigData['Month'])\nOrigData=OrigData.set_index(['Month'])\nprint(OrigData.head())"]},{"cell_type":"code","execution_count":1,"id":"9d4f8ab5-762a-430c-8335-b433c6d5c0b0","metadata":{"slideshow":{"slide_type":"skip"}},"outputs":[],"source":["plt.figure(figsize=(15,5))\nplt.subplot(1, 2, 1)\nplt.plot(OrigData['Passengers'])\nplt.xlabel(\"Month\")\nplt.ylabel(r\"Number of Air Passengers, ($\\boldsymbol{x}$)\")\nplt.subplot(1, 2, 2)\nplt.hist(OrigData['Passengers'], edgecolor='white', bins=11)\nplt.tight_layout()\n#plt.savefig(\"./img/lecc01/airlinepass+hist.png\")"]},{"cell_type":"markdown","id":"8a672ca9-d211-48d9-941f-8f15d8cb2f11","metadata":{},"source":["![img](./img/lecc01/airlinepass+hist.png)\n\n$$\\boldsymbol{x}=(x_1,\\ldots x_{114})$$\n\nSerie *\"no estacionaria\"* (\\*):\n\n- La media crece de año en año\n- La variabilidad estacional crece de año en año (fíjese en la\n diferencia entre el verano y el otoño de cada año)\n\n"]},{"cell_type":"markdown","id":"f1a9a464-7a59-4054-82c6-562e9056e0a5","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["#### Trasformación logarítmica de los datos\n\n"]},{"cell_type":"markdown","id":"bb87c04b-01ee-4422-b7a3-92801261fd30","metadata":{},"source":["- Al aplicar la función logarítmica transformamos **monótonamente** los\n datos estabilizando la varianza cuando los valores son mayores que\n 0.567 (aprox.)\n\n- Pero ocurre lo contrario cuando los valores son pequeños (aumenta el\n valor absoluto de aquellos entre 0 y 0.567 aprox.). De hecho,\n $\\lim\\limits_{x\\to0} \\ln(x)=-\\infty$.\n\n- Además, *el logaritmo no está definido para valores negativos*.\n\n"]},{"cell_type":"code","execution_count":1,"id":"1baa4f02-b664-470d-92dc-19da0d45342f","metadata":{"slideshow":{"slide_type":"skip"}},"outputs":[],"source":["# Definir el rango de valores para x (empezando desde un número positivo ya que log(0) no está definido)\nx = np.linspace(0.01, 7, 400) # Valores de 0.1 a 10\n\n# Calcular y = log(x)\ny = np.log(x)\n\n# Crear el gráfico\nplt.figure(figsize=(16, 5))\nplt.plot(x, y, label='y = ln(x)')\n\n# Añadir etiquetas y título\nplt.xlabel('x')\nplt.ylabel('ln(x)')\nplt.title('Gráfico de la función logarítmica y = ln(x)')\nplt.axhline(0, color='black',linewidth=0.5)\nplt.axvline(0, color='black',linewidth=0.5)\nplt.grid(color = 'gray', linestyle = '--', linewidth = 0.5)\nplt.legend()\n#plt.savefig(\"./img/lecc01/funcion_logaritmica.png\")"]},{"cell_type":"markdown","id":"6a30a276-0bfb-49b4-9ab1-c19982b02077","metadata":{},"source":["![img](./img/lecc01/funcion_logaritmica.png)\n\n"]},{"cell_type":"code","execution_count":1,"id":"108ca0cc-60f7-4059-ba10-a11d397ff26a","metadata":{"slideshow":{"slide_type":"skip"}},"outputs":[],"source":["# Creamos un nuevo dataframe con los datos originales y varias transformaciones de los mismos\nTransformedData = OrigData.copy()\nTransformedData['dataLog'] = np.log(OrigData['Passengers'])\nTransformedData['dataLogDiff'] = TransformedData['dataLog'].diff(1)\nTransformedData['dataLogDiffDiff12'] = TransformedData['dataLogDiff'].diff(12)"]},{"cell_type":"code","execution_count":1,"id":"fe4bc053-1765-4472-b150-378f04950080","metadata":{"slideshow":{"slide_type":"skip"}},"outputs":[],"source":["plt.figure(figsize=(15,5))\nplt.subplot(1, 2, 1)\nplt.plot(TransformedData['dataLog'])\nplt.xlabel(\"Month\")\nplt.ylabel(r\"Log-Passengers, ($\\ln\\boldsymbol{x}$) \")\nplt.subplot(1, 2, 2)\nplt.hist(TransformedData['dataLog'], edgecolor='white', bins=11)\nplt.tight_layout()\n#plt.savefig(\"./img/lecc01/airlinepass_log+hist.png\")"]},{"cell_type":"markdown","id":"1e04ce9f-acbd-4e30-b2a8-7a16eeaf8058","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["![img](./img/lecc01/airlinepass_log+hist.png)\n\n$$\\ln\\boldsymbol{x}=\\Big(\\ln(x_1),\\ldots \\ln(x_{114})\\Big)$$\n\nÉsta tampoco parece la realización de un proceso estocástico *estacionario*\n\n- Ahora la variabilidad estacional parece mantenerse de año en año\n- Pero la media sigue creciendo de año en año\n\n"]},{"cell_type":"markdown","id":"453102d1-02e6-418c-b0ed-851a7e078e88","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["#### Primera diferencia del logarítmo de los datos\n\n"]},{"cell_type":"code","execution_count":1,"id":"e9b6fd29-2145-47f0-a45b-aa87158b9360","metadata":{"slideshow":{"slide_type":"skip"}},"outputs":[],"source":["plt.figure(figsize=(15,5))\nplt.subplot(1, 2, 1)\nplt.plot(TransformedData['dataLogDiff'])\nplt.xlabel(\"Month\")\nplt.ylabel(r\"$\\nabla\\ln\\boldsymbol{x}$\")\nplt.subplot(1, 2, 2)\nplt.hist(TransformedData['dataLogDiff'], edgecolor='white', bins=11)\nplt.tight_layout()\n#plt.savefig(\"./img/lecc01/airlinepass_logDiff+hist.png\")"]},{"cell_type":"markdown","id":"bece4592-b9f2-4beb-8bb6-97d895282c89","metadata":{},"source":["![img](./img/lecc01/airlinepass_logDiff+hist.png)\n\n$$\\boldsymbol{y}=\\nabla\\ln\\boldsymbol{x}=\\Big(\\big[\\ln(x_2)-\\ln(x_1)\\big],\\ldots\\; \\big[\\ln(x_{114})-\\ln(x_{113})\\big]\\Big)$$\n\nEsta serie tampoco parece *\"estacionaria\"* (\\*)\n\n- Hay un *persistente* componente periódico (de naturaleza\n estacional), debido a que hay pocos viajes en otoño y muchos en\n Navidad, Semana Santa y verano (i.e., el número esperado de viajeros\n parece cambiar en función del mes o estación).\n\n"]},{"cell_type":"markdown","id":"c8a1e6af-0408-43c5-b619-7ded4f4e3ad2","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["#### Diferencia estacional de la primera diferencia del logarítmo de los datos\n\n"]},{"cell_type":"code","execution_count":1,"id":"97c59519-69aa-4594-b2b3-4b080553877e","metadata":{"slideshow":{"slide_type":"skip"}},"outputs":[],"source":["plt.figure(figsize=(15,5))\nplt.subplot(1, 2, 1)\nplt.plot(TransformedData['dataLogDiffDiff12'])\nplt.xlabel(\"Month\")\nplt.ylabel(r\"$\\nabla_{12}(\\nabla\\ln\\boldsymbol{x})$\")\nplt.subplot(1, 2, 2)\nplt.hist(TransformedData['dataLogDiffDiff12'], edgecolor='white', bins=11)\nplt.tight_layout()\n#plt.savefig(\"./img/lecc01/airlinepass_logDiffDiff12+hist.png\")"]},{"cell_type":"markdown","id":"ca091327-c379-4c10-920e-50c75696da8b","metadata":{},"source":["![img](./img/lecc01/airlinepass_logDiffDiff12+hist.png)\n\n$$\\boldsymbol{z}=\\nabla_{12}(\\nabla\\ln\\boldsymbol{x})=\\nabla_{12}(\\boldsymbol{y})=\\Big((y_{13}-y_{1}),\\ldots\\; (y_{113}-y_{101})\\Big)$$\n\nEsta serie se aproxima más al aspecto de la realización de un proceso *estacionario*\n\n- Aunque parece haber más varianza a principios de los 50 que a finales\n- De propina, el histograma sugiere una distribución aproximadamente Gaussiana\n\n"]},{"cell_type":"markdown","id":"82736fa7-194b-4afa-9b34-d236201acc4a","metadata":{"slideshow":{"slide_type":"slide"}},"source":["### Tasa logarítmica de crecimiento\n\n"]},{"cell_type":"code","execution_count":1,"id":"c878221d-663f-4bdc-8915-db58f455e47b","metadata":{"slideshow":{"slide_type":"skip"}},"outputs":[],"source":["START = 100\nUnoPorCiento = lambda n0, t: n0 if t<=1 else 1.01 * UnoPorCiento(n0, t-1)\nTasaLogCrecimiento = pd.DataFrame({'$y_t$':[UnoPorCiento(START,t+1) for t in range(10)]})\nTasaLogCrecimiento['$\\\\frac{y_t-y_{t-1}}{y_{t-1}}$'] = TasaLogCrecimiento['$y_t$'].pct_change()\nTasaLogCrecimiento['$\\\\ln y_t$'] = np.log(TasaLogCrecimiento['$y_t$'])\nTasaLogCrecimiento['$\\\\;(\\\\ln y_t- \\\\ln y_{t-1})$'] = TasaLogCrecimiento['$\\\\ln y_t$'] - TasaLogCrecimiento['$\\\\ln y_t$'].shift(+1)\nTasaLogCrecimiento['$\\\\frac{y_t-y_{0}}{y_{0}}$'] = TasaLogCrecimiento['$y_t$'].apply(lambda x: ((x/START)-1))\nTasaLogCrecimiento['$\\\\;(\\\\ln y_t- \\\\ln y_{0})$'] = TasaLogCrecimiento['$\\\\ln y_t$'] - TasaLogCrecimiento['$\\\\ln y_t$'].iloc[0]"]},{"cell_type":"markdown","id":"fc60b9a7-ec81-4bbb-a4b5-18e83f9ff256","metadata":{},"source":["La tasa logarítmica de variación de $\\boldsymbol{y}$ se define como\n$z_t=\\ln{y_t}-\\ln{y_{t-1}};$ es decir\n\n$$\\boldsymbol{z}=\\nabla\\ln\\boldsymbol{y} = \\Big(\\big[\\ln(y_2)-\\ln(y_1)\\big],\\ldots\\; \\big[\\ln(y_{n})-\\ln(y_{n-1})\\big]\\Big)$$\n\ny se *aproxima* a la tasa de crecimiento (en tanto por uno) si el\nincremento es pequeño.\n\n"]},{"cell_type":"markdown","id":"1c25fc19-66cf-4b08-b297-660c97294dca","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["![img](./img/lecc01/TasaLogCrecimiento.png)\n\n"]},{"cell_type":"markdown","id":"3f9182ac-b4e8-452e-867d-87b422fe60b6","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["#### Comentarios sobre los datos transformados\n\n"]},{"cell_type":"markdown","id":"0bb581ea-0abc-4391-b46b-557f36ffe300","metadata":{},"source":["\n\n\n| Transformación de la serie temporal $\\displaystyle \\boldsymbol{y}=\\{y_t\\},\\; t=1:n$|Comentario|\n|---|---|\n| $\\boldsymbol{z}=\\ln\\boldsymbol{y}=\\{\\ln y_t\\}$|A veces independiza la volatilidad del nivel. A veces induce normalidad.|\n| $\\boldsymbol{z}=\\nabla\\boldsymbol{y}=\\{y_t-y_{t-1}\\}$|Indica al crecimiento absoluto entre periodos consecutivos.|\n| $\\boldsymbol{z}=\\nabla\\ln\\boldsymbol{y}$ $=$ $\\{\\ln{y_t}-\\ln{y_{t-1}}\\}$|Tasa logarítmica de crecimiento. Aproximación del crecimiento relativo entre periodos consecutivos.|\n| $\\boldsymbol{z}=\\nabla\\nabla\\ln\\boldsymbol{y}=\\nabla^2\\ln\\boldsymbol{y}$|Cambio en la tasa log. de crecimiento. Indica la “aceleración” en el crecimiento relativo.|\n| $\\boldsymbol{z}=\\nabla_{s}\\ln\\boldsymbol{y}$ $=$ $\\{\\ln{y_t}-\\ln{y_{t-s}}\\}$|Tasa log. de crecimiento acumulada en un ciclo estacional completo ($s$ períodos). Cuando el período estacional es de un año, se conoce como “tasa anual” o “tasa interanual” de crecimiento.|\n| $\\boldsymbol{z}=\\nabla\\nabla_{s}\\ln\\boldsymbol{y}$|Cambio en la tasa log. de crecimiento acumulada en un ciclo estacional completo. Es un indicador de aceleración en el crecimiento acumulado.|\n\n"]}],"metadata":{"org":null,"kernelspec":{"display_name":"Python 3","language":"python","name":"python3"},"language_info":{"codemirror_mode":{"name":"ipython","version":3},"file_extension":".py","mimetype":"text/x-python","name":"python","nbconvert_exporter":"python","pygments_lexer":"ipython3","version":"3.5.2"}},"nbformat":4,"nbformat_minor":5}