{"cells":[{"cell_type":"markdown","id":"efbe724b-3b77-4bf3-992d-d4e098c0aef2","metadata":{},"source":"Econometría Aplicada. Lección 5\n===============================\n\n**Author:** Marcos Bujosa\n\n"},{"cell_type":"markdown","id":"4f6afd69-26c1-43bf-a637-5526d61a9e7c","metadata":{},"source":["
\n

\nEsta lección veremos las dificultades que ocasiona la correlación\nserial y algunos tipos de procesos débilmente estacionarios que nos\npermitirán lidiar con ella. En particular veremos los procesos\nlineales, su valor esperado y su función de autocovarianzas, la\nfunción de covarianzas cruzadas entre dos procesos lineales, y las\necuaciones de Yule-Walker.\n

\n\n
\n\n- [lección en html](https://mbujosab.github.io/EconometriaAplicada-SRC/Lecc05.html)\n- [lección en mybinder](https://mybinder.org/v2/gh/mbujosab/EconometriaAplicada-SRC/HEAD?labpath=Lecc05.ipynb)\n\n"]},{"cell_type":"markdown","id":"321e40f9-8b9b-49e7-b1ed-d0f1c1e1315e","metadata":{"slideshow":{"slide_type":"notes"}},"source":["#### Carga de algunas librerías de R\n\n"]},{"cell_type":"markdown","id":"3d8b33f2-e0ac-4f5b-86e7-3eb3efa77774","metadata":{"slideshow":{"slide_type":"notes"}},"source":["Primero cargamos la librería `tfarima` (Repositorio Cran:\n[https://cran.r-project.org/web/packages/tfarima/index.html](https://cran.r-project.org/web/packages/tfarima/index.html);\nrepositorio GitHub: [https://github.com/gallegoj/tfarima](https://github.com/gallegoj/tfarima))\n\n"]},{"cell_type":"code","execution_count":1,"id":"a679aae4-ac55-4fdc-9b0d-f62013fabc2c","metadata":{"slideshow":{"slide_type":"notes"}},"outputs":[],"source":["library(tfarima) # librería de José Luis Gallego para Time Series\nlibrary(readr) # para leer ficheros CSV\nlibrary(ggplot2) # para el scatterplot (alternaticamente library(tidyverse))\nlibrary(ggfortify) # para pintar series temporales\nlibrary(jtools) # para representación resultados estimación\nlibrary(zoo) # para generar objetos ts (time series)"]},{"cell_type":"markdown","id":"d53dd039-2b92-4190-9548-c9a3c6e8917a","metadata":{"slideshow":{"slide_type":"notes"}},"source":["y además fijamos los parámetros por defecto para las figuras en `png`\ndel notebook\n\n"]},{"cell_type":"code","execution_count":1,"id":"ed8ede2c-081a-49c2-8730-345f1fef8c3e","metadata":{"slideshow":{"slide_type":"notes"}},"outputs":[],"source":["# fijamos el tamaño de las figuras que se generan en el notebook\noptions(repr.plot.width = 12, repr.plot.height = 4, repr.plot.res = 200)"]},{"cell_type":"markdown","id":"a974c335-4e68-4f0f-88c0-e1117e749624","metadata":{"slideshow":{"slide_type":"slide"}},"source":["## Series temporales vs datos de sección cruzada\n\n"]},{"cell_type":"markdown","id":"4f1e14b6-9e34-4ce3-babf-7555f3621cdf","metadata":{},"source":["Corresponden a observaciones de un mismo objeto a lo largo del\ntiempo. El índice indica el instante de cada medición. *El orden\ncronológico puede ser crucial* al modelar los datos.\n\n- El motivo es que frecuentemente el valor medido en un instante de\n tiempo está relacionado con otras mediciones próximas en el tiempo\n (*correlación serial*).\n\n- Si es así, ya no deberíamos asumir que las variables aleatorias del\n proceso estocástico subyacente, $\\boldsymbol{X}=(X_t\\mid\n t\\in\\mathbb{Z})$, son independientes entre sí.\n\nEsto tiene importantes implicaciones en las técnicas de análisis y\nlos modelos a utilizar.\n\nVeamos algunos ejemplos de series temporales…\n\n"]},{"cell_type":"markdown","id":"6d60ad76-d046-4f47-960d-0a52e107de00","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["##### Población en Australia\n\n"]},{"cell_type":"code","execution_count":1,"id":"1c98ad39-008c-4d34-a9c0-4d4d83e65d6d","metadata":{"slideshow":{"slide_type":"notes"}},"outputs":[],"source":["PoblacionAustralia_ts = as.ts( read.zoo('datos/PoblacionAustralia.csv', \n header=TRUE,\n index.column = 1, \n sep=\",\", \n FUN = as.yearmon))\np <- autoplot(PoblacionAustralia_ts)\np <- p + labs(y = \"Habitantes\", x = \"Años\") + ggtitle(\"Población australiana (datos anuales)\")\np <- p + scale_x_continuous(breaks = scales::pretty_breaks(n = 20))\np"]},{"cell_type":"markdown","id":"fcb1399b-f500-4d3c-b565-f921457e2391","metadata":{},"source":["![img](./img/lecc05/PoblacionAustralia.png)\n\n"]},{"cell_type":"markdown","id":"9be54b08-32c6-43eb-84e4-d1c722fe66f2","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["##### PIB UEM\n\n"]},{"cell_type":"code","execution_count":1,"id":"727ff930-5429-43ef-932f-6cb34d2e0219","metadata":{"slideshow":{"slide_type":"notes"}},"outputs":[],"source":["PIB_UEM_df <- read_csv(\"datos/PIB_UEM.csv\",\n show_col_types = FALSE)\nfmt <- \"%YQ%q\"\nPIB_UEM_df$Time <- as.yearqtr(PIB_UEM_df$obs, format = fmt)\n# head(PIB_UEM_df,3)\nP <- ggplot(PIB_UEM_df, aes(Time, PIB))\nP <- P + geom_point() + geom_line()\nP <- P + scale_x_continuous(breaks = scales::pretty_breaks(n = 15))\nP <- P + labs(y = \"Miles de millones de euros\", x = \"Años\")\nP <- P + ggtitle(\"PIB UEM a precios corrientes (datos trimestrales). Fuente Banco de España\")\nP"]},{"cell_type":"markdown","id":"d8e64c8c-170c-44ff-8d76-539dafbc6b29","metadata":{},"source":["![img](./img/lecc05/PIB_UEM.png)\n\n"]},{"cell_type":"markdown","id":"53810529-3e05-4a28-8863-57fc40defe1c","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["##### Temperatura media en el Parque del Retiro. Madrid\n\n"]},{"cell_type":"code","execution_count":1,"id":"d5dd3921-3faf-4ad6-bcf5-3a262e007b9c","metadata":{"slideshow":{"slide_type":"skip"}},"outputs":[],"source":["TemperaturaRetiro_df <- read_csv(\"datos/Retiro.txt\", show_col_types = FALSE)\n# Añadimos fechas\nTemperaturaRetiro_df$Time <- as.yearmon(1985 + seq(0, nrow(TemperaturaRetiro_df)-1)/12)\n\nP <- ggplot(TemperaturaRetiro_df, aes(Time, TemperaturaMedia))\nP <- P + geom_line() # + geom_point() \nP <- P + scale_x_continuous(breaks = scales::pretty_breaks(n = 25))\nP <- P + labs(y = \"Grados Celsius\", x = \"Años\") \nP <- P + ggtitle(\"Temperatura media mensual en el Parque del Retiro. Fuente: Comunidad de Madrid\")\nP"]},{"cell_type":"markdown","id":"f7ae51fc-e28d-41f4-b82b-a7ec13bc4a38","metadata":{},"source":["![img](./img/lecc05/TemperaturaReriro.png)\n\n"]},{"cell_type":"markdown","id":"b41dd032-d6c4-4016-a053-ce7328a09b09","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["##### Rendimiento porcentual diario del IBEX 35 (std)\n\n"]},{"cell_type":"code","execution_count":1,"id":"586bd735-e1af-4e86-9024-13d691a14d53","metadata":{"slideshow":{"slide_type":"notes"}},"outputs":[],"source":["IBEX35_ts = as.ts( read.csv.zoo(\"datos/IBEX35.csv\", \n strip.white = TRUE))\nP <- autoplot(IBEX35_ts) + scale_y_continuous(breaks = scales::pretty_breaks(n = 12))\np <- P + labs(y = \"Desviaciones típicas\", x = \"Días\")\np <- P + ggtitle(\"Rendimiento porcentual diario del IBEX 35 (std.). Fuente: Archivo Prof. Miguel Jerez\")\np"]},{"cell_type":"markdown","id":"240cd53f-8efe-4259-a6c7-70ae7979642e","metadata":{},"source":["![img](./img/lecc05/IBEX35.png)\n\n- Datos centrados y estandarizados, i.e. el eje vertical está en desviaciones típicas.\n- Los *volatility clustering* son característicos de series financieras de alta frecuencia.\n\n"]},{"cell_type":"markdown","id":"e3426ccc-00a5-4582-9f5e-1542a8bef3af","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["##### Producción de cemento\n\n"]},{"cell_type":"code","execution_count":1,"id":"70211abe-aefd-4ae2-bcc1-3c8a0ea50417","metadata":{"slideshow":{"slide_type":"notes"}},"outputs":[],"source":["ProduccionCemento_df <- read_csv(\"datos/ProduccionCemento.csv\",\n show_col_types = FALSE)\nfmt <- \"%YM%m\"\nProduccionCemento_df$Time <- as.yearmon(ProduccionCemento_df$obs, format = fmt)\n# head(ProduccionCemento_df,3)\nP <- ggplot(ProduccionCemento_df, aes(Time, ProduccionCemento))\nP <- P + geom_line() # + geom_point() \nP <- P + scale_x_continuous(breaks = scales::pretty_breaks(n = 25))\nP <- P + labs(y = \"Miles de Toneladas métricas\", x = \"Años\")\nP <- P + ggtitle(\"Producción de cemento (Datos mensuales). Fuente Banco de España\")\nP"]},{"cell_type":"markdown","id":"3dff275a-a239-452a-8e3f-578798d06b6a","metadata":{},"source":["![img](./img/lecc05/ProduccionCemento.png)\n\n"]},{"cell_type":"markdown","id":"cf9301e5-3887-40c5-83da-92e44cb72062","metadata":{"slideshow":{"slide_type":"slide"}},"source":["### Correlación serial vs muestreo aleatorio simple\n\n"]},{"cell_type":"markdown","id":"c1caf345-62df-4aa9-941c-4be84bf9a140","metadata":{},"source":["Con datos de\n\n- **sección cruzada:** solemos asumir que el muestreo es aleatorio\n simple\n - i.e., los datos son realizaciones de variables aleatorias i.i.d.\n\n- **series temporales:** dicha asunción resulta generalmente errónea\n \n - con frecuencia el nivel esperado (o la volatilidad) parece cambiar con $t$\n - con frecuencia hay dependencia temporal (correlación serial).\n \n **Ejemplo**: no parece aceptable asumir que $ProdCemento_{1960M01}$ se\n distribuye igual que $ProdCemento_{2000M04}$ (ni que sea\n independiente de $ProdCemento_{1959M01}$).\n\nVeamos por qué esto genera dificultades…\n\n"]},{"cell_type":"markdown","id":"b1770edd-cbff-4e38-85f8-7a186a452e8c","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["Consideremos el proceso estocástico $$\\boldsymbol{X}=(X_t \\mid\nt=0,\\pm1,\\pm2,\\ldots).$$ Caracterizar su distribución conjunta (todos\nlos momentos) es demasiado ambicioso.\n\n"]},{"cell_type":"markdown","id":"ecc163d2-3df0-4a4b-9133-358891dc9469","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["Así que, tentativamente, vamos a fijarnos *solo* en los dos primeros\nmomentos:\n\n$$E(X_t)={\\color{blue}{ \\mu_t}}\\quad\\text{ y }\\quad\nCov(X_t,X_k)=E\\big[(X_t-\\mu_t)(X_k-\\mu_k)\\big]={\\color{blue}{\\gamma_{t,k}}};\\quad t,k\\in\\mathbb{Z}$$\n\n(si $\\;k=t\\;$ entonces $\\;\\gamma_{t,t}=Var(X_t)=\\sigma^2_t$).\n\nSi el proceso $\\boldsymbol{X}$ fuera gaussiano, conocer estos\n*parámetros* bastaría para caracterizar la distribución conjunta. Pero\naún así…\n\n"]},{"cell_type":"markdown","id":"500641c0-e9be-4b9e-9599-e39ce2ac639f","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["- necesitaríamos para cada $X_t$ una muestra suficiente para estimar los parámetros \n - pero en una serie temporal $\\boldsymbol{x}$ tenemos una sola realización de cada $X_t$.\n\n- Además… para cada variable aleatoria $X_t$ hay infinitos parámetros.\n\n"]},{"cell_type":"markdown","id":"8c2fad1c-fded-40b1-bf9b-a186e015a3e0","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["### Simplificación del escenario\n\n"]},{"cell_type":"markdown","id":"e09471d9-f61a-4f9e-b91b-a9c836be2c9f","metadata":{},"source":["Si $\\boldsymbol{X}$ es [débilmente estacionario](./Lecc01.slides.html#/3/1) se reduce drásticamente el número de parámetros:\n\n\\begin{eqnarray}\n E(X_t) & = \\mu \\\\\n Cov(X_t,X_{t-k}) & = \\gamma_k\n\\end{eqnarray}\n\n"]},{"cell_type":"markdown","id":"e717e8e5-94af-49a7-aa23-d9ce3d36563b","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["El desafío para el analista es (y nótese el abuso de lenguaje)\n\n- **primero:** transformar los datos para lograr que sean \"***estacionarios***\".\n - (Algo vimos en la lección 1))\n- **después:** transformar los datos estacionarios en \"***ruido blanco***\"\n - (Es lo que iniciaremos en esta lección y las siguientes)\n\nTodo este proceso constituye la especificación y ajuste de un modelo a\nla serie temporal.\n\n"]},{"cell_type":"markdown","id":"c15780e7-0e15-47f2-a045-0fd307920c22","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["Antes de atacar los temas de especificación y ajuste de modelos,\ndebemos estudiar un poco los procesos estocásticos débilmente\nestacionarios que vamos a utilizar.\n\n"]},{"cell_type":"markdown","id":"d96665b5-f4c1-4454-8a9a-d15c53abfbd6","metadata":{"slideshow":{"slide_type":"skip"}},"source":["## Procesos estocásticos de segundo orden\n\n"]},{"cell_type":"markdown","id":"66a7ed81-a094-4c77-9cab-732ad7c08761","metadata":{"slideshow":{"slide_type":"skip"}},"source":["El ambiente natural para estudiar las propiedades de segundo orden de\nuna colección de variables aleatorias es el espacio de variables\naleatorias $X$ definidas en un espacio de probabilidad tales que\n$$E(X)=0 \\quad\\text{y}\\quad E(X^2)<\\infty$$ donde $E$ es el operador\nesperanza. Denotaremos este espacio con $H$.\n\n"]},{"cell_type":"markdown","id":"e80b4c6f-d006-4912-bf82-9052161c79ee","metadata":{"slideshow":{"slide_type":"skip"}},"source":["### Un poco de geometría\n\n"]},{"cell_type":"markdown","id":"cae23d1e-0151-4008-aed1-e55a00d2d772","metadata":{"slideshow":{"slide_type":"skip"}},"source":["El espacio, dotado de producto escalar y norma $$\\langle X \\mid Y\n\\rangle=E(XY),\\qquad \\lVert X \\rVert= \\sqrt{E(X^2)},\\qquad X,Y \\in\nH,$$ es un espacio de Hilbert,\n\nNótese que como las variables de $H$ tienen esperanza cero, el\nproducto escalar entre $X,Y\\in H$ también es $$\\langle X \\mid Y\n\\rangle=Cov(X,Y).$$ Por tanto, en este espacio $H$ la noción\ngeométrica de ortogonalidad coincide con la noción estadística de *no\ncorrelación*. Por tanto, en este contexto los términos producto\nescalar, covarianza y esperanza del producto serán intercambiables\n(esto deja de ser cierto cuando hay variables aleatorias con esperanza\nno nula).\n\nUna colección de variables aleatorias pertenecientes a $H$\n$$\\boldsymbol{X}=(X_t\\mid t\\in\\mathbb{Z}) \\;\\text{ con }\\; X_t\\in H$$\nse denomina *proceso estocástico de segundo orden*.\n\nSi $\\boldsymbol{Y}=(Y_t\\mid t\\in\\mathbb{Z})$ es tal que\n$E(Y_t)=\\mu\\ne0$, entonces $\\boldsymbol{Y}$ no es de segundo orden.\n\nPero basta restar $\\mu$ de cada $Y_t$ para tener un proceso\n$(\\boldsymbol{Y}-\\mu\\boldsymbol{1})$ de segundo orden.\n\n*Por ello siempre asumiremos* (sin pérdida de generalidad) *que las\nvariables aleatorias de los procesos estocásticos de esta lección* (y\nla siguiente) *tienen esperanza cero*.\n\n"]},{"cell_type":"markdown","id":"9d39b748-f85b-419d-b1f2-ea8a69a0ee40","metadata":{"slideshow":{"slide_type":"skip"}},"source":["### Primeros momentos de procesos estocásticos de segundo orden\n\n"]},{"cell_type":"markdown","id":"dc54d103-c2a1-4dda-b090-13f1214e66e3","metadata":{"slideshow":{"slide_type":"skip"}},"source":["Si $E(X_t)<\\infty$ para $t\\in\\mathbb{Z}$, entonces $E(\\boldsymbol{X})$ es\nla secuencia $$E(\\boldsymbol{X})=\\big(E(X_t)\\mid\nt\\in\\mathbb{Z}\\big)=\\sum\\nolimits_{t\\in\\mathbb{Z}} E(X_t)\nz^t=\\big(\\ldots,\\;E(X_{-1}),\\;E(X_{0}),\\;E(X_{1}),\\ldots\\big)$$\n\nSi $\\boldsymbol{X}$ tiene segundos momentos finitos, la secuencia de\nautocovarianzas de orden $k$ es\n\n\\begin{align*}\n%Cov(\\boldsymbol{X},\\boldsymbol{X}*z^k) = &\n%E\\Big(\\big[\\boldsymbol{X}-E(\\boldsymbol{X})\\big]\\odot\\big[(\\boldsymbol{X}-E(\\boldsymbol{X}))*z^k\\big]\\Big)\\\\\n\\left.\\Big(Cov(X_t,X_{t-k})\\right| t\\in\\mathbb{Z}\\Big)\n= & \n%\\left.\\Big(E\\big[\\big(X_t-E(X_t)\\big)\\big(X_{t-k}-E(X_{t-k})\\big)\\big]\\; \\right| t\\in\\mathbb{Z}\\Big)\\\\\n%=&\n% \\sum_{t\\in\\mathbb{Z}} \\gamma_{_{k,t}} z^t\n(\\gamma_{_{k,t}}\\mid t\\in\\mathbb{Z})\\\\ % \\;=\\;\n= &\n(\\ldots,\\,\\gamma_{_{k,-1}},\\,{\\color{blue}{\\gamma_{_{k,0}}}},\\,\\gamma_{_{k,1}},\\,\\gamma_{_{k,2}},\\ldots);\\quad k\\in\\mathbb{Z}.\n\\end{align*}\n\n(la secuencia solo contiene la covarianza de orden $k$… pero en distintos instantes $t$).\n\nAsí, para cada par $(k,t)$, tenemos la covarianza $\\gamma_{k,t}$ entre\n$X_t$ y $X_{t-k}$. Por tanto, en general, tenemos una esperanza para\ncada $t$ y una covarianza de orden $k$ para cada $t$. Dado que $t$\nrecorre todos los números enteros, ¡esto son muchos momentos! Por\neso necesitamos reducir el número de parámetros restringiéndonos a\nprocesos estocásticos débilmente estacionarios.\n\n"]},{"cell_type":"markdown","id":"5976c179-908d-4922-bfca-63b7b37aa370","metadata":{"slideshow":{"slide_type":"slide"}},"source":["### Procesos estocásticos (débilmente) estacionarios y la ACF\n\n"]},{"cell_type":"markdown","id":"9051d41b-44b5-4071-ad03-ec99ab41ca22","metadata":{},"source":["Un proceso estocástico de segundo orden $\\boldsymbol{X}$ se dice que\nes *débilmente estacionario* si $E(X_t)=\\mu$ para todo\n$t\\in\\mathbb{Z}$ y la covarianza entre $X_s$ y $X_t$ solo depende de\nla diferencia $s-t$ para todo $s,t\\in\\mathbb{Z}$.\n\nEn tal caso, definimos la función de autocovarianzas como:\n$$\\boldsymbol{\\gamma} = (\\gamma_{k}\\mid k\\in\\mathbb{Z}) =\n(\\ldots,\\,\\gamma_{-1},\\,{\\color{blue}{\\gamma_{0}}},\\,\\gamma_{1},\\,\\gamma_{2},\\ldots)\n\\;=\\;\\sum_{-\\infty}^{\\infty} \\gamma_k z^k.$$\n\n**Propiedades** de la función de autocovarianzas $\\boldsymbol{\\gamma}$ (ACF):\n\n- $\\gamma_0\\geq0$\n- $\\boldsymbol{\\gamma}$ es definida positiva; y por tanto,\n - $\\boldsymbol{\\gamma}$ es simétrica: $\\gamma_k=\\gamma_{-k}$\n - $\\boldsymbol{\\gamma}$ es acotada: $|\\gamma_k|\\leq\\gamma_0$\n\nY llamamos *función de autocorrelación* (ACF) a la\nsecuencia:\n$\\;\\boldsymbol{\\rho}=\\frac{1}{\\gamma_0}(\\boldsymbol{\\gamma})\n=\\sum\\limits_{k\\in\\mathbb{Z}}\\frac{\\gamma_k}{\\gamma_0}z^k$.\n\n"]},{"cell_type":"markdown","id":"a18861d6-a1f5-4d0f-b9ed-2bb03f840da6","metadata":{"slideshow":{"slide_type":"slide"}},"source":["## Notación: convolución y el operador retardo\n\n"]},{"cell_type":"markdown","id":"0acdd134-f0ed-4b7a-b570-9d38c6b9b791","metadata":{},"source":["Sea $\\boldsymbol{a}$ una secuencia de números y sea $\\boldsymbol{X}$ un\nproceso estocástico tales que la suma\n$$\\sum\\limits_{k=-\\infty}^{\\infty}a_kX_{t-k}\\;$$ converge para todo\n$t.\\;$ Entonces:\n\nDefinimos el producto convolución ($*$) de $\\boldsymbol{a}$ con\n$\\boldsymbol{X}$ como el proceso estocástico:\n$$\\boldsymbol{a}*\\boldsymbol{X}=\\left(\\left.\\sum_{r+s=t} a_r X_s\n\\right| t\\in\\mathbb{Z}\\right)$$ es decir\n$$(\\boldsymbol{a}*\\boldsymbol{X})_t=\\sum_{r+s=t} a_r X_s,\\quad\n\\text{para } t\\in\\mathbb{Z}.$$ Por tanto, cada elemento de\n$(\\boldsymbol{a}*\\boldsymbol{X})$ es una combinación de variables\naleatorias de $\\boldsymbol{X}$\n\n"]},{"cell_type":"markdown","id":"27155107-a1c9-48a3-ac58-4576ad1a406b","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["Podemos aplicar el operador $\\mathsf{B}$ sobre los elementos de un proceso estocástico $\\boldsymbol{X}$.\n$$\\mathsf{B} X_t = X_{t−1},\\quad \\text{para } t\\in\\mathbb{Z}.$$\n\nAplicando el operador $\\mathsf{B}$ repetidamente tenemos $$\\mathsf{B}^k X_t =\nX_{t−k},\\quad \\text{para } t,z\\in\\mathbb{Z}$$\n\n"]},{"cell_type":"markdown","id":"17d2b97b-52e4-42ac-b3fa-297b63b93310","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["Así, para el polinomio $\\boldsymbol{a}(z)=a_0+a_1z+a_2z^2+a_3z^3$, y el proceso estocástico $\\boldsymbol{Y}$\n\n\\begin{align*}\n\\boldsymbol{a}(\\mathsf{B})Y_t \n& = (a_0+a_1\\mathsf{B}+a_2\\mathsf{B}^2+a_3\\mathsf{B}^3) Y_t \\\\\n% & = a_0 Y_t + a_1 \\mathsf{B}^1 Y_t + a_2 \\mathsf{B}^2 Y_t + a_3 \\mathsf{B}^3 Y_t \\\\\n& = a_0Y_t+a_1Y_{t-1}+a_2Y_{t-2}+a_3Y_{t-3} \\\\\n% & =\\sum\\nolimits_{r=0}^3 a_r Y_{t-r} \\\\\n& =(\\boldsymbol{a}*\\boldsymbol{Y})_t,\\quad \\text{para } t\\in\\mathbb{Z}\n\\end{align*}\n\n"]},{"cell_type":"markdown","id":"e7600c23-df7f-4c5e-afea-e719d6dd44d4","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["Y en general, si la suma $\\sum\\limits_{k=-\\infty}^{\\infty}a_kY_{t-k}$\nconverge para todo $t$, entonces\n\n\\begin{align*}\n\\boldsymbol{a}(\\mathsf{B})Y_t \n& = (\\cdots+a_{-2}\\mathsf{B}^{-2}+a_{-1}\\mathsf{B}^{-1}+a_0+a_1\\mathsf{B}+a_2\\mathsf{B}^2+\\cdots) Y_t \\\\\n% & = a_0 Y_t + a_1 \\mathsf{B}^1 Y_t + a_2 \\mathsf{B}^2 Y_t + a_3 \\mathsf{B}^3 Y_t \\\\\n& = \\cdots+a_{-2}Y_{t+2}+a_{-1}Y_{t+1}+a_0Y_t+a_1Y_{t-1}+a_2Y_{t-2}+\\cdots \\\\\n% & =\\sum\\nolimits_{r=0}^3 a_r Y_{t-r} \\\\\n& =(\\boldsymbol{a}*\\boldsymbol{Y})_t,\\quad \\text{para } t\\in\\mathbb{Z}\n\\end{align*}\n\n"]},{"cell_type":"markdown","id":"4dd6200c-bf65-4773-8972-d9edea4a1fd5","metadata":{"slideshow":{"slide_type":"slide"}},"source":["## Ejemplos de procesos (débilmente) estacionarios\n\n"]},{"cell_type":"markdown","id":"e6f1b673-a069-40cd-8827-d31b6dd3bf11","metadata":{},"source":["### Proceso de ruido blanco\n\n"]},{"cell_type":"markdown","id":"09ad94a4-e966-4668-b711-f8c36a31b946","metadata":{},"source":["Una secuencia $\\boldsymbol{U}=(U_t\\mid t\\in\\mathbb{Z})$ de variables\naleatorias **incorreladas** y tales que $$E(U_t)=0\\quad\\text{ y }\\quad\nVar(U_t)=E(U_t^2)=\\sigma^2$$ para $\\;t\\in\\mathbb{Z}\\;$ y\n$\\;0<\\sigma^2<\\infty\\;$ se llama *proceso de ruido blanco*.\n$\\quad\\boldsymbol{U}\\sim WN(0,\\sigma^2)$.\n\n"]},{"cell_type":"markdown","id":"1e72f016-6aa2-4dae-8d44-2b69932f592b","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["Al ser variables aleatorias incorreladas, su función de\nautocovarianzas es $$\\boldsymbol{\\gamma}(z)\\;=\\;\\sigma^2\nz^0\\;=\\;(\\ldots,0,0,\\sigma^2,0,0,\\ldots)$$\n\n- Es el proceso estacionario (no trivial) más sencillo.\n- Este proceso es el pilar sobre el que definiremos el resto de\n ejemplos.\n\n"]},{"cell_type":"markdown","id":"6a7e1af7-90fc-4b9c-bf8d-1dd5ba0552ab","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["### Procesos lineales\n\n"]},{"cell_type":"markdown","id":"e7e45d21-1f4f-4252-a387-3be065afb9f0","metadata":{},"source":["Sea $\\boldsymbol{U}\\sim WN(0,\\sigma^2)$ y sea $\\boldsymbol{b}\\in\n\\ell^2$; una secuencia de cuadrado sumable\n$\\;\\sum\\limits_{j\\in\\mathbb{Z}}{b}_j^2<\\infty$.\n\nDenominamos *proceso lineal* al proceso estocástico\n$\\boldsymbol{X}=\\boldsymbol{b}*\\boldsymbol{U}$ cuyos elementos son $$X_t\n\\;=\\;(\\boldsymbol{b}*\\boldsymbol{U})_t\n\\;=\\;\\boldsymbol{b}(B)U_t \\;=\\;\\sum_{j=-\\infty}^\\infty {b}_j\nU_{t-j};\\qquad t\\in\\mathbb{Z}.$$\n\nEste proceso es estacionario (véase la demo en los apuntes en pdf)\n\n"]},{"cell_type":"markdown","id":"290b0e30-56e2-41ee-9484-2801958da5ea","metadata":{"slideshow":{"slide_type":"notes"}},"source":["$\\boldsymbol{b}(B)$ se denomina *función de transferencia* del\nfiltro lineal que relaciona $X_t$ con $U_t$.\n\n"]},{"cell_type":"markdown","id":"4543a0ef-2389-4074-88e7-fa6e99a06052","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["El proceso lineal es *\\`\\`causal''* si además $\\boldsymbol{b}$ es una\nserie formal (i.e., $cogrado(\\boldsymbol{b})\\geq{\\color{blue}{0}}$)\n$$X_t=\\sum_{j=0}^\\infty {b}_j U_{t-j};\\qquad t\\in\\mathbb{Z}$$ \n(pues cada $X_t$ es una suma de variables \"*del presente y/o el pasado*\").\n\n"]},{"cell_type":"markdown","id":"e0d550ca-4c3a-4de3-9340-907b173240b4","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["La clase de **procesos lineales causales** incluye muchas e importantes\nsubclases de procesos, algunas de las cuales son objeto principal de\nestudio de este curso.\n\n"]},{"cell_type":"markdown","id":"b99389f3-5d12-41e5-95a8-e025681c2d7c","metadata":{"slideshow":{"slide_type":"slide"}},"source":["#### Media móvil infinita. MA($\\infty$)\n\n"]},{"cell_type":"markdown","id":"076dbdf9-89f6-4e76-956c-bcfdfd1eb685","metadata":{},"source":["Sea $\\;\\boldsymbol{U}\\sim WN(0,\\sigma^2)\\;$ y sea\n$\\;\\boldsymbol{\\psi}\\in \\ell^2\\;$ una serie formal con infinitos\ntérminos NO nulos; entonces el proceso estocástico\n$\\boldsymbol{\\psi}*\\boldsymbol{U}$, cuyos elementos son $$X_t\n\\;=\\;(\\boldsymbol{\\psi}*\\boldsymbol{U})_t\n\\;=\\;\\boldsymbol{\\psi}(B)U_t \\;=\\;\\sum_{j=0}^\\infty \\psi_j\nU_{t-j};\\qquad t\\in\\mathbb{Z}$$ se denomina proceso de *media móvil\ninfinita* MA($\\infty$).\n\n"]},{"cell_type":"markdown","id":"d1463e70-f7f3-4f12-84c2-47f5e39a6daf","metadata":{"slideshow":{"slide_type":"slide"}},"source":["Algunas clases de procesos lineales causales tienen una representación\nparsimoniosa, pues basta un número finito de parámetros para\nrepresentarlos completamente. Por ejemplo, cuando\n$\\boldsymbol{\\psi}$ tiene un número finito de términos no nulos…\n\n"]},{"cell_type":"markdown","id":"87815a6d-6935-40b4-88b6-998642c6afad","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["#### Proceso de media móvil de orden $q$. MA($q$)\n\n"]},{"cell_type":"markdown","id":"1d93b9a9-3f35-421e-9581-276b42833578","metadata":{},"source":["Sea $\\;\\boldsymbol{U}\\sim WN(0,\\sigma^2)\\;$ y sea\n$\\;\\boldsymbol{\\theta}\\;$ un polinomio de grado $q$ con\n${\\color{#008000}{\\theta_{0}=1}}$; entonces el proceso estocástico\n$\\boldsymbol{\\theta}*\\boldsymbol{U}$, cuyos elementos son $$X_t\n\\;=\\;(\\boldsymbol{\\theta}*\\boldsymbol{U})_t\n\\;=\\;\\boldsymbol{\\theta}(B)U_t \\;=\\;\\sum_{j=0}^q\\theta_j\nU_{t-j};\\qquad t\\in\\mathbb{Z}$$ se denomina proceso de *media móvil*\nMA($q$).\n\n"]},{"cell_type":"markdown","id":"2acc4c62-af12-4a72-90e0-e1396d7e5ca3","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["Es decir, si $\\;\\boldsymbol{\\theta}=(1-\\theta_1z-\\cdots-\\theta_qz^q)\\;$:\n$$ X_t = U_t - \\theta_1 U_{t-1} - \\cdots - \\theta_q U_{t-q}.$$\n\n"]},{"cell_type":"markdown","id":"d62fb5b8-32ce-4004-b91d-8cf20eed8c9a","metadata":{"slideshow":{"slide_type":"slide"}},"source":["Hay otros procesos lineales con representación parsimoniosa.\n\n"]},{"cell_type":"markdown","id":"9759349a-bfb5-42b9-aef0-225d17bfd419","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["#### Proceso autorregresivo de orden $p$. AR($p$)\n\n"]},{"cell_type":"markdown","id":"3511a48a-dac3-4bec-b4a7-6c08fffeeed5","metadata":{},"source":["Sea $\\;\\boldsymbol{U}\\sim WN(0,\\sigma^2)\\;$, se denomina *proceso\nautorregresivo de orden $p$* a aquel proceso estocástico\n*estacionario* $\\;\\boldsymbol{X}\\;$ que es la solución de la siguiente\necuación en diferencias\n$$\\boldsymbol{\\phi}*\\boldsymbol{X}=\\boldsymbol{U}$$ donde\n$\\;\\boldsymbol{\\phi}\\;$ un polinomio de grado $p$ con\n${\\color{#008000}{\\phi_{0}=1}}$;\n\n"]},{"cell_type":"markdown","id":"131d6f40-c3fe-41c8-9629-a5a51017b3ed","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["Por tanto, $$(\\boldsymbol{\\phi}*\\boldsymbol{X})_t=\n\\boldsymbol{\\phi}(\\mathsf{B})X_t= \\sum_{j=0}^p \\phi_j X_{t-j} = U_t.$$\n\n"]},{"cell_type":"markdown","id":"90befb4e-fa4a-41cc-af66-e49527e85407","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["Si $\\;\\boldsymbol{\\phi}=(1-\\phi_1z-\\cdots-\\phi_pz^p)\\;$ entonces\n$\\boldsymbol{X}=(X_t\\mid t\\in\\mathbb{Z})$ es solución de la ecuación:\n$$X_t - \\phi_1 X_{t-1} - \\cdots -\\phi_q X_{t-q} = U_t.$$\n\n"]},{"cell_type":"markdown","id":"d4757fb7-978c-4cb9-9d8b-2fd33404358b","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["El problema con la anterior definición es que la ecuación\n$\\boldsymbol{\\phi}*\\boldsymbol{X}=\\boldsymbol{U}$ no tiene solución\núnica (y en algunos casos ninguna solución es\nestacionaria). Despejemos $\\boldsymbol{X}$ para verlo.\n\nMultiplicando ambos lados de la ecuación por una inversa de\n$\\boldsymbol{\\phi}$ tenemos\n$$\\boldsymbol{X}=inversa(\\boldsymbol{\\phi})*\\boldsymbol{U}.$$ Y si\ndenotamos la secuencia $inversa(\\boldsymbol{\\phi})$ con\n$\\boldsymbol{a}$ entonces\n$$X_t=\\boldsymbol{a}(\\mathsf{B})U_t=\\sum_{j\\in\\mathbb{Z}} a_j\nU_{t-j}.$$\n\n"]},{"cell_type":"markdown","id":"2c3b025a-e309-44ed-8762-a99b472d04e1","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["Pero… ¿Qué secuencia $\\boldsymbol{a}$ usamos como inversa de\n$\\boldsymbol{\\phi}$? Recuerde que hay infinitas y la mayoría no son\nsumables (si el polinomio $\\boldsymbol{\\phi}$ tiene raíces unitarias\nninguna lo es).\n\n
\n

\nEn tal caso la expresión\n$\\;\\boldsymbol{a}(\\mathsf{B})U_t=\\sum\\limits_{j=-\\infty}^\\infty a_j\nU_{t-j}\\;$ carece de sentido (pues no converge).\n

\n
\n\n"]},{"cell_type":"markdown","id":"1220e6ef-13b6-4c52-a672-928327bbf83c","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["**Requisitos** sobre el polinomio autorregresivo $\\boldsymbol{\\phi}.\\;$ Para que el proceso AR exista y sea:\n\n1. lineal y estacionario, exigiremos que $\\boldsymbol{\\phi}$\n no tenga raíces de módulo 1.\n \n Entonces existe una única inversa absolutamente sumable: $\\boldsymbol{\\phi}^{-1} \\in\n \\ell^1\\subset\\ell^2$.\n \n La inversa $\\boldsymbol{a}=\\boldsymbol{\\phi}^{-1}$ corresponde a la\n única solución *estacionaria* de\n $\\boldsymbol{\\phi}*\\boldsymbol{X}=\\boldsymbol{U}$. (Si\n $\\boldsymbol{\\phi}$ tuviera raíces de módulo 1 no existiría ni\n $\\boldsymbol{\\phi}^{-1}$, ni la solución estacionaria).\n \n $$X_t=\\boldsymbol{\\phi}^{-1}(\\mathsf{B})U_t=\\sum_{j=-\\infty}^\\infty a_j U_{t-j}$$\n\n2. causal exigiremos que las raíces de $\\boldsymbol{\\phi}$ sean\n mayores que 1 en valor absoluto (raíces fuera del círculo\n unidad):\n $\\boldsymbol{\\phi}^{-1}=\\boldsymbol{\\phi}^{-\\triangleright}\\;$\n (**serie formal** $\\in\\ell^1\\subset\\ell^2$).\n \n $$X_t=\\boldsymbol{\\phi}^{-1}(\\mathsf{B})U_t=\\sum_{j=0}^\\infty a_j U_{t-j}$$\n\n"]},{"cell_type":"markdown","id":"6dfb34ef-a6a3-4f69-9407-48e644f8fe16","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["(¡de nuevo un proceso lineal causal!)\n\n"]},{"cell_type":"markdown","id":"2ade4832-480e-471c-9d03-4ae404b82839","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["El siguiente modelo lineal es una combinación (o generalización) de\nlos dos anteriores.\n\n"]},{"cell_type":"markdown","id":"ea5a1545-07ef-4a62-99c9-6a7da1ecf9a5","metadata":{"slideshow":{"slide_type":"slide"}},"source":["#### Proceso autorregresivo de media móvil. ARMA($p,q$)\n\n"]},{"cell_type":"markdown","id":"473ff34e-ec01-49b1-b4d3-68164f72709e","metadata":{},"source":["Sea $\\;\\boldsymbol{U}\\sim WN(0,\\sigma^2)\\;$, se denomina *proceso\nautorregresivo de media móvil $(p,q)$* al proceso estocástico\nestacionario $\\;\\boldsymbol{X}\\;$ que es la solución de la ecuación en\ndiferencias:\n$$\\boldsymbol{\\phi}*\\boldsymbol{X}=\\boldsymbol{\\theta}*\\boldsymbol{U}$$\ndonde el polinomio *autorregresivo* $\\;\\boldsymbol{\\phi}\\;$ tiene\ngrado $p$ con ${\\color{#008000}{\\phi_{0}=1}}$ y con todas sus raíces\nfuera del círculo unidad (*por los motivos anteriormente vistos*); y\nel polinomio *de media móvil* $\\;\\boldsymbol{\\theta}\\;$ es de grado\n$q$ con ${\\color{#008000}{\\theta_{0}=1}}$; \n\n$$\\text{es decir,}\\qquad\n\\boldsymbol{X}=\\frac{\\boldsymbol{\\theta}}{\\boldsymbol{\\phi}}*\\boldsymbol{U};\n\\qquad\\text{donde}\\;\n\\frac{\\boldsymbol{\\theta}}{\\boldsymbol{\\phi}}\\equiv\\boldsymbol{\\phi}^{-1}*\\boldsymbol{\\theta}$$\n\n"]},{"cell_type":"markdown","id":"468c707f-5d09-401c-8d40-4ea2237cc4a5","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["Tanto $\\boldsymbol{\\phi}^{-1}$ como $\\boldsymbol{\\theta}$ son series\nformales absolutamente sumables y como $\\ell^1$ y las series formales\nson anillos,\n$\\boldsymbol{\\phi}^{-1}*\\boldsymbol{\\theta}\\equiv\\frac{\\boldsymbol{\\theta}}{\\boldsymbol{\\phi}}\\in\\ell^1$\ntambién es una serie formal absolutamente sumable (y por tanto de\ncuadrado sumable). Consecuentemente el proceso estocástico es un\nproceso lineal causal.\n$$X_t=\\frac{\\boldsymbol{\\theta}}{\\boldsymbol{\\phi}}(\\mathsf{B})U_t=\\sum_{j=0}^\\infty\na_j U_{t-j}$$ donde\n$\\boldsymbol{a}=\\boldsymbol{\\phi}^{-1}*\\boldsymbol{\\theta}$.\n\n"]},{"cell_type":"markdown","id":"d43d3a9f-3f19-45b3-ba64-fa0e28b81c7f","metadata":{"slideshow":{"slide_type":"notes"}},"source":["#### Proceso autorregresivo de media móvil con media no nula\n\n"]},{"cell_type":"markdown","id":"372fea2e-3c93-4f3b-90e9-c60acac60377","metadata":{"slideshow":{"slide_type":"notes"}},"source":["Consideremos un proceso $\\boldsymbol{Y}$ con media\ndistinta de cero, es decir, $$E(Y_t)=\\mu\\ne0$$ y definamos la\nsecuencia constante $\\boldsymbol{\\mu}=\\sum\\limits_{j\\in\\mathbb{Z}} \\mu\nz^j=(\\ldots,\\mu,\\mu,\\mu,\\ldots)$. \n\\medskip\n\nDecimos que $\\boldsymbol{Y}$ es un proceso ARMA($p,q$) con media\ndistinta de cero si $\\boldsymbol{X}$ es ARMA($p,q$)\n$$\\boldsymbol{\\phi}*\\boldsymbol{X}=\\boldsymbol{\\theta}*\\boldsymbol{U}$$\ndonde $\\boldsymbol{X}=\\boldsymbol{Y}-\\boldsymbol{\\mu}$ es\nevidentemente un proceso de media cero. Por tanto\n\n\\begin{align*}\n\\boldsymbol{\\phi}*(\\boldsymbol{Y}-\\boldsymbol{\\mu})=&\\boldsymbol{\\theta}*\\boldsymbol{U}\\\\\n\\boldsymbol{\\phi}*\\boldsymbol{Y}-\\boldsymbol{\\phi}*\\boldsymbol{\\mu}=&\\boldsymbol{\\theta}*\\boldsymbol{U}\\\\\n\\boldsymbol{\\phi}*\\boldsymbol{Y}=&\\boldsymbol{\\phi}*\\boldsymbol{\\mu}+ \\boldsymbol{\\theta}*\\boldsymbol{U}\\\\\n\\end{align*}\n\nEs decir, si $\\boldsymbol{\\phi}(\\mathsf{B})$ es\n$\\;1-\\phi_1\\mathsf{B}-\\phi_2\\mathsf{B}^2-\\cdots-\\phi_p\\mathsf{B}^p,\\;$\nentonces $$\\boldsymbol{\\phi}(B){Y_t}=c+\\boldsymbol{\\theta}(B){U_t}$$\ndonde $$\\;c=(1-\\phi_1-\\phi_2-\\cdots-\\phi_p)\\mu\\;$$ y donde\n$\\;\\mu=E(Y_t)$, es un proceso autorregresivo de media móvil\nARMA($p,q$) *con media no nula*.\n\n"]},{"cell_type":"markdown","id":"c9634c55-14d6-443f-b3fd-9aaec487106f","metadata":{"slideshow":{"slide_type":"skip"}},"source":["## Primeros momentos de procesos lineales causales\n\n"]},{"cell_type":"markdown","id":"72a6f411-fc7d-4eb5-afa3-539faa939041","metadata":{"slideshow":{"slide_type":"slide"}},"source":["### Esperanza y autocovarianzas de un proceso lineal causal\n\n"]},{"cell_type":"markdown","id":"98c886fe-6ee4-4713-afc1-842019242a17","metadata":{},"source":["Sea $\\;\\boldsymbol{X}=\\boldsymbol{\\psi}*\\boldsymbol{U},\\;$ donde\n$\\boldsymbol{\\psi}$ es una serie formal de cuadrado sumable\ny donde $\\;\\boldsymbol{U}\\sim\nWN(0,\\sigma^2).\\quad$ Recordando que la convolución es una operación\nlineal: $$E(\\boldsymbol{X}) =E(\\boldsymbol{\\psi}*\\boldsymbol{U})\n=\\boldsymbol{\\psi}*E(\\boldsymbol{U})\n=\\boldsymbol{\\psi}*\\boldsymbol{0}=\\boldsymbol{0}.$$ Consecuentemente,\nla covarianza de orden $k$ para cada $X_t$ es\n\n\\begin{align*}\n\\gamma_{_{k,t}} = & E\\Big[\\big(\\boldsymbol{\\psi}(\\mathsf{B})X_t\\big)\\cdot \\big(\\boldsymbol{\\psi}(\\mathsf{B}) X_{t-k}\\big)\\Big] \n\\\\ = &\nE\\Big[\n (\\psi_0U_{t}+\\psi_1U_{t-1}+\\psi_2U_{t-2}\\cdots)\n (\\psi_0U_{t-k}+\\psi_1U_{t-k-1}+\\psi_2U_{t-k-2}\\cdots)\\Big]\n\\\\ = &\n\\sigma^2\\sum\\nolimits_{j\\in\\mathbb{Z}}\\psi_{j+k}\\psi_j\n\\qquad \\text{ ya que }\\; E(U_hU_j)=0\\; \\text{ si } \\;j\\ne h,\n\\end{align*}\n\nque no depende de $t$ ($\\boldsymbol{X}$ es estacionario). Es más, por\nla última ecuación de la lección 4 $$\\;\\gamma_k \\;=\\;\n\\sigma^2\\sum\\nolimits_{j\\in\\mathbb{Z}}\\psi_{j+k}\\psi_j \\;=\\;\n\\sigma^2\\big(\\boldsymbol{\\psi}(z)*\\boldsymbol{\\psi}(z^{-1})\\big)_k\n\\qquad \\text{ para } k\\in\\mathbb{Z}.$$ Y, por tanto\n\n\\begin{equation}\n \\label{eqAutoCovarianzaProcesoLineal}\n \\boldsymbol{\\gamma}=\\sigma^2\\boldsymbol{\\psi}(z)*\\boldsymbol{\\psi}(z^{-1})\n\\end{equation}\n\ncon grado igual al grado de $\\boldsymbol{\\psi}$ y cogrado igual a\nmenos el grado de $\\boldsymbol{\\psi}$.\n\n"]},{"cell_type":"markdown","id":"b1b21284-6e68-4eed-8cf6-c008c614545f","metadata":{"slideshow":{"slide_type":"slide"}},"source":["### Covarianza cruzada entre dos procesos lineales causales\n\n"]},{"cell_type":"markdown","id":"1ca3eec8-dd72-49ac-87ac-44bf3496698a","metadata":{},"source":["Sean $\\;\\boldsymbol{W}=\\boldsymbol{\\theta}*\\boldsymbol{U}\\quad$ e\n$\\quad\\boldsymbol{Y}=\\boldsymbol{\\psi}*\\boldsymbol{U},\\quad$ donde\n$\\boldsymbol{\\theta}$ y $\\boldsymbol{\\psi}$ son series formales de\ncuadrado sumable y donde $\\;\\boldsymbol{U}\\sim\nWN(0,\\sigma^2)$.\n\nRepitiendo los mismos pasos que en el caso de la autocovarianza,\nllegamos a que la función de covarianzas cruzadas es la secuencia\n\n\\begin{equation}\n \\label{eqCovarianzaCruzadaProcesosLineales}\n \\boldsymbol{\\gamma_{_{\\boldsymbol{W},\\boldsymbol{Y}}}} =\n \\sigma^2 \\boldsymbol{\\theta}(z)*\\boldsymbol{\\psi}(z^{-1})\n\\end{equation}\n\ncon grado igual al grado de $\\boldsymbol{\\theta}$ y cogrado igual a menos\nel grado de $\\boldsymbol{\\psi}$.\n\n"]},{"cell_type":"markdown","id":"651fe5a4-9993-4410-a531-11b36fdf8bf6","metadata":{"slideshow":{"slide_type":"slide"}},"source":["### Las Ecuaciones de Yule-Walker para un AR($p$) estacionario\n\n"]},{"cell_type":"markdown","id":"cea1b0ed-c214-4af3-a39f-4ee8dd2dde9e","metadata":{},"source":["*Por una parte* (lado izquierdo):\n\nSi $\\boldsymbol{X}$ es un proceso (débilmente) estacionario con\n$E(\\boldsymbol{X})=\\boldsymbol{0}\\;$ y $\\;\\boldsymbol{\\phi}$ es una serie\nformal absolutamente sumable; entonces para $t,k\\in\\mathbb{Z}$\n\n\\begin{equation}\n E\\Big[\\Big(\\boldsymbol{\\phi}(\\mathsf{B})X_t\\Big)\\cdot X_{t-k}\\Big]\n \\quad = \\quad\n \\boldsymbol{\\phi}(\\mathsf{B})E\\big(X_t\\cdot X_{t-k}\\big)\n \\quad = \\quad\n \\boldsymbol{\\phi}(\\mathsf{B})\\gamma_k\n \\label{eqnLadoIzquierdoYW}\n\\end{equation}\n\nque no depende de $t$, por ser $\\boldsymbol{X}$ es un proceso\n(débilmente) estacionario.\n\n"]},{"cell_type":"markdown","id":"6dce67ad-fb31-4c84-bf06-cd69364684f1","metadata":{"slideshow":{"slide_type":"fragment"}},"source":["*Por otra parte* (lado derecho):\n\nSi $\\boldsymbol{X}$ tiene representación\n$\\;\\boldsymbol{X}=\\boldsymbol{\\psi}*\\boldsymbol{U}$ donde\n$\\;\\boldsymbol{U}\\sim WN(0,\\sigma^2)$ y $\\boldsymbol{\\psi}\\in\\ell^2$ es una\nserie formal con $\\psi_0=1$; es decir, si es un proceso lineal causal\n\n$$\\quad X_t=U_t + \\sum\\nolimits_{j=1}^\\infty \\psi_j U_{t-j},$$\nentonces para $t,k\\in\\mathbb{Z}$\n\n\\begin{equation}\n E[U_t\\cdot X_{t-k}] = E\\Big[U_t\\Big(U_{t-k} + \\sum\\nolimits_{j=1}^\\infty \\psi_j U_{t-k-j}\\Big) \\Big]=\n \\begin{cases}\n \\sigma^2 & \\text{cuando } k=0\\\\\n 0 & \\text{cuando } k\\ne0\n \\end{cases}\n \\label{eqnLadoDerechoYW}\n\\end{equation}\n\n"]},{"cell_type":"markdown","id":"dd032e99-5e8a-43f6-9a26-c389bc8d2a93","metadata":{"slideshow":{"slide_type":"subslide"}},"source":["Sea un AR($p$) estacionario:\n$\\;\\;\\boldsymbol{\\phi}(\\mathsf{B})X_t=U_t\\;\\;$ donde\n$\\;\\;\\boldsymbol{\\phi}(z)=1-\\phi_1z^1-\\cdots-\\phi_pz^p.\\;$\nMultiplicando por $X_{t-k}$ y tomando esperanzas:\n$$E\\Big[\\Big(\\boldsymbol{\\phi}(\\mathsf{B})X_t\\Big)\\cdot X_{t-k}\\Big] =\nE[U_t\\cdot X_{t-k}]$$\n\n**para $k=0$:** $\\quad$ (por $\\ref{eqnLadoIzquierdoYW}$ y $\\ref{eqnLadoDerechoYW}$)\n$$\\fbox{$\\boldsymbol{\\phi}(\\mathsf{B})\\gamma_0=\\sigma^2$}\n\\quad\\Rightarrow\\quad\n\\gamma_0-\\phi_1\\gamma_1-\\cdots-\\phi_p\\gamma_p=\\sigma^2\n\\quad\\Rightarrow\\quad \\sigma^2=\\gamma_0-\\sum\\nolimits_{j=1}^p\\phi_j\\gamma_j.$$\nDividiendo por $\\gamma_0$ (y recordando que $\\rho_0=1$):\n$$\\boldsymbol{\\phi}(\\mathsf{B})\\rho_0=\\frac{\\sigma^2}{\\gamma_0}\n\\quad\\Rightarrow\\quad\n\\fbox{$\\gamma_0=\\frac{\\sigma^2}{\\boldsymbol{\\phi}(\\mathsf{B})\\rho_0}$}\n\\quad\\Rightarrow\\quad\n\\gamma_0=\\frac{\\sigma^2}{1-\\sum\\nolimits_{j=1}^p\\phi_j\\rho_j}.$$ \n\n**para $k>0$:** $\\quad$ (por $\\ref{eqnLadoIzquierdoYW}$ y $\\ref{eqnLadoDerechoYW}$)\n$$\\fbox{$\\boldsymbol{\\phi}(\\mathsf{B})\\gamma_k=0$}\n\\quad\\Rightarrow\\quad\n\\gamma_k-\\phi_1\\gamma_{k-1}-\\cdots-\\phi_p\\gamma_{k-p}=0\n\\quad\\Rightarrow\\quad \\gamma_k=\\sum\\nolimits_{j=1}^p\\phi_j\\gamma_{k-j}.$$ \nDividiendo por $\\gamma_0$:\n$$\\fbox{$\\boldsymbol{\\phi}(\\mathsf{B})\\rho_k=0$}\n\\quad\\Rightarrow\\quad\n\\rho_k-\\phi_1\\rho_{k-1}-\\cdots-\\phi_p\\rho_{k-p}=0\n\\quad\\Rightarrow\\quad \\rho_k=\\sum\\nolimits_{j=1}^p\\phi_j\\rho_{k-j}.$$\n\n"]},{"cell_type":"markdown","id":"c3a3e79b-d113-423b-8419-ee6149af87cf","metadata":{"slideshow":{"slide_type":"notes"}},"source":["Por tanto, la estructura autorregresiva del proceso impone que las\nautocovarianzas (y las autocorrelaciones) verifiquen las ecuaciones de\nYule-Walker.\n\n"]},{"cell_type":"markdown","id":"ceebcecb-2b38-431d-b602-c83c35f37b7e","metadata":{"slideshow":{"slide_type":"slide"}},"source":["### Función de autocovarianzas para un ARMA($p,q$)\n\n"]},{"cell_type":"markdown","id":"3fe89efb-3007-4039-a891-5df632913f68","metadata":{},"source":["Sea un ARMA($p,q$) estacionario:\n$\\boldsymbol{\\phi}(\\mathsf{B}){X_t}=\\boldsymbol{\\theta}(\\mathsf{B}){U_t}\\;$\ndonde $\\boldsymbol{\\phi}$ y $\\boldsymbol{\\theta}$ no tienen raíces\ncomunes. Multiplicando por $X_{t-k}$, tomando esperanzas y\nsustituyendo $X_{t-k}$ por su representación MA($\\infty$), donde\n$\\boldsymbol{\\psi}=\\frac{\\boldsymbol{\\theta}}{\\boldsymbol{\\phi}}$:\n$$\\underbrace{E\\Big[\\Big(\\boldsymbol{\\phi}(\\mathsf{B})X_t\\Big)\\cdot\nX_{t-k}\\Big]}_{\\boldsymbol{\\phi}(\\mathsf{B})\\gamma_k\\;(\\text{por\n\\ref{eqnLadoIzquierdoYW}})} =\nE\\Big[\\Big(\\boldsymbol{\\theta}(\\mathsf{B})U_t\\Big)\\cdot X_{t-k}\\Big]\n\\;=\\;\n\\underbrace{E\\Big[\\Big(\\boldsymbol{\\theta}(\\mathsf{B})U_t\\Big)\\cdot\n\\Big(\\boldsymbol{\\psi}(\\mathsf{B})U_{t-k}\\Big)\\Big]}_{\\boldsymbol{\\gamma_{_{\\boldsymbol{W},\\boldsymbol{Y}}}}(k)}$$\nDonde hemos usando $\\eqref{eqnLadoIzquierdoYW}$ y renombrando\n$\\;\\boldsymbol{\\theta}(\\mathsf{B})U_t=\\boldsymbol{W}\\;$ y\n$\\;\\boldsymbol{\\psi}(\\mathsf{B})U_t=\\boldsymbol{Y}.\\;$ Así:\n\n\\begin{align*}\n \\boldsymbol{\\phi}(\\mathsf{B})\\gamma_k & = \\boldsymbol{\\gamma_{_{\\boldsymbol{W},\\boldsymbol{Y}}}}(k)\\\\\n & = \\sigma^2 \\Big(\\boldsymbol{\\theta}(z)*\\boldsymbol{\\psi}(z^{-1})\\Big)_k & \\text{por } \\eqref{eqCovarianzaCruzadaProcesosLineales}\n\\end{align*}\n\nY como $\\boldsymbol{\\theta}(z)*\\boldsymbol{\\psi}(z^{-1})$ tiene grado $q$ y cogrado $-\\infty$\n\n\\begin{equation}\n \\boldsymbol{\\phi}(\\mathsf{B})\\gamma_k = \n \\begin{cases}\n 0 & k > q\\quad \\text{(como en un AR)}\\\\\n \\sigma^2 \\Big(\\boldsymbol{\\theta}(z)*\\boldsymbol{\\psi}(z^{-1})\\Big)_k & k\\leq q\n \\quad \\text{(que depende de $\\boldsymbol{\\theta}$ y $\\boldsymbol{\\phi}$)}\n \\end{cases}\n\\end{equation}\n\n"]},{"cell_type":"markdown","id":"1dff4a9b-0a10-421b-afeb-fd1ed1ca3afe","metadata":{"slideshow":{"slide_type":"skip"}},"source":["Un proceso de ruido blanco $\\boldsymbol{U}\\sim WN(0,\\sigma^2)$ es un\nproceso *débilmente estacionario* (o estacionario de segundo orden)\ntal que: $$E(U_t)=0;\\qquad t\\in\\mathbb{Z}$$ y $$\\boldsymbol{\\gamma} =\n(\\ldots,\\,0,\\,0,\\,{\\color{blue}{\\sigma^2}},\\,0,\\,0,\\ldots)=\\sigma^2\nz^0;$$ es decir, $\\;\\gamma_0=\\sigma^2\\;$ y $\\;\\gamma_k=0\\;$ para todo\n$k\\ne0$.\n\nConsideremos el proceso estocástico: $\\quad\\boldsymbol{X}=(X_t \\mid\nt=0,\\pm1,\\pm2,\\ldots).\\quad$ Lo podemos denotar con una función\ngeneratriz (como hicimos con las secuencias) $$\\boldsymbol{X} \\quad =\n\\quad \\sum_{t=-\\infty}^\\infty X_t z^t \\quad\\equiv\\quad\n\\boldsymbol{X}(z)$$ Recuerde que esto no es una suma; es una secuencia\nde variables aleatorias $$\\sum_{t=-\\infty}^\\infty X_t z^t = (\\ldots,\\\nX_{-2},\\ X_{-1},\\ X_{0},\\ X_{1},\\ X_{2},\\ldots)$$\n\n"]}],"metadata":{"org":null,"kernelspec":{"display_name":"R","language":"R","name":"ir"},"language_info":{"codemirror_mode":"r","file_extension":".r","mimetype":"text/x-r-source","name":"R","pygments_lexer":"r","version":"3.3.2"}},"nbformat":4,"nbformat_minor":5}