Wednesday, November 23, 2016

Autorregresivo De Media Móvil Spss

ARMA y ARIMA (Box-Jenkins) modelos ARMA y ARIMA (Box-Jenkins) modelos En las secciones anteriores hemos visto cómo el valor de una serie de tiempo univariante en el tiempo t. x t. puede ser modelado utilizando una variedad de expresiones en movimiento promedio. También hemos demostrado que los componentes tales como las tendencias y la periodicidad de la serie temporal se pueden modelar de forma explícita y / o separan, con los datos que se descomponen en tendencia, estacionales y componentes residuales. También puso de manifiesto, en las discusiones anteriores sobre la autocorrelación. que los coeficientes de autocorrelación completas y parciales son extremadamente útiles en la identificación y el modelado de patrones en series de tiempo. Estos dos aspectos de análisis de series de tiempo y el modelado se pueden combinar en un marco más general, y, a menudo muy eficaz de modelado en general. En su forma más básica de este enfoque es conocido como el modelado ARMA (autorregresivo de media móvil), o cuando la diferenciación se incluye en el procedimiento, la modelización ARIMA o Box-Jenkins, después de que los dos autores que eran fundamentales para su desarrollo (véase el recuadro amp Jenkins, 1968 box1, y la caja, Jenkins amp Reinsel de 1994 BOX2). No hay una regla fija en cuanto al número de periodos de tiempo necesarios para la elaboración de modelos de éxito, pero para los modelos más complejos, y para una mayor confianza en los procedimientos de ajuste y validación, serie con 50 pasos de tiempo se recomienda a menudo. modelos ARMA combinan métodos de autocorrelación (AR) y las medias móviles (MA) en un modelo compuesto de la serie temporal. Antes de considerar cómo estos modelos pueden ser combinados, examinamos cada uno por separado. Ya hemos visto que los modelos de medias (MA) en movimiento puede ser utilizado para proporcionar un buen ajuste a algunos conjuntos de datos, y las variaciones en estos modelos que implican suavizado exponencial doble o triple puede manejar componentes de tendencia y periódicos en los datos. Además, estos modelos se pueden utilizar para crear previsiones que imitan el comportamiento de los períodos anteriores. Una forma simple de tales modelos, basados ​​en los datos anteriores, se puede escribir como: donde i términos de la beta son las ponderaciones aplicadas a los valores anteriores de la serie histórica, y es habitual para definir beta i 1, sin pérdida de generalidad. Así que para un proceso de primer orden, q 1 y tenemos el modelo: es decir, el valor de la media móvil se calcula como la media ponderada de los valores actuales y pasados ​​inmediatos. Este proceso de promedio es, en cierto sentido, un mecanismo regulador pragmática, sin un enlace directo a un modelo estadístico. Sin embargo, podemos especificar un modelo estadístico (o estocástico) que abarca los procedimientos de medias móviles en conjunción con los procesos aleatorios. Si dejamos que sea un conjunto de variables aleatorias independientes e idénticamente distribuidos (un proceso aleatorio) con media cero y varianza conocida fijo, entonces podemos escribir el proceso como un promedio móvil de orden q en términos de: Es evidente que el valor esperado de xt bajo este modelo es 0, por lo que el modelo sólo es válido si el xt ya han sido ajustados para tener significa un cero o si se añade una constante fija (la media de la xt) a la suma. También es evidente que la varianza de xt es simplemente: El análisis anterior se puede ampliar para evaluar la covarianza, cov (x t XTK.), Lo que nos encontramos con rendimientos: Tenga en cuenta que ni el valor medio, ni la covarianza (o autocovariancia) en el retardo k es una función del tiempo, t. por lo que el proceso es estacionario segundo orden. La expresión anterior nos permite obtener una expresión para la función de autocorrelación (ACF): Si k 0 rho k 1, y para k gt q rho k 0. Además, el ACF es simétrica y - k rho k rho. El ACF se puede calcular para un proceso de primer orden MA: El componente autorregresivo AR o de un modelo ARMA se puede escribir en la forma: donde los términos son de coeficientes de autocorrelación en los retardos 1,2. p y z t es un término de error residual. Tenga en cuenta que este término de error se relaciona específicamente con el actual período de tiempo, t. Así que para un proceso de primer orden, p 1 y que tiene el modelo: Estas expresiones indican que el valor estimado de x en el tiempo t se determina por el valor inmediatamente anterior de x (es decir, en el tiempo t -1) multiplicado por una medida, alfa . de la medida en que los valores para todos los pares de valores en los períodos de tiempo de espera 1 aparte están correlacionados (es decir, su autocorrelación), más un término de error residual, z. en el tiempo t. Pero esto es precisamente la definición de un proceso de Markov. por lo que un proceso de Markov es un primer proceso autorregresivo de orden. Si alfa 1 el modelo establece que el siguiente valor de x es simplemente el valor anterior más un término de error aleatorio, y por lo tanto es un simple paseo aleatorio 1D. Si se incluyen varios términos del modelo estima el valor de x en el tiempo t mediante una suma ponderada de estos términos, además de un componente de error aleatorio. Si sustituimos la segunda expresión anterior a la primera, tenemos: y la aplicación repetida de esta rendimientos de sustitución: Ahora bien, si LT1 alfa y k es grande, esta expresión se puede escribir en el orden inverso, con términos decrecientes y con la contribución de la expresión en x en el lado derecho de la expresión convirtiéndose prácticamente nula, por lo que tenemos: Desde el lado derecho de esta xt modelos de expresión como la suma de una serie ponderada de los valores anteriores, en este caso los términos de error aleatorio, es evidente que este modelo AR es, de hecho, una forma de modelo de MA. Y si asumimos que los términos de error tienen media cero y varianza constante, como en el modelo MA tenemos el valor esperado del modelo como también 0, suponiendo que el xt se han ajustado para proporcionar una media cero, con una variación: Ahora, como siempre que LT1 alfa esta suma es finito y es simplemente 1 / (1- alpha), por lo que tenemos: (. x t x tk) al igual que con el modelo MA anteriormente, este análisis se puede extender a evaluar la covarianza, cov de una proceso de primer orden AR, que nos encontramos con rendimientos: para LT1 alfa esta suma es finita y es simplemente alfa k / (1- alfa 2), por lo que tenemos: esto demuestra que para un modelo de primer orden autorregresivo de la función de autocorrelación (ACF) es simplemente definido por sucesivas potencias de la autocorrelación de primer orden, con la condición de LT1 alfa. Para Gt0 alfa esto es simplemente una curva de potencia o exponencial similar rápidamente decreciente, tendiendo a cero, o para LT0 es una curva oscilatoria de amortiguación, de nuevo tiende a cero. Si se hace una suposición de que la serie de tiempo es estacionaria del análisis anterior se puede extender a autocorrelaciones segundo y de orden superior. Con el fin de adaptarse a un modelo AR a un conjunto de datos observados, se busca minimizar la suma de los errores al cuadrado (un ajuste por mínimos cuadrados), utilizando el menor número de términos que proporcionan un ajuste adecuado a los datos. Los modelos de este tipo se describen como autorregresivo. y puede ser aplicado a ambas series de tiempo y los conjuntos de datos espaciales (véase más adelante, los modelos autorregresivos espaciales). Aunque, en teoría, un modelo autorregresivo podría proporcionar un buen ajuste a un conjunto de datos observados, por lo general, requeriría la eliminación previa de y componentes de tendencia y periódicos, e incluso entonces puede ser que necesite un gran número de términos con el fin de proporcionar un buen ajuste a los datos. Sin embargo, mediante la combinación de los modelos AR con modelos MA, podemos producir una familia de modelos mixtos que se pueden aplicar en una amplia gama de situaciones. Estos modelos se conocen como modelos ARMA y ARIMA, y se describen en las siguientes subsecciones. En los dos apartados anteriores hemos introducido el modo de MA de orden q: y el modelo AR de orden p: Podemos combinar estos dos modelos, simplemente añadiendo juntos como un modelo de orden (p q.), Donde tenemos términos AR p y términos q MA: En general, esta forma de modelo ARMA combinado se pueden utilizar para modelar una serie de tiempo con menos términos general que cualquiera de una MA o un modelo AR por sí mismos. Expresa el valor estimado en el tiempo t como la suma de los términos q que representan la variación promedio de la variación aleatoria sobre Q períodos anteriores (el componente MA), más la suma de los términos P AR que calculan el valor actual de x como la suma ponderada p de los valores más recientes. Sin embargo, esta forma de modelo supone que la serie de tiempo es estacionaria, que es raramente el caso. En la práctica, las tendencias y la periodicidad existe en muchas bases de datos, por lo que hay una necesidad de eliminar estos efectos antes de usar estos modelos. La eliminación se lleva a cabo típicamente mediante la inclusión en el modelo de una etapa inicial de diferenciación, por lo general, una vez, dos veces o tres veces, hasta que la serie es al menos aproximadamente estacionaria - no presente las tendencias o periodicidades obvias. Al igual que con los procesos de MA y AR, el proceso de diferenciación es descrito por el orden de diferenciación, por ejemplo 1, 2, 3. En conjunto, estos tres elementos forman una triple: (.. P d q) que define el tipo de modelo aplicado. De esta forma, el modelo se describe como un modelo ARIMA. La letra I en Arima se refiere al hecho de que el conjunto de datos ha sido inicialmente diferenciados (cf. diferenciación) y cuando el modelado es completa a continuación, los resultados tienen que ser sumadas o integradas para producir las estimaciones finales y pronósticos. modelización ARIMA se discute a continuación. Como se ha señalado en el apartado anterior, la combinación de diferenciación de una serie de tiempo no estacionarias con el modelo ARMA proporciona una poderosa familia de modelos que se pueden aplicar en una amplia gama de situaciones. El desarrollo de esta forma extendida de modelo es en gran parte debido a G E P G M Box y Jenkins, y como resultado de los modelos ARIMA son conocidos también como modelos Box-Jenkins. El primer paso en el procedimiento de Box-Jenkins es a diferencia de la serie de tiempo hasta que es estacionario, lo que garantiza que la tendencia y se eliminan los componentes de temporada. En muchos casos, uno o dos de diferenciación etapa es suficiente. La serie diferenciada será más corto que la serie fuente de C pasos de tiempo, donde C es el rango de la diferenciación. Un modelo ARMA se ajusta entonces a la serie de tiempo resultante. Dado que los modelos ARIMA tienen tres parámetros que hay muchas variaciones a los posibles modelos que puedan estar equipados. Sin embargo, la decisión sobre lo que estos parámetros deben ser pueden ser guiados por una serie de principios básicos: (i) el modelo debe ser lo más simple posible, es decir, contienen el menor número de términos como sea posible, que a su vez significa que los valores de p y q debe ser pequeña (ii) el ajuste a los datos históricos debe ser tan buena como sea posible, es decir, el tamaño de las diferencias al cuadrado entre el valor estimado en cualquier período de tiempo pasado y el valor real, debe reducirse al mínimo (principio de mínimos cuadrados) - los residuos del modelo seleccionado puede entonces ser examinado para ver si los residuos restantes son significativamente diferentes de 0 (véase más adelante) (iii) la correlación parcial medido en los retardos 1,2,3. debe proporcionar una indicación de la orden del componente de AR, es decir, el valor elegido para q (iv) la forma de la función de autocorrelación parcela (acf) puede sugerir el tipo de modelo ARIMA necesario - la tabla de abajo (del NIST) proporciona orientación sobre la interpretación de la forma de la ACF en cuanto a la selección del modelo. Modelo ARIMA selección del tipo de uso de la Serie ACF forma no es estacionaria. Los modelos estándar ARIMA se describen a menudo por la triple: (.. p q d) como se señaló anteriormente. Estos definen la estructura del modelo en términos de la orden de los modelos AR, de diferenciación y MA para ser utilizados. También es posible incluir parámetros similares para la estacionalidad en los datos, aunque estos modelos son más complejos de instalar y de interpretar - los callos (P. D. Q) se utiliza generalmente para identificar dichos componentes del modelo. En la captura de pantalla de SPSS se muestra a continuación, se muestra el diálogo para seleccionar manualmente los elementos estructurales no estacionales y de temporada (instalaciones similares están disponibles en otros paquetes integrados, tales como SAS / ETS). Como puede verse, el cuadro de diálogo también permite que los datos se transforman (típicamente para ayudar en la estabilización de la varianza) y para permitir a los usuarios incluir una constante en el modelo (el valor predeterminado). Esta herramienta de software en particular permite valores atípicos para ser detectados si es necesario, de acuerdo con una variedad de procedimientos de detección, pero en muchos casos se han investigado los valores atípicos y ajustado o eliminado y los valores de sustitución estimada, antes de cualquier análisis. SPSS modelizador de series temporales: la modelización ARIMA, el modo experto Una serie de modelos ARIMA puede ser ajustado a los datos, de forma manual o por medio de un proceso automatizado (por ejemplo, un proceso por etapas), y una o más medidas utiliza para juzgar cuál es el mejor en términos de la medida y la parsimonia. comparación de modelos normalmente hace uso de uno o más de los informativos medidas teóricas descritas anteriormente en este manual - AIC, MDL (la función de BIC y / o R, Arima (), proporciona la medida de la AIC, mientras que SPSS proporciona una serie de medidas de ajuste, incluida una versión de la estadística BIC otras herramientas varían en las medidas a -. Minitab, que ofrece una amplia gama de métodos de TSA, no incluye estadísticas AIC / tipo BIC). En la práctica de una amplia gama de medidas (es decir, distinto de / además de las medidas de mínimos cuadrados basado, se puede utilizar para evaluar la calidad del modelo. Por ejemplo, el error absoluto medio y el error máximo absoluto pueden ser medidas útiles, ya que incluso una buenas ajuste de mínimos cuadrados todavía puede ser deficiente en algunos lugares. una serie de paquetes de software también puede proporcionar una medida global de la autocorrelación que pueda permanecer en los residuos después de ajustar el modelo. una estadística aplicada con frecuencia se debe a Ljung y Box (1978 LJU1) y es de la forma: donde n es el número de muestras (valores de datos), ri es la autocorrelación de la muestra en el retardo i y k es el número total de retardos sobre el que el cálculo se lleva a cabo Q k se distribuye aproximadamente como.. una distribución chi-cuadrado con k -. m grados de libertad, donde m es el número de parámetros utilizados en el ajuste del modelo, excluir las variables constantes plazo o de predicción (es decir, justo incluyendo los pd q triples) Si la medida es estadísticamente significativa se indica que los residuos contienen todavía autocorrelación significativa después de que el modelo ha sido equipado, lo que sugiere que un modelo mejorado debe ser buscada. Ejemplo: Modelación del crecimiento del número de pasajeros de aerolíneas El siguiente es un ejemplo de montaje automatizada, utilizando SPSS para los datos de prueba de Box-Jenkins-Reinsel de aerolínea número de pasajeros REI1 han proporcionado anteriormente en este manual. Inicialmente se especifica ninguna especificación de las fechas que son meses dentro de unos años. El modelo seleccionado por el proceso automatizado era un modelo ARIMA (0,1,12), es decir, el proceso identificó correctamente que la serie requiere un nivel de diferenciación y se aplica un modelo de media móvil con una periodicidad de 12 y ningún componente de autocorrelación para adaptarse a la datos. El ajuste del modelo produjo un valor de R2 de 0,966, que es muy alto, y un error máximo absoluto (MAE) de 75. El ajuste visual del modelo a los datos parece excelente, pero la trama de la autocorrelación residual después del montaje y Ljung - Box prueba demuestra que sigue siendo autocorrelación significativa, lo que indica que un modelo mejorado es posible. Automatizado ARIMA ajuste a los pasajeros de avión Internacional: Los totales mensuales, 1949-1960 Para investigar más a fondo se ajustó un modelo revisado, basado en la discusión de este conjunto de datos por Box y Jenkins (1968) y la edición actualizada de Chatfields (1975 CHA1) libro en que utiliza Minitab para ilustrar su análisis (6ª edición, 2003). Las series de tiempo se define como tener una periodicidad de 12 meses y un modelo ARIMA con componentes (0,1,1), (0,1,1). Gráficamente los resultados son muy similares a la tabla de arriba, pero con este modelo, el R cuadrado es 0.991, el MAE41 y el estadístico de Ljung-Box ya no es significativa (12,6, con 16 grados de libertad). El modelo es así una mejora en la versión original (generado automáticamente), se compone de una MA no estacional y un componente MA estacional, ningún componente autorregresivo, y un nivel de diferenciación para las estructuras estacionales y no estacionales. Ya sea apropiado es manual o automatizado, un modelo ARIMA puede proporcionar un buen marco para el modelado de una serie de tiempo, o puede ser que los modelos o enfoques alternativos proporcionan un resultado más satisfactorio. A menudo es difícil saber de antemano qué bueno es probable que sea ningún modelo de pronóstico dada, ya que es sólo a la luz de su capacidad para predecir valores futuros de la serie de datos que pueda ser verdaderamente juzgado. A menudo, este proceso se aproxima por el ajuste del modelo a los datos del pasado con exclusión de períodos de tiempo recientes (también conocidos como muestras de retención fuera) y, a continuación, utilizando el modelo para predecir estos eventos futuros conocidos, pero incluso esto sólo ofrece confianza limitada en su validez futuro. el pronóstico a largo plazo puede ser extremadamente fiable utilización de dichos métodos. Es evidente que el modelo de las estadísticas de tráfico aéreo internacional se ha descrito anteriormente no es capaz de predecir correctamente los números de los pasajeros a través en la década de 1990 y más allá, ni la caída de 5 años en los Estados Unidos números internacionales de pasajeros de aerolíneas publicar 9/11/2001. Del mismo modo, un modelo ARIMA puede ser instalado en valores históricos de las cotizaciones bursátiles o valores de índice (por ejemplo, la Bolsa de Nueva York o de índices FTSE) y proporcionará típicamente un excelente ajuste a los datos (lo que da un valor de R cuadrado superior a 0,99), pero son a menudo de poca utilidad para la predicción de valores futuros de estos precios o índices. Típicamente, los modelos ARIMA se utilizan para la predicción, en particular en el campo de la modelización macro y micro económico. Sin embargo, pueden ser aplicados en una amplia gama de disciplinas, ya sea en la forma descrita aquí, o aumentada con variables de predicción adicionales que se cree que mejora la fiabilidad de las previsiones realizadas. Estos últimos son importantes porque toda la estructura de los modelos ARMA discutidos anteriormente depende de los valores anteriores y eventos aleatorios independientes en el tiempo, no en cualquier factores explicativos o causales. De ahí que los modelos ARIMA solamente reflejarán y extender los patrones del pasado, lo que podría ser necesario modificar las previsiones por factores tales como el entorno macroeconómico, los cambios tecnológicos, o de recursos a largo plazo y / o cambios ambientales. Box1 Box G E P, G Jenkins M (1968). Algunos avances recientes en la predicción y el control. Estadística Aplicada, 17 (2), 91-109 BOX2 caja, G E P, Jenkins, G M, G Reinsel C (1994) Análisis de series de tiempo, predicción y control. 3ª ed. Prentice Hall, Englewood Cliffs, NJ CHA1 Chatfield C (1975) El análisis de los tiempos de la serie: Teoría y Práctica. Chapman y Hall, Londres (véase también, 6ª ed., 2003) LJU1 Ljung G M, G E P Box (1978) sobre una medida de una falta de ajuste en modelos de series temporales. Biométrika, 65, 297303 NIST / SEMATECH e-Manual de Métodos Estadísticos, www. itl. nist. gov/div898/handbook/ Sección 6.4: Introducción a las series temporales. 2010 SPSS / PASW 17 (2008) (AnalyzeForecasting modelos de series temporales) REI1 Reinsel G C Conjuntos de datos para los modelos Box-Jenkins: www. stat. wisc. edu/A RIMA es sinónimo de autorregresivos integrados en movimiento modelos Promedio. Univariado (solo vector) ARIMA es una técnica de predicción que proyecta los valores futuros de una serie basada enteramente en su propia inercia. Su principal aplicación es en el área de predicción a corto plazo que requiere un mínimo de 40 puntos de datos históricos. Funciona mejor cuando sus datos exhibe un patrón estable o constante en el tiempo con una cantidad mínima de valores atípicos. A veces llamado Box-Jenkins (después de que los autores originales), ARIMA es generalmente superior a técnicas de suavizado exponencial cuando los datos son razonablemente largo y la correlación entre las observaciones anteriores es estable. Si los datos son de corto o muy volátiles, y luego algún método de alisado puede funcionar mejor. Si usted no tiene al menos 38 puntos de datos, se debe considerar otro método que no ARIMA. El primer paso en la aplicación de la metodología ARIMA es para comprobar si hay estacionariedad. Estacionariedad implica que la serie se mantiene en un nivel bastante constante en el tiempo. Si existe una tendencia, como en la mayoría de las aplicaciones económicas o de negocios, a continuación, sus datos no es estacionaria. Los datos también debe mostrar una varianza constante en sus fluctuaciones en el tiempo. Esto se ve fácilmente con una serie que es muy estacional y crece a un ritmo más rápido. En tal caso, las subidas y bajadas en la estacionalidad se harán más dramática en el tiempo. Sin estas condiciones de estacionariedad se cumplen, muchos de los cálculos asociados con el proceso no se puede calcular. Si una representación gráfica de los datos indica no estacionariedad, entonces debería diferencia de la serie. La diferenciación es una excelente manera de transformar una serie no estacionaria a uno estacionario. Esto se realiza restando la observación en el periodo actual de la anterior. Si esta transformación se realiza sólo una vez para una serie, se dice que los datos han sido primera diferenciados. Este proceso elimina esencialmente la tendencia si la serie está creciendo a un ritmo bastante constante. Si está creciendo a un ritmo creciente, se puede aplicar el mismo procedimiento y la diferencia de los datos de nuevo. Sus datos serían entonces segundo diferenciada. Autocorrelaciones son valores numéricos que indican cómo una serie de datos está relacionado con sí mismo en el tiempo. Más precisamente, se mide la fuerza con los valores de datos en un número especificado de periodos aparte se correlacionan entre sí en el tiempo. El número de períodos separados generalmente se llama el retraso. Por ejemplo, una autocorrelación en medidas de retardo 1 cómo valora 1 periodo aparte están correlacionados entre sí a lo largo de la serie. Una autocorrelación en el retraso de 2 medidas de cómo los datos de dos períodos separados están correlacionadas en toda la serie. Autocorrelaciones pueden variar 1--1. Un valor cercano a 1 indica una correlación positiva alta, mientras que un valor cercano a -1 indica una correlación negativa alta. Estas medidas son más a menudo evaluados a través de representaciones gráficas llamadas correlagrams. Un correlagram representa los valores de autocorrelación para una serie dada en diferentes retardos. Esto se conoce como la función de autocorrelación y es muy importante en el método ARIMA. metodología ARIMA intenta describir los movimientos de una serie de tiempo estacionaria en función de lo que se denomina autorregresivo y moviendo parámetros medios. Estos se conocen como parámetros AR (autoregessive) y los parámetros MA (promedios móviles). Un modelo AR con sólo 1 de parámetros se puede escribir como. X (t) Un (1) X (t-1) E (t) en la que X (t) de series de tiempo bajo investigación Un (1) el parámetro autorregresivo de orden 1 X (t-1) las series de tiempo se retrasó 1 periodo E (t) el término de error del modelo Esto simplemente significa que cualquier valor dado de X (t) puede explicarse por alguna función de su valor anterior, X (t-1), además de algunos errores aleatorios inexplicable, E (t). Si el valor estimado de A (1) fue 0,30, entonces el valor actual de la serie estaría relacionado con 30 de su valor hace 1 período. Por supuesto, la serie podría estar relacionado con más de un valor pasado. Por ejemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Esto indica que el valor actual de la serie es una combinación de los dos valores inmediatamente anteriores, X (t-1) y X (t-2), además de algunos al azar de error e (t). Nuestro modelo es ahora un modelo autorregresivo de orden 2. Mover Modelos Promedio: Un segundo tipo de modelo de Box-Jenkins se llama un modelo de media móvil. Aunque estos modelos son muy similares al modelo AR, el concepto detrás de ellos es muy diferente. Móviles parámetros medios relacionan lo que ocurre en el período t sólo a los errores aleatorios que ocurrieron en periodos pasados, es decir, E (t-1), E (t-2), etc en lugar de X (t-1), X ( t-2), (Xt-3) como en los enfoques autorregresivos. Un modelo de media móvil con un término MA se puede escribir de la siguiente manera. X (t) - B (1) E (t-1) E (t) El término B (1) se llama un MA de orden 1. El signo negativo delante del parámetro se utiliza para la única convención y por lo general se imprime a cabo automáticamente por la mayoría de los programas de ordenador. El modelo anterior simplemente dice que cualquier valor dado de X (t) está directamente relacionado solamente con el error aleatorio en el periodo anterior, E (t-1), y con el término de error actual, E (t). Como en el caso de los modelos autorregresivos, los modelos de media móvil se pueden extender a estructuras de orden superior que cubren diferentes combinaciones y en movimiento longitudes medias. metodología ARIMA también permite que los modelos que se construirán que incorporan tanto autorregresivo y moviendo parámetros medios juntos. Estos modelos se conocen como modelos mixtos a menudo. Aunque esto lo convierte en una herramienta de pronóstico más complicado, de hecho, la estructura puede simular la serie mejor y producir un pronóstico más exacto. modelos puros implican que la estructura se compone sólo de los parámetros AR o MA - no ambas. Los modelos desarrollados por este enfoque generalmente se llaman los modelos ARIMA, ya que utilizan una combinación de autorregresivo (AR), la integración (I) - refiriéndose al proceso de diferenciación inversa para producir el pronóstico, y moviendo las operaciones promedio (MA). Un modelo ARIMA se indica generalmente como ARIMA (p, d, q). Esto representa el orden de los componentes autorregresivos (P), el número de operadores de diferenciación (d), y el más alto orden del plazo de media móvil. Por ejemplo, ARIMA (2,1,1) significa que usted tiene un modelo de segundo orden autorregresivo de primer orden con un componente promedio cuya serie se ha diferenciado una vez para inducir estacionariedad en movimiento. Recogiendo la Especificación de la derecha: El principal problema en la clásica Box-Jenkins está tratando de decidir qué especificación ARIMA utilizar - i. e. cuántos parámetros AR y / o MA que incluyen. Esto es lo que gran parte de la caja-Jenkings 1976 se dedicó al proceso de identificación. Dependía de gráfica y numérica eva - luación de la autocorrelación de la muestra y las funciones de autocorrelación parcial. Bueno, para sus modelos básicos, la tarea no es demasiado difícil. Cada uno tiene funciones de autocorrelación que se ven de cierta manera. Sin embargo, cuando se sube en la complejidad, los patrones no se detectan tan fácilmente. Para hacer las cosas más difíciles, los datos representan solamente una muestra del proceso subyacente. Esto significa que los errores de muestreo (valores atípicos, error de medición, etc.) pueden distorsionar el proceso de identificación teórica. Es por ello que la modelización ARIMA tradicional es un arte más que un procedimiento science. SPSS On-Line Taller de Capacitación de serie temporal proporciona las herramientas para la creación de modelos, la aplicación de un modelo existente para el análisis de series temporales, la descomposición de temporada y el análisis espectral de datos de series de tiempo, como así como herramientas para la computación autocorrelaciones y correlaciones cruzadas. Los siguientes dos clips de película muestran cómo crear un modelo de series de tiempo de alisamiento exponencial y cómo aplicar un modelo de series de tiempo existente para el análisis de series temporales de datos. PELÍCULA: Modelo de suavizado exponencial PELÍCULA: Arima herramienta modelizador experto amplificador Modelo En este taller en línea, usted encontrará muchos clips de película. Cada clip de película demostrará un cierto uso específico de SPSS. Crear modelos de TS. Existen diferentes métodos disponibles en SPSS para la creación de modelos de series temporales. Existen procedimientos para alisamiento exponencial, modelos (ARIMA)-media móvil univariante y multivariante autorregresivo integrado. Estos procedimientos producen pronósticos. Métodos de suavizado Forecasting - Las medias móviles, las medias móviles ponderadas y los métodos de suavización exponencial en son de uso frecuente en el pronóstico. El objetivo principal de cada uno de estos métodos es para suavizar las fluctuaciones aleatorias en la serie temporal. Estos son eficaces cuando las series de tiempo no muestra tendencia significativa, cíclico o de efectos estacionales. Es decir, la serie de tiempo es estable. los métodos de suavizado son generalmente buenos para predicciones a corto plazo. Medias Móviles: Promedio Móvil utiliza la media de los valores más recientes k de datos de la serie temporal. Por definición, MA S (la mayoría de los últimos valores de k) / k. Las tasas medias de variación MA como nuevas observaciones disponibles. Media móvil ponderada: En el método MA, cada punto de datos recibe el mismo peso. En promedio móvil ponderado, utilizamos diferentes pesos para cada punto de datos. En la selección de los pesos, se calcula la media ponderada de los valores más recientes de datos k. En muchos casos, el más reciente punto de datos recibe la mayor cantidad de peso y disminuye el peso de los puntos de datos más antiguos. La suma de los pesos es igual a 1. Una forma de seleccionar los pesos es el uso de los pesos que minimicen el criterio de error cuadrático medio (MSE). el método de suavización exponencial. Este es un método de promedio ponderado especial. Este método selecciona el peso para la observación más reciente y los pesos para las observaciones de más edad se calculan automáticamente. Estos otros pesos disminuye a medida que se hacen mayores observaciones. El modelo de suavizado exponencial básica es donde F t 1 pronóstico para el periodo t 1, t observación en el período t. F t pronóstico para el periodo t. y un parámetro de suavizado (o constante) (0 lt un LT1). Por una serie de tiempo, nos propusimos F 1 1 para el período 1 y pronósticos para periodos subsiguientes 2, 3, puede ser calculado por la fórmula para F t1. Con este enfoque, se puede mostrar que el método de suavizado exponencial es un promedio ponderado de todos los puntos de datos anteriores de la serie de tiempo. Una vez que se conoce, lo que necesitamos saber t t y F con el fin de calcular el pronóstico para el periodo t 1. En general, se elige un a que minimiza el MSE. Simple: adecuado para las series en las que no existe una tendencia o estacionalidad. componente media (q) que se mueve: órdenes de media móvil especifican cómo las desviaciones de la serie para los valores anteriores se utilizan para predecir los valores actuales. Expertos modelizador de series temporales determina automáticamente el mejor ajuste para los datos de series de tiempo. Por defecto, el modelizador experto considera tanto suavizado exponencial y modelos ARIMA. El usuario puede seleccionar sólo sea modelos de suavizado o ARIMA y especificar la detección automática de valores atípicos. En el siguiente clip de película se muestra cómo crear un modelo ARIMA con el método ARIMA y el modelizador experto proporcionado por SPSS. El conjunto de datos utilizados para esta demostración es el conjunto de datos AirlinePassenger. Ver la página de conjunto de datos para obtener más información. Los datos de pasajeros de aerolíneas se da como la serie G en el análisis de series temporales libro: Predicción y control por Box y Jenkins (1976). El número variable es el total mensual de pasajeros en miles. En virtud de la transformación logarítmica, los datos han sido analizados en la literatura. Aplicar modelos de series temporales. Este procedimiento se carga un modelo de serie temporal existente desde un archivo externo y el modelo se aplica al conjunto de datos de SPSS activo. Esto se puede utilizar para obtener predicciones para series que están disponibles sin necesidad de iniciar la construcción de un nuevo modelo de datos nuevos o revisados. El cuadro de diálogo principal es similar al cuadro de diálogo Crear modelos principales. Análisis espectral . Este procedimiento se puede utilizar para mostrar el comportamiento periódico en serie de tiempo. Gráficos de secuencia. Este procedimiento se utiliza para trazar los casos en secuencia. Para ejecutar este procedimiento, se necesita una serie de tiempo de datos o un conjunto de datos que se ordenan en cierto orden significativo. Autocorrelaciones. Esta función procedimiento parcelas de autocorrelación y la función de autocorrelación parcial de una o más series de tiempo. Las correlaciones cruzadas. Este procedimiento representa gráficamente la función de correlación cruzada de dos o más series de tiempo para retardos positivos, negativos y cero. Ver menú Ayuda de SPSS para solicitar información adicional sobre el tiempo modelo de serie, el análisis espectral, gráficos de secuencia, autocorrelaciones y procedimientos-correlaciones cruzadas. E sta línea Taller de formación de SPSS es desarrollado por el Dr. Carl Lee, el Dr. Felix Famoye. estudiantes asistentes Barbara Shelden y Albert Brown. Departamento de Matemáticas de la Universidad Central de Michigan. Todos los derechos reserved. ARMA y ARIMA (Box-Jenkins) modelos modelos ARIMA (Box-Jenkins) En las secciones anteriores ARMA y hemos visto cómo el valor de una serie de tiempo univariante en el tiempo t. x t. puede ser modelado utilizando una variedad de expresiones en movimiento promedio. También hemos demostrado que los componentes tales como las tendencias y la periodicidad de la serie temporal se pueden modelar de forma explícita y / o separan, con los datos que se descomponen en tendencia, estacionales y componentes residuales. También puso de manifiesto, en las discusiones anteriores sobre la autocorrelación. que los coeficientes de autocorrelación completas y parciales son extremadamente útiles en la identificación y el modelado de patrones en series de tiempo. Estos dos aspectos de análisis de series de tiempo y el modelado se pueden combinar en un marco más general, y, a menudo muy eficaz de modelado en general. En su forma más básica de este enfoque es conocido como el modelado ARMA (autorregresivo de media móvil), o cuando la diferenciación se incluye en el procedimiento, la modelización ARIMA o Box-Jenkins, después de que los dos autores que eran fundamentales para su desarrollo (véase el recuadro amp Jenkins, 1968 box1, y la caja, Jenkins amp Reinsel de 1994 BOX2). No hay una regla fija en cuanto al número de periodos de tiempo necesarios para la elaboración de modelos de éxito, pero para los modelos más complejos, y para una mayor confianza en los procedimientos de ajuste y validación, serie con 50 pasos de tiempo se recomienda a menudo. modelos ARMA combinan métodos de autocorrelación (AR) y las medias móviles (MA) en un modelo compuesto de la serie temporal. Antes de considerar cómo estos modelos pueden ser combinados, examinamos cada uno por separado. Ya hemos visto que los modelos de medias (MA) en movimiento puede ser utilizado para proporcionar un buen ajuste a algunos conjuntos de datos, y las variaciones en estos modelos que implican suavizado exponencial doble o triple puede manejar componentes de tendencia y periódicos en los datos. Además, estos modelos se pueden utilizar para crear previsiones que imitan el comportamiento de los períodos anteriores. Una forma simple de tales modelos, basados ​​en los datos anteriores, se puede escribir como: donde i términos de la beta son las ponderaciones aplicadas a los valores anteriores de la serie histórica, y es habitual para definir beta i 1, sin pérdida de generalidad. Así que para un proceso de primer orden, q 1 y tenemos el modelo: es decir, el valor de la media móvil se calcula como la media ponderada de los valores actuales y pasados ​​inmediatos. Este proceso de promedio es, en cierto sentido, un mecanismo regulador pragmática, sin un enlace directo a un modelo estadístico. Sin embargo, podemos especificar un modelo estadístico (o estocástico) que abarca los procedimientos de medias móviles en conjunción con los procesos aleatorios. Si dejamos que sea un conjunto de variables aleatorias independientes e idénticamente distribuidos (un proceso aleatorio) con media cero y varianza conocida fijo, entonces podemos escribir el proceso como un promedio móvil de orden q en términos de: Es evidente que el valor esperado de xt bajo este modelo es 0, por lo que el modelo sólo es válido si el xt ya han sido ajustados para tener significa un cero o si se añade una constante fija (la media de la xt) a la suma. También es evidente que la varianza de xt es simplemente: El análisis anterior se puede ampliar para evaluar la covarianza, cov (x t XTK.), Lo que nos encontramos con rendimientos: Tenga en cuenta que ni el valor medio, ni la covarianza (o autocovariancia) en el retardo k es una función del tiempo, t. por lo que el proceso es estacionario segundo orden. La expresión anterior nos permite obtener una expresión para la función de autocorrelación (ACF): Si k 0 rho k 1, y para k gt q rho k 0. Además, el ACF es simétrica y - k rho k rho. El ACF se puede calcular para un proceso de primer orden MA: El componente autorregresivo AR o de un modelo ARMA se puede escribir en la forma: donde los términos son de coeficientes de autocorrelación en los retardos 1,2. p y z t es un término de error residual. Tenga en cuenta que este término de error se relaciona específicamente con el actual período de tiempo, t. Así que para un proceso de primer orden, p 1 y que tiene el modelo: Estas expresiones indican que el valor estimado de x en el tiempo t se determina por el valor inmediatamente anterior de x (es decir, en el tiempo t -1) multiplicado por una medida, alfa . de la medida en que los valores para todos los pares de valores en los períodos de tiempo de espera 1 aparte están correlacionados (es decir, su autocorrelación), más un término de error residual, z. en el tiempo t. Pero esto es precisamente la definición de un proceso de Markov. por lo que un proceso de Markov es un primer proceso autorregresivo de orden. Si alfa 1 el modelo establece que el siguiente valor de x es simplemente el valor anterior más un término de error aleatorio, y por lo tanto es un simple paseo aleatorio 1D. Si se incluyen varios términos del modelo estima el valor de x en el tiempo t mediante una suma ponderada de estos términos, además de un componente de error aleatorio. Si sustituimos la segunda expresión anterior a la primera, tenemos: y la aplicación repetida de esta rendimientos de sustitución: Ahora bien, si LT1 alfa y k es grande, esta expresión se puede escribir en el orden inverso, con términos decrecientes y con la contribución de la expresión en x en el lado derecho de la expresión convirtiéndose prácticamente nula, por lo que tenemos: Desde el lado derecho de esta xt modelos de expresión como la suma de una serie ponderada de los valores anteriores, en este caso los términos de error aleatorio, es evidente que este modelo AR es, de hecho, una forma de modelo de MA. Y si asumimos que los términos de error tienen media cero y varianza constante, como en el modelo MA tenemos el valor esperado del modelo como también 0, suponiendo que el xt se han ajustado para proporcionar una media cero, con una variación: Ahora, como siempre que LT1 alfa esta suma es finito y es simplemente 1 / (1- alpha), por lo que tenemos: (. x t x tk) al igual que con el modelo MA anteriormente, este análisis se puede extender a evaluar la covarianza, cov de una proceso de primer orden AR, que nos encontramos con rendimientos: para LT1 alfa esta suma es finita y es simplemente alfa k / (1- alfa 2), por lo que tenemos: esto demuestra que para un modelo de primer orden autorregresivo de la función de autocorrelación (ACF) es simplemente definido por sucesivas potencias de la autocorrelación de primer orden, con la condición de LT1 alfa. Para Gt0 alfa esto es simplemente una curva de potencia o exponencial similar rápidamente decreciente, tendiendo a cero, o para LT0 es una curva oscilatoria de amortiguación, de nuevo tiende a cero. Si se hace una suposición de que la serie de tiempo es estacionaria del análisis anterior se puede extender a autocorrelaciones segundo y de orden superior. Con el fin de adaptarse a un modelo AR a un conjunto de datos observados, se busca minimizar la suma de los errores al cuadrado (un ajuste por mínimos cuadrados), utilizando el menor número de términos que proporcionan un ajuste adecuado a los datos. Los modelos de este tipo se describen como autorregresivo. y puede ser aplicado a ambas series de tiempo y los conjuntos de datos espaciales (véase más adelante, los modelos autorregresivos espaciales). Aunque, en teoría, un modelo autorregresivo podría proporcionar un buen ajuste a un conjunto de datos observados, por lo general, requeriría la eliminación previa de y componentes de tendencia y periódicos, e incluso entonces puede ser que necesite un gran número de términos con el fin de proporcionar un buen ajuste a los datos. Sin embargo, mediante la combinación de los modelos AR con modelos MA, podemos producir una familia de modelos mixtos que se pueden aplicar en una amplia gama de situaciones. Estos modelos se conocen como modelos ARMA y ARIMA, y se describen en las siguientes subsecciones. En los dos apartados anteriores hemos introducido el modo de MA de orden q: y el modelo AR de orden p: Podemos combinar estos dos modelos, simplemente añadiendo juntos como un modelo de orden (p q.), Donde tenemos términos AR p y términos q MA: En general, esta forma de modelo ARMA combinado se pueden utilizar para modelar una serie de tiempo con menos términos general que cualquiera de una MA o un modelo AR por sí mismos. Expresa el valor estimado en el tiempo t como la suma de los términos q que representan la variación promedio de la variación aleatoria sobre Q períodos anteriores (el componente MA), más la suma de los términos P AR que calculan el valor actual de x como la suma ponderada p de los valores más recientes. Sin embargo, esta forma de modelo supone que la serie de tiempo es estacionaria, que es raramente el caso. En la práctica, las tendencias y la periodicidad existe en muchas bases de datos, por lo que hay una necesidad de eliminar estos efectos antes de usar estos modelos. La eliminación se lleva a cabo típicamente mediante la inclusión en el modelo de una etapa inicial de diferenciación, por lo general, una vez, dos veces o tres veces, hasta que la serie es al menos aproximadamente estacionaria - no presente las tendencias o periodicidades obvias. Al igual que con los procesos de MA y AR, el proceso de diferenciación es descrito por el orden de diferenciación, por ejemplo 1, 2, 3. En conjunto, estos tres elementos forman una triple: (.. P d q) que define el tipo de modelo aplicado. De esta forma, el modelo se describe como un modelo ARIMA. La letra I en Arima se refiere al hecho de que el conjunto de datos ha sido inicialmente diferenciados (cf. diferenciación) y cuando el modelado es completa a continuación, los resultados tienen que ser sumadas o integradas para producir las estimaciones finales y pronósticos. modelización ARIMA se discute a continuación. Como se ha señalado en el apartado anterior, la combinación de diferenciación de una serie de tiempo no estacionarias con el modelo ARMA proporciona una poderosa familia de modelos que se pueden aplicar en una amplia gama de situaciones. El desarrollo de esta forma extendida de modelo es en gran parte debido a G E P G M Box y Jenkins, y como resultado de los modelos ARIMA son conocidos también como modelos Box-Jenkins. El primer paso en el procedimiento de Box-Jenkins es a diferencia de la serie de tiempo hasta que es estacionario, lo que garantiza que la tendencia y se eliminan los componentes de temporada. En muchos casos, uno o dos de diferenciación etapa es suficiente. La serie diferenciada será más corto que la serie fuente de C pasos de tiempo, donde C es el rango de la diferenciación. Un modelo ARMA se ajusta entonces a la serie de tiempo resultante. Dado que los modelos ARIMA tienen tres parámetros que hay muchas variaciones a los posibles modelos que puedan estar equipados. Sin embargo, la decisión sobre lo que estos parámetros deben ser pueden ser guiados por una serie de principios básicos: (i) el modelo debe ser lo más simple posible, es decir, contienen el menor número de términos como sea posible, que a su vez significa que los valores de p y q debe ser pequeña (ii) el ajuste a los datos históricos debe ser tan buena como sea posible, es decir, el tamaño de las diferencias al cuadrado entre el valor estimado en cualquier período de tiempo pasado y el valor real, debe reducirse al mínimo (principio de mínimos cuadrados) - los residuos del modelo seleccionado puede entonces ser examinado para ver si los residuos restantes son significativamente diferentes de 0 (véase más adelante) (iii) la correlación parcial medido en los retardos 1,2,3. debe proporcionar una indicación de la orden del componente de AR, es decir, el valor elegido para q (iv) la forma de la función de autocorrelación parcela (acf) puede sugerir el tipo de modelo ARIMA necesario - la tabla de abajo (del NIST) proporciona orientación sobre la interpretación de la forma de la ACF en cuanto a la selección del modelo. Modelo ARIMA selección del tipo de uso de la Serie ACF forma no es estacionaria. Los modelos estándar ARIMA se describen a menudo por la triple: (.. p q d) como se señaló anteriormente. Estos definen la estructura del modelo en términos de la orden de los modelos AR, de diferenciación y MA para ser utilizados. También es posible incluir parámetros similares para la estacionalidad en los datos, aunque estos modelos son más complejos de instalar y de interpretar - los callos (P. D. Q) se utiliza generalmente para identificar dichos componentes del modelo. En la captura de pantalla de SPSS se muestra a continuación, se muestra el diálogo para seleccionar manualmente los elementos estructurales no estacionales y de temporada (instalaciones similares están disponibles en otros paquetes integrados, tales como SAS / ETS). Como puede verse, el cuadro de diálogo también permite que los datos se transforman (típicamente para ayudar en la estabilización de la varianza) y para permitir a los usuarios incluir una constante en el modelo (el valor predeterminado). Esta herramienta de software en particular permite valores atípicos para ser detectados si es necesario, de acuerdo con una variedad de procedimientos de detección, pero en muchos casos se han investigado los valores atípicos y ajustado o eliminado y los valores de sustitución estimada, antes de cualquier análisis. SPSS modelizador de series temporales: la modelización ARIMA, el modo experto Una serie de modelos ARIMA puede ser ajustado a los datos, de forma manual o por medio de un proceso automatizado (por ejemplo, un proceso por etapas), y una o más medidas utiliza para juzgar cuál es el mejor en términos de la medida y la parsimonia. comparación de modelos normalmente hace uso de uno o más de los informativos medidas teóricas descritas anteriormente en este manual - AIC, MDL (la función de BIC y / o R, Arima (), proporciona la medida de la AIC, mientras que SPSS proporciona una serie de medidas de ajuste, incluida una versión de la estadística BIC otras herramientas varían en las medidas a -. Minitab, que ofrece una amplia gama de métodos de TSA, no incluye estadísticas AIC / tipo BIC). 3ª ed.


No comments:

Post a Comment