Sunday, 13 November 2016

Residuos Medios Móviles


Propósito: Comprobar la aleatoriedad Las gráficas de autocorrelación (Box y Jenkins, págs. 28-32) son una herramienta comúnmente usada para verificar la aleatoriedad en un conjunto de datos. Esta aleatoriedad se determina mediante el cálculo de autocorrelaciones para los valores de datos en diferentes intervalos de tiempo. Si son aleatorias, tales autocorrelaciones deben estar cerca de cero para todas las separaciones de tiempo-retraso. Si no es aleatorio, entonces una o más de las autocorrelaciones serán significativamente no-cero. Además, las parcelas de autocorrelación se utilizan en la fase de identificación del modelo para los modelos autorregresivos y móviles de serie temporal de Box-Jenkins. La autocorrelación es solo una medida de aleatoriedad Tenga en cuenta que no correlacionado no significa necesariamente aleatorio. Los datos que tienen una autocorrelación significativa no son aleatorios. Sin embargo, los datos que no muestran una autocorrelación significativa todavía pueden mostrar no aleatoriedad de otras maneras. La autocorrelación es sólo una medida de aleatoriedad. En el contexto de la validación del modelo (que es el tipo primario de aleatoriedad que describimos en el Manual), la comprobación de la autocorrelación suele ser una prueba suficiente de aleatoriedad, ya que los residuos de un modelo de ajuste inadecuado tienden a mostrar aleatoriedad no sutil. Sin embargo, algunas aplicaciones requieren una determinación más rigurosa de la aleatoriedad. En estos casos, una batería de pruebas, que pueden incluir la comprobación de la autocorrelación, se aplican ya que los datos pueden ser no aleatorios de muchas maneras diferentes ya menudo sutiles. Un ejemplo de dónde se necesita un control más riguroso de la aleatoriedad sería probar generadores de números aleatorios. Trazado de muestra: Las autocorrelaciones deben ser cercanas a cero para aleatoriedad. Este no es el caso en este ejemplo y por lo tanto la suposición de aleatoriedad falla. Este gráfico de autocorrelación muestra muestra que la serie temporal no es aleatoria, sino que tiene un alto grado de autocorrelación entre observaciones adyacentes y casi adyacentes. Coeficiente de autocorrelación donde C h es la función de autocovariancia y C 0 es la función de varianza. Obsérvese que R h está entre -1 y 1. Tenga en cuenta que algunas fuentes pueden usar la función Fórmula siguiente para la función de autocovariancia Aunque esta definición tiene menos sesgo, la formulación (1 / N) tiene algunas propiedades estadísticas deseables y es la forma más comúnmente utilizada en la bibliografía estadística. Vea las páginas 20 y 49-50 en Chatfield para más detalles. Eje horizontal: Retardo de tiempo h (h 1, 2, 3.) La línea anterior también contiene varias líneas de referencia horizontales. La línea media está en cero. Las otras cuatro líneas son 95 y 99 bandas de confianza. Observe que hay dos fórmulas distintas para generar las bandas de confianza. Si se utiliza el gráfico de autocorrelación para probar la aleatoriedad (es decir, no hay dependencia temporal en los datos), se recomienda la siguiente fórmula: donde N es el tamaño de la muestra, z es la función de distribución acumulativa de la distribución normal estándar y (alfa ) Es el nivel de significación. En este caso, las bandas de confianza tienen un ancho fijo que depende del tamaño de la muestra. Esta es la fórmula que se utilizó para generar las bandas de confianza en la gráfica anterior. Las gráficas de autocorrelación también se usan en la etapa de identificación del modelo para el ajuste de modelos ARIMA. En este caso, se supone un modelo de media móvil para los datos y se deben generar las siguientes bandas de confianza: donde k es el retraso, N es el tamaño de la muestra, z es la función de distribución acumulativa de la distribución normal estándar y (alfa) es El nivel de significación. En este caso, las bandas de confianza aumentan a medida que aumenta el desfase. La gráfica de autocorrelación puede proporcionar respuestas a las siguientes preguntas: Los datos son aleatorios? Es una observación relacionada con una observación adyacente? Es una observación relacionada con una observación extraída dos veces? Es la serie de tiempo observada el ruido blanco? La serie temporal observada es sinusoidal Es el modelo válido y suficiente? Es la fórmula ss / sqrt válida Importancia: Garantizar la validez de las conclusiones de la ingeniería Aleatoriedad (junto con el modelo fijo, la variación fija y la distribución fija) Es uno de los cuatro supuestos que típicamente subyacen a todos los procesos de medición. El supuesto de aleatoriedad es de importancia crítica por las tres razones siguientes: La mayoría de las pruebas estadísticas estándar dependen de la aleatoriedad. La validez de las conclusiones de la prueba está directamente relacionada con la validez del supuesto de aleatoriedad. Muchas de las fórmulas estadísticas utilizadas comúnmente dependen del supuesto de aleatoriedad, siendo la fórmula más común la fórmula para determinar la desviación estándar de la media de la muestra: donde s es la desviación estándar de los datos. Aunque muy utilizados, los resultados del uso de esta fórmula no tienen ningún valor a menos que la hipótesis de aleatoriedad se mantenga. Para datos univariados, el modelo predeterminado es Si los datos no son aleatorios, este modelo es incorrecto y no válido, y las estimaciones de los parámetros (como la constante) se vuelven sin sentido e inválidas. En resumen, si el analista no comprueba la aleatoriedad, entonces la validez de muchas de las conclusiones estadísticas se vuelve sospechosa. La gráfica de autocorrelación es una excelente manera de comprobar tal aleatoriedad. Esta pregunta ya tiene una respuesta aquí: Para un modelo de ARIMA (0,0,1), entiendo que R sigue la ecuación: xt mu e (t) thetae (t -1) (Por favor, corrija si estoy equivocado) Supongo que e (t-1) es el mismo que el residuo de la última observación. Por ejemplo, aquí están las primeras cuatro observaciones en una muestra de datos: 526 658 624 611 Estos son los parámetros Arima (0,0,1) modelo dio: intercepto 246,1848 ma1 0,9893 Y el primer valor que R ajustando usando el modelo es: 327.0773 Cómo consigo el segundo valor que utilicé: 246.1848 (0.9893 (526-327.0773)) 442.979 Pero el 2do valor cabido dado por R es. 434.7928 Supongo que la diferencia se debe al término e (t). Pero no sé cómo calcular el término e (t). Pidió Jul 28 14 a las 16:12 marcado como duplicado por Glenb 9830. Nick Stauner. Whuber 9830 Jul 29 14 at 1:24 Esta pregunta se ha hecho antes y ya tiene una respuesta. Si esas respuestas no responden completamente a su pregunta, haga una nueva pregunta. Usted podría obtener los valores ajustados como pronósticos de un solo paso utilizando el algoritmo de innovaciones. Véase por ejemplo la proposición 5.5.2 en Brockwell y Davis downloable de Internet encontré estas diapositivas. Es mucho más fácil obtener los valores ajustados como la diferencia entre los valores observados y los residuos. En este caso, su pregunta se reduce a la obtención de los residuos. Por ejemplo, podemos obtener el residuo en el punto de tiempo 140 como el valor observado en t140 menos la media estimada menos Hat veces el residuo anterior, t139): El filtro de función se puede utilizar para hacer estos cálculos: Usted puede ver que el resultado es muy cercano a los residuos devueltos por los residuos. La diferencia en los primeros residuos es más probable debido a alguna inicialización que puede haber omitido. Los valores ajustados son sólo los valores observados menos los residuos: En la práctica se deben utilizar las funciones residuales y ajustadas pero para fines pedagógicos se puede probar la ecuación recursiva utilizada anteriormente. Puede comenzar haciendo algunos ejemplos a mano como se muestra arriba. Te recomiendo que leas también la documentación del filtro de funciones y comparas algunos de tus cálculos con él. Una vez que entienda las operaciones involucradas en el cálculo de los valores residuales y ajustados podrá hacer un uso bien informado de las funciones más prácticas residuales y montadas. En un ejemplo de SMA, considere un valor con los siguientes precios de cierre en 15 días: Semana 1 (5 días) 20, 22 24, 25, 23 Semana 2 (5 días) 26, 28, 26, 29, 27 Semana 3 (5 días) 28, 30, 27, 29, 28 Un MA de 10 días promediaría los precios de cierre de la primera 10 días como el primer punto de datos. El próximo punto de datos bajaría el precio más temprano, agregaría el precio el día 11 y tomaría el promedio, y así sucesivamente como se muestra a continuación. Como se mencionó anteriormente, las AMs se retrasan en la acción de los precios actuales porque se basan en precios pasados, mientras más largo sea el período de tiempo para la MA, mayor será el retraso. Así, un MA de 200 días tendrá un grado mucho mayor de retraso que un MA de 20 días porque contiene precios durante los últimos 200 días. La longitud de la MA a utilizar depende de los objetivos de negociación, con MA más cortos utilizados para el comercio a corto plazo y más largo plazo MA más adecuado para los inversores a largo plazo. El MA de 200 días es ampliamente seguido por inversores y comerciantes, con rupturas por encima y por debajo de este promedio móvil considerado como señales comerciales importantes. Las MA también imparten señales comerciales importantes por sí solas, o cuando dos medias se cruzan. Un aumento MA indica que la seguridad está en una tendencia alcista. Mientras que un MA decreciente indica que está en una tendencia bajista. Del mismo modo, el impulso ascendente se confirma con un cruce alcista. Que se produce cuando una MA a corto plazo cruza por encima de un MA a más largo plazo. El impulso descendente se confirma con un cruce bajista, que ocurre cuando una MA a corto plazo cruza por debajo de un MA a más largo plazo.

No comments:

Post a Comment