Tuesday 27 June 2017

Movendo Média Multiplicativo Modelo


Implementação de planilhas de ajuste sazonal e suavização exponencial. É fácil executar o ajuste sazonal e ajustar os modelos de suavização exponencial usando o Excel As imagens de tela e os gráficos abaixo são retirados de uma planilha que foi configurada para ilustrar o ajuste sazonal multiplicativo eo alinhamento exponencial linear no Seguindo os dados trimestrais de vendas do Outboard Marine. Para obter uma cópia do próprio arquivo de planilha, clique aqui A versão de suavização exponencial linear que será usada aqui para fins de demonstração é a versão de Brown, simplesmente porque ela pode ser implementada com uma única coluna De fórmulas e só há uma constante de suavização para otimizar Normalmente é melhor usar a versão de Holt que tem constantes de suavização separadas para nível e tendência. O processo de previsão segue como segue i primeiro os dados são ajustados sazonalmente ii então as previsões são geradas para o Dados ajustados sazonalmente através de suavização exponencial linear e iii fin As previsões ajustadas sazonalmente são reseasonalized para obter previsões para a série original O processo de ajuste sazonal é realizado nas colunas D por G. O primeiro passo no ajuste sazonal é calcular uma média móvel centrada realizada aqui na coluna D Isso pode ser feito por Tomando a média de duas médias anuais que são compensadas por um período relativo um ao outro Uma combinação de duas médias do deslocamento um pouco do que uma única média é needed para fins de centralização quando o número de estações é mesmo O próximo passo é computar A relação com a média móvel --e os dados originais divididos pela média móvel em cada período - que é realizada aqui na coluna E. Também é chamada de componente tendência-ciclo do padrão, na medida em que os efeitos da tendência e do ciclo de negócios podem Ser considerado como tudo o que permanece após a média sobre um ano inteiro de dados de s Claro, as mudanças mês a mês que não são devido à sazonalidade poderia ser determinada por muitos outros fatores S, mas a média de 12 meses suaviza-os em grande medida. O índice sazonal estimado para cada estação é calculado pela primeira média de todas as razões para aquela estação particular, que é feita nas células G3-G6 usando uma fórmula AVERAGEIF. São então redimensionadas de modo que somam exatamente 100 vezes o número de períodos em uma estação, ou 400, neste caso, o que é feito nas células H3-H6 Abaixo na coluna F, as fórmulas VLOOKUP são usadas para inserir o valor do índice sazonal apropriado em Cada linha da tabela de dados, de acordo com o trimestre do ano que representa A média móvel centrada e os dados ajustados sazonalmente acabam parecido com isto. Observe que a média móvel normalmente se parece com uma versão mais lisa da série ajustada sazonalmente, e ele É mais curta em ambas as extremidades. Outra planilha no mesmo arquivo do Excel mostra a aplicação do modelo de suavização exponencial linear aos dados ajustados sazonalmente, começando no valor da coluna GA para a constante de suavização alfa é en Acima da coluna de previsão aqui, na célula H9 e por conveniência é atribuído o nome de intervalo Alfa O nome é atribuído usando o comando Inserir nome Criar O modelo LES é inicializado por definir as primeiras duas previsões iguais ao primeiro valor real da sazonalidade Ajustada A fórmula usada aqui para a previsão de LES é a forma recursiva de equação única do modelo de Brown s. Esta fórmula é inserida na célula correspondente ao terceiro período aqui, célula H15 e copiada para baixo a partir de lá Observe que a LES previsão para o O período atual refere-se às duas observações precedentes e aos dois erros de previsão precedentes, assim como ao valor de alfa. Assim, a fórmula de previsão na linha 15 refere-se apenas a dados que estavam disponíveis na linha 14 e anteriores. Usar simples em vez de linear suavização exponencial, poderíamos substituir a fórmula SES aqui ao invés Poderíamos também usar Holt s em vez de marrom s LES modelo, o que exigiria mais duas colunas de formu Las para calcular o nível ea tendência que são usados ​​na previsão. Os erros são computados na coluna seguinte aqui, coluna J subtraindo as previsões dos valores reais O erro quadrático médio é calculado como a raiz quadrada da variância do Erros mais o quadrado da média Isto decorre da identidade matemática MSE VARIANCE erros MÉDIO erros 2 No cálculo da média e variância dos erros nesta fórmula, os dois primeiros períodos são excluídos porque o modelo não começa realmente a previsão até o terceiro período Linha 15 na planilha O valor ótimo de alfa pode ser encontrado alterando manualmente alfa até que o RMSE mínimo seja encontrado, ou então você pode usar o Solver para executar uma minimização exata O valor de alfa que o Solver encontrado é mostrado aqui alfa 0 471.Em geral, é uma boa idéia traçar os erros do modelo em unidades transformadas e também calcular e traçar suas autocorrelações em defasagens de até uma estação. Aqui está uma série de tempo Traçado dos erros corrigidos de sazonalidade. As autocorrelações de erro são calculadas usando a função CORREL para calcular as correlações dos erros com elas mesmas retardadas por um ou mais períodos - detalhes são mostrados no modelo de planilha Aqui está um gráfico das autocorrelações do Erros nas primeiras cinco lags. As autocorrelações nos intervalos 1 a 3 são muito próximas de zero, mas o pico no intervalo 4 cujo valor é 0 35 é ligeiramente problemático - sugere que o processo de ajuste sazonal não foi completamente bem sucedido No entanto, É realmente apenas marginalmente significativo 95 bandas de significância para testar se as autocorrelações são significativamente diferentes de zero são aproximadamente mais-ou-menos 2 SQRT nk, onde n é o tamanho da amostra e k é o lag Aqui n é 38 e k varia de 1 a 5, então a raiz quadrada de n-menos-k é de cerca de 6 para todos eles, e, portanto, os limites para testar a significância estatística de desvios de zero são aproximadamente mais ou menos 2 6, ou 0 33 If Você varia o Valor de alfa à mão neste modelo do Excel, você pode observar o efeito na série temporal e gráficos de autocorrelação dos erros, bem como sobre o erro raiz-médio quadrado, que será ilustrado abaixo. Na parte inferior da planilha , A fórmula de previsão é bootstrapped no futuro, simplesmente substituindo as previsões de valores reais no ponto onde os dados reais se esgota - ou seja, onde o futuro começa Em outras palavras, em cada célula onde um futuro valor de dados iria ocorrer, uma referência de célula É inserido que aponta para a previsão feita para esse período Todas as outras fórmulas são simplesmente copiadas para baixo de cima. Observe que os erros para as previsões do futuro são todos calculados para ser zero Isso não significa que os erros reais serão zero, mas sim Ele meramente reflete o fato de que, para fins de previsão, estamos assumindo que os dados futuros serão iguais às previsões em média As previsões LES resultantes para os dados dessazonalizados se parecem com this. With este valor particular E da alfa, o que é ótimo para as previsões de um período à frente, a tendência projetada é ligeiramente alta, refletindo a tendência local que foi observada nos últimos 2 anos ou mais. Para outros valores de alfa, uma projeção de tendência muito diferente poderia ser obtida Geralmente é uma boa idéia ver o que acontece com a projeção de tendência de longo prazo quando o alfa é variado, porque o valor que é melhor para a previsão de curto prazo não será necessariamente o melhor valor para prever o futuro mais distante. É o resultado que é obtido se o valor de alfa é manualmente definido como 0 25. A tendência de longo prazo projetada é agora negativa em vez de positiva Com um valor menor de alfa, o modelo está colocando mais peso em dados mais antigos em sua estimativa de O actual nível e tendência e as suas previsões a longo prazo reflectem a tendência descendente observada nos últimos 5 anos, em vez da tendência ascendente mais recente Este gráfico também ilustra claramente como o modelo com um valor menor de alfa é mais lento Para responder a pontos de viragem nos dados e, portanto, tende a fazer um erro do mesmo sinal para muitos períodos em uma linha Seus erros de previsão de 1 passo à frente são maiores em média do que aqueles obtidos antes RMSE de 34 4 em vez de 27 4 e Fortemente positivamente autocorrelacionado A autocorrelação lag-1 de 0 56 excede em muito o valor de 0 33 calculado acima para um desvio estatisticamente significativo de zero Como uma alternativa para cranking para baixo o valor de alfa, a fim de introduzir mais conservadorismo em previsões de longo prazo, um O fator de amortecimento de tendência é às vezes adicionado ao modelo para fazer a tendência projetada aplanar após alguns períodos. A etapa final na construção do modelo de previsão é racionalizar as previsões LES multiplicando-os pelos índices sazonais apropriados Assim, as previsões reseasonalized Na coluna I são simplesmente o produto dos índices sazonais na coluna F e as previsões de LES estacionalmente ajustadas na coluna H. É relativamente fácil calcular a confiança Intervalos para as previsões de um passo à frente feitas por este modelo primeiro calcular o RMSE root-mean-squared erro, que é apenas a raiz quadrada do MSE e, em seguida, calcular um intervalo de confiança para a previsão ajustada sazonalmente, adicionando e subtraindo duas vezes o RMSE Em geral, um intervalo de confiança de 95 para uma previsão de um período antecipado é aproximadamente igual à previsão de pontos mais ou menos duas vezes o desvio padrão estimado dos erros de previsão, assumindo que a distribuição de erro é aproximadamente normal eo tamanho da amostra É grande o suficiente, digamos, 20 ou mais Aqui, o RMSE em vez do desvio-padrão da amostra dos erros é a melhor estimativa do desvio padrão dos futuros erros de previsão porque leva bias, bem como variações aleatórias em conta Os limites de confiança para a sazonalidade Ajustada são então reseasonalized junto com a previsão, multiplicando-os pelos índices sazonais apropriados. Neste caso o RMSE é igual a 27 4 eo ajustado sazonalmente Previsão para o primeiro período futuro Dec-93 é 273 2 assim que o intervalo de confiança ajustado sazonalmente 95 é de 273 2-2 27 4 218 4 a 273 2 2 27 4 328 0 Multiplicando estes limites pelo índice sazonal de dezembro de 68 61 nós obtemos Limites de confiança inferior e superior de 149 8 e 225 0 em torno da previsão de ponto Dec-93 de 187 4. Os limites de confiabilidade para as previsões de mais de um período de tempo em geral aumentarão à medida que o horizonte de previsão aumenta, devido à incerteza quanto ao nível e à tendência Como os fatores sazonais, mas é difícil computá-los em geral por métodos analíticos A maneira adequada para calcular limites de confiança para a previsão LES é usando a teoria ARIMA, mas a incerteza nos índices sazonais é outra questão Se você quiser uma confiança realista Intervalo para uma previsão mais do que um período à frente, tendo todas as fontes de erro em conta, a sua melhor aposta é usar métodos empíricos, por exemplo, para obter um intervalo de confiança para uma previsão de duas etapas à frente, você poderia criar Outra coluna na planilha para calcular uma previsão de duas etapas para cada período, iniciando a previsão de um passo em frente Em seguida, calcular o RMSE dos erros de previsão de 2 etapas antecipadas e usá-lo como a base para um passo 2 - intervalo de confiança a frente. 2 Decomposição da Série de Tempo. Nesta seção estudamos métodos para analisar a estrutura de uma série de tempo. Estritamente essas técnicas não são métodos de previsão, mas serão úteis e serão empregadas em métodos de previsão reais. Analisar a estrutura subjacente de uma série temporal é decompor-la como. onde Y t é o valor observado no tempo tS t é a componente sazonal no tempo tT t é a componente tendência-ciclo no tempo tE t é uma componente aleatória irregular no tempo T. Há várias formas que a forma funcional f pode tomar.2 1 Additive e Multiplicative models. We ter uma decomposição aditiva if. We ter uma decomposição multiplicativa if. This pode ser convertido em um modelo aditivo, tomando logaritmo É importante traçar os componentes separadamente para fins de comparação. Para o modelo aditivo, é comum se concentrar em dados dessazonalizados, subtraindo-se a componente sazonal das observações. A sazonalidade Componente não é conhecido e tem que ser estimado para que os dados dessazonalizados assumam a forma Y t Aqui e no que se segue usamos um circumflex para denotar uma estimativa. Um ponto importante a notar é que na análise de uma série de tempo é geralmente melhor Para estimar a tendência de ciclo primeiro, em seguida, estimar a sazonalidade. Mas antes mesmo disso, é melhor reduzir o efeito do componente irregular por suavização dos dados Então, isso normalmente é feito first. One pode, em princípio, considerar alisamento como sendo realizado para Remover o efeito da irregularidade sozinho Isso deixará tanto o tempo e os componentes sazonais, que, em seguida, têm de ser distinguidos uns dos outros. No entanto, se uma componente sazonal é esperado, então é mais comum aplicar O alisamento de tal maneira que tanto a componente sazonal quanto a componente irregular são removidas. Isso deixa apenas o ciclo tendencial, que é, portanto, identificado. Usando esta última abordagem, podemos então remover imediatamente o ciclo de tendência por subtração. Identificar a sazonalidade a partir desta série temporal de tendência Deve-se notar que a suavização só produz uma estimativa da tendência-ciclo. Assim, a série de tempo de-tendência deve ser estritamente escrito como. Nós veremos em breve que a identificação da sazonalidade de um de , Ou de uma série temporal em que não havia ciclo de tendência, em primeiro lugar, é fácil.2 2 1 Média móvel. Uma maneira simples de realizar a suavização é usar uma média móvel A idéia básica é que os valores De observações que estão próximas umas das outras no tempo terão componentes de tendência-ciclo que são similares em valor Ignorando a componente sazonal para o momento, o valor da componente de tendência-ciclo em algum ponto de tempo particular pode então ser obtai Ned tomando uma média de um conjunto de observações sobre este ponto de tempo Porque os valores que são calculados em média dependem do ponto de tempo, isso é chamado de média móvel. Existem muitas formas diferentes que uma média móvel pode ter Muitos foram construídos usando o anúncio - hoc argumentos e raciocínio Todos se resumem a ser casos especiais do que é chamado de k-ponderada média móvel. where mk -1 2 é chamado de meia largura e os aj são chamados de pesos. Note que nesta definição k deve Ser um número ímpar As versões mais simples são o onde todos os pesos são os mesmos Isso é então chamado de uma média móvel simples de ordem k. Se os pesos são simetricamente equilibrada em torno do valor central ou seja, cerca de j 0 na soma, então isso é chamado Uma média móvel centrada. As médias móveis simples que envolvem um número par de termos podem ser usadas, mas então não estão centradas sobre um número inteiro. Isto pode ser corrigido pela média de uma segunda vez, apenas com a média das médias móveis. Assim, por exemplo, se Duas médias consecutivas de 4 pontos de movimento, então podemos centralizá-los tomando sua média. Este exemplo é chamado de 24 MA É simplesmente uma média móvel ponderada de 5 pontos, com pesos de extremidade cada 1 8, e com os outros três pesos. Se aplicado aos dados trimestrais, este 24 MA, daria o mesmo peso a todos os quatro trimestres, como o 1o e últimos valores se aplicariam ao mesmo quarto mas em anos diferentes Assim este mais liso suavizaria a variação sazonal trimestral. Suavizar a variação sazonal em dados mensais. Exercício 2 1 Quais são os pesos de um 212 MA suave. Há uma série de esquemas de ponderação proposta Todos tendem a ter valores de peso que caem para as duas extremidades da soma Também eles são geralmente simétricos Com aja - j Há um problema ao aplicar uma média móvel nas duas extremidades de uma série temporal quando ficamos sem observações para calcular a soma completa Quando menos de k observações estão disponíveis, os pesos são geralmente Em soma à unidade. Um efeito de uma média móvel é que subestimará tendências nos fins de uma série de tempo Isto significa que os métodos discutidos até agora são geralmente insatisfatórios para fins de previsão quando uma tendência está presente. Nesta seção nós consideramos O que poderia ser chamado de decomposição clássica Estes são métodos desenvolvidos na década de 1920 que formam a base de métodos de decomposição típicos existentes Considere os casos aditivo e multiplicativo e onde o período sazonal é 12.2 3 1 Decomposição Aditiva. Isto é para o caso onde YTSE A decomposição clássica leva quatro etapas. Passo 1 Calcule o centro 12 MA Denote esta série por M t Esta série estima o ciclo de tendência. Etapa 2 De-tendência a série original por subtração. Etapa 3 Calcule um índice sazonal para cada mês, tomando A média de todos os valores de cada mês, j. Nesta fórmula, é assumido que existem valores nj disponíveis para o mês j de modo que a soma é sobre esses valores nj. Etapa 4 A irregularidade estimada é obtida por subtração da componente sazonal da série desvirtuada. Aqui denota o índice sazonal para o mês correspondente à observação Y t.2 3 2 Decomposição Multiplicativa. Para o modelo multiplicativo YTSE o método é chamado a razão De reais para médias móveis Há novamente quatro steps. Step 1 Calcular o centrado 12 MA Denote esta série por M t Esta etapa é exatamente o mesmo que no caso do modelo aditivo. Etapa 2 Calcular R t a relação de reais para médias móveis. Etapa 3 Calcule um índice sazonal para cada mês, tomando a média de todos os valores de cada mês, j. Este passo é exatamente o mesmo que no caso aditivo, exceto que D é substituído por R. Passo 4 Calcular. Exercício 2 3 Analisar o House Sales Dados usando o modelo de aditivo Traçar o tendência de ciclo, estimativas sazonais e irregulares. Nota Este exercício lhe dá prática em usar a tabela dinâmica para calcular os ajustes sazonais. Exercício 2 4 Analisar o International Airli Ne Dados utilizando o modelo multiplicativo Trace o tendência-ciclo, estimativas sazonais e irregulares Web International Data da linha aérea. General sazonal modelos de ARIMA 0,1,1 x 0,1,1 etc. Outline da modelagem sazonal de ARIMA. A parte sazonal de um ARIMA Modelo tem a mesma estrutura que a parte não sazonal pode ter um fator AR, um fator MA e ou uma ordem de diferenciação Na parte sazonal do modelo, todos esses fatores operam entre múltiplos de lag s o número de períodos Em um modelo de temporada ARIMA sazonal é classificado como um ARIMA p, d, qx P, D, Q modelo, onde P número de sazonais autorregressiva SAR termos, D número de sazonais diferenças, Q número de sazonalidade média móvel SMA terms. In Identificando um modelo sazonal, o primeiro passo é determinar se é necessária ou não uma diferença sazonal, além ou talvez em vez de uma diferença não sazonal. Você deve olhar as parcelas de séries temporais e os gráficos ACF e PACF para todas as combinações possíveis de 0 Ou 1 diferença não sazonal e 0 ou 1 Diferença sazonal Atenção não use NUNCA mais de uma diferença sazonal, nem mais do que duas diferenças totais sazonais e não sazonais combinadas. Se o padrão sazonal é tanto forte e estável ao longo do tempo, por exemplo, alta no Verão e baixa no Inverno, ou vice Versa, então você provavelmente deve usar uma diferença sazonal, independentemente de usar uma diferença não sazonal, uma vez que isso irá evitar o padrão sazonal de morrer nas previsões de longo prazo Vamos adicionar isso à nossa lista de regras para identificar modelos. Regra 12 Se a série tem um padrão sazonal forte e consistente, então você deve usar uma ordem de diferenciação sazonal - mas nunca use mais de uma ordem de diferenciação sazonal ou mais de 2 ordens de diferença total sazonal não sazonal. A assinatura de pura SAR Ou comportamento SMA puro é semelhante à assinatura do AR puro ou comportamento MA puro, exceto que o padrão aparece através de múltiplos de lag s no ACF e PACF. Por exemplo, um puro SAR 1 processo tem spik Enquanto que o PACF corta após o atraso. No entanto, um processo SMA 1 puro tem picos no PACF em defasagens s, 2s, 3s, etc, enquanto o ACF corta após o atraso S. Uma assinatura SAR geralmente ocorre quando a autocorrelação no período sazonal é positiva, ao passo que uma assinatura SMA geralmente ocorre quando a autocorrelação sazonal é negativa, portanto. Se a autocorrelação no período sazonal é positiva, considere adicionar um termo SAR ao Modelo Se a autocorrelação no período sazonal é negativa, considere a adição de um termo SMA ao modelo Tente evitar misturar os termos SAR e SMA no mesmo modelo e evite usar mais de um dos dois tipos. Normalmente, um termo SAR 1 ou SMA 1 é Você raramente encontrará um processo SAR 2 ou SMA 2 genuíno e ainda mais raramente terá dados suficientes para estimar 2 ou mais coeficientes sazonais sem que o algoritmo de estimação entre em um loop de realimentação. Embora um modelo ARIMA sazonal pareça ter apenas alguns parâmetros R Portanto, você deve ter pelo menos 4 ou 5 estações de dados para se ajustar a um modelo ARIMA sazonal. Provavelmente, o modelo ARIMA sazonal mais comumente utilizado é o 0, 1,1 x 0,1,1 - isto é, um modelo MA 1 xSMA 1 com uma diferença sazonal e não sazonal. Este é essencialmente um modelo de alisamento exponencial sazonal. Quando os modelos ARIMA sazonais são ajustados a dados registados, são Capaz de rastrear um padrão sazonal multiplicativo. Example série AUTOSALE revisited. Recall que nós previu anteriormente a série de varejo auto vendas usando uma combinação de deflation, ajuste sazonal e suavização exponencial Vamos agora tentar ajustar a mesma série com modelos ARIMA sazonal, usando o Mesma amostra de dados de janeiro de 1970 a maio de 1993 281 observações Como antes vamos trabalhar com vendas de carros deflacionados - ou seja, vamos usar a série AUTO CPC como a variável de entrada Aqui estão o tempo seri Es plot e as parcelas ACF e PACF da série original, que são obtidas no procedimento de Previsão, traçando os resíduos de um modelo de ARIMA 0,0,0 x 0,0,0 com constante. O padrão de ponte de suspensão no ACF é típico De uma série que é tanto nonstationary e fortemente sazonal Claramente precisamos de pelo menos uma ordem de diferenciação Se tomarmos uma diferença não sazonal, as parcelas correspondentes são as seguintes. A série diferenciada os resíduos de um andar aleatório-com-crescimento modelo parece mais - ou - menos estacionário, mas ainda há uma autocorrelação muito forte no período sazonal de atraso 12.Porque o padrão sazonal é forte e estável, sabemos pela Regra 12 que queremos usar uma ordem de diferenciação sazonal no modelo Aqui está O que a imagem parece depois de uma diferença sazonal só. A série sazonalmente diferenciada mostra um padrão muito forte de autocorrelação positiva, como nos lembramos de nossa tentativa anterior de ajustar um modelo de caminhada aleatória sazonal Isso poderia ser um signatu AR Re - ou ele poderia sinalizar a necessidade de outra diferença. Se tomarmos uma diferença sazonal e não sazonais, após os resultados são obtidos. Estes são, naturalmente, os resíduos do modelo de tendência aleatória sazonal que ajustou para os dados de vendas de automóveis Mais cedo Nós vemos agora os sinais indicadores de overdifferencing suave os picos positivos no ACF e PACF tornaram-se negativo. Qual é a ordem correta de diferenciação? Uma mais peça de informação que pode ser útil é um cálculo das estatísticas de erro da série em cada Nível de diferenciação Podemos calculá-los ajustando os correspondentes modelos ARIMA nos quais apenas é utilizada a diferenciação. Os menores erros, tanto no período de estimação quanto no período de validação, são obtidos pelo modelo A, que utiliza uma diferença de cada tipo. O aparecimento das parcelas acima, sugere fortemente que devemos usar uma diferença sazonal e não sazonal Note que, exceto para o termo constante gratuitious, o modelo A é o mar Enquanto que o modelo B é apenas o modelo sazonal de caminhada aleatória SRW Como observamos anteriormente ao comparar esses modelos, o modelo SRT parece se encaixar melhor do que o modelo SRW Na análise que se segue, tentaremos melhorar esses modelos Através da adição de termos sazonais ARIMA Retornar ao topo da página. O modelo SRT mais freqüentemente usado do modelo ARIMA 0,1,1 x 0,1,1 mais os termos MA 1 e SMA 1. Retornando ao último conjunto de gráficos acima, observe Que com uma diferença de cada tipo há um pico negativo no ACF no retardo 1 e também um pico negativo no ACF no retardo 12 enquanto que o PACF mostra um padrão de decaimento mais gradual na vizinhança de ambos estes retardos Ao aplicar as nossas regras para Identificando especificamente os modelos ARIMA, Regra 7 e Regra 13, podemos agora concluir que o modelo SRT seria melhorado pela adição de um termo MA 1 e também um termo SMA 1 Também, pela Regra 5, excluímos a constante desde que duas ordens de Diferenciação estão envolvidos Se fizermos tudo isso, obtemos o ARIMA 0,1,1 X 0,1,1 modelo que é o mais utilizado modelo sazonal ARIMA Sua equação de previsão é. Onde 1 é o coeficiente MA 1 e 1 capital theta-1 é o coeficiente SMA 1 Note que este é apenas o modelo de tendência aleatória sazonal imaginado Além disso, observe que o coeficiente do erro lag-13 é o produto dos coeficientes MA 1 e SMA 1. Este modelo é conceitualmente semelhante ao modelo de Winters na medida em que Ele efetivamente aplica o alisamento exponencial ao nível, tendência e sazonalidade de uma só vez, embora se baseie em bases teóricas mais sólidas, particularmente no que se refere ao cálculo de intervalos de confiança para previsões de longo prazo. Seus gráficos residuais, neste caso, são os seguintes. Uma pequena quantidade de autocorrelação permanece no retardo 12, o aspecto geral das parcelas é bom Os resultados de ajuste do modelo mostram que os coeficientes MA 1 e SMA 1 estimados obtidos após 7 iterações são realmente significativos. Do modelo de tendência aleatória sazonal - ou seja, eles pegar o padrão sazonal ea tendência local no final da série -, mas eles são um pouco mais suave na aparência, uma vez que tanto o padrão sazonal ea tendência estão sendo efetivamente Média de um tipo de alisamento exponencial de forma ao longo das últimas temporadas. O que é este modelo realmente fazendo Você pode pensar nisso da seguinte maneira Primeiro ele calcula a diferença entre o valor de cada mês s e uma média exponencial ponderada histórica para esse mês que É calculado pela aplicação de suavização exponencial a valores que foram observados no mesmo mês em anos anteriores, onde a quantidade de suavização é determinada pelo coeficiente SMA 1. Em seguida, aplica-se o suavização exponencial simples a estas diferenças para prever o desvio da média histórica Que será observado no próximo mês O valor do coeficiente SMA 1 próximo de 1 0 sugere que muitas estações de dados estão sendo usadas para calcular o historica L média para um determinado mês do ano Lembre-se de que um coeficiente MA 1 em um modelo ARIMA 0,1,1 corresponde a 1-menos-alfa no modelo de suavização exponencial correspondente e que a idade média dos dados em uma suavização exponencial A previsão do modelo é 1 alfa O coeficiente de SMA 1 tem uma interpretação similar com relação às médias entre estações Aqui seu valor de 0 91 sugere que a idade média dos dados usados ​​para estimar o padrão sazonal histórico é um pouco mais de 10 anos quase a metade do Comprimento do conjunto de dados, o que significa que um padrão sazonal quase constante está sendo assumido O valor muito menor de 0 5 para o coeficiente MA 1 sugere que relativamente pouco alisamento está sendo feito para estimar o desvio atual da média histórica para o mesmo mês , De modo que o próximo mês previsto para o desvio de sua média histórica estará próximo dos desvios da média histórica observados nos últimos meses. O ARIMA 1,0,0 x 0,1,0 Modelo com modelo SRW constante mais termo AR 1. O modelo anterior era um modelo SRT de tendência aleatória sazonal ajustado pela adição de coeficientes MA 1 e SMA 1. Um modelo ARIMA alternativo para esta série pode ser obtido substituindo um termo AR 1 por A diferença não sazonal - isto é, adicionando um termo AR 1 ao modelo SRW de Random Walk Seasonal Isto nos permitirá preservar o padrão sazonal no modelo enquanto diminui a quantidade total de diferenciação, aumentando assim a estabilidade das projeções de tendência se desejado Que com uma única diferença sazonal, a série mostrou uma assinatura AR 1 forte. Se fizermos isso, obtemos um modelo ARIMA 1,0,0 x 0,1,0 com constante, o que produz os seguintes resultados. O coeficiente AR 1 É de facto altamente significativo eo RMSE é apenas 2 06, comparado com 3 00 para o modelo SRW Modelo B no relatório de comparação acima A equação de previsão para este modelo é. O termo adicional no lado direito é um múltiplo de O sazonal difere Nce observado no último mês, o que tem o efeito de corrigir a previsão para o efeito de um ano excepcionalmente bom ou mau Aqui 1 denota o coeficiente AR 1, cujo valor estimado é 0 73 Assim, por exemplo, se as vendas no mês passado foram X Dólares antes das vendas de um ano antes, então a quantidade 0 73X seria adicionada à previsão para este mês denota o CONSTANTE na equação de previsão, cujo valor estimado é 0 20 A estimativa MEAN, cujo valor é 0 75, é o valor médio Das séries sazonalmente diferenciadas, que é a tendência anual das previsões a longo prazo deste modelo. A constante é por definição igual à média vezes 1 menos o coeficiente AR 1 0 2 0 75 1 0 73. Modelo realmente faz um trabalho melhor do que o modelo SRW de rastreamento cíclico mudanças ou seja, anormalmente bons ou maus anos. No entanto, o MSE para este modelo ainda é significativamente maior do que o que obtivemos para o ARIMA 0,1,1 x 0,1,1 Modelo Se olharmos para as parcelas de resíduos, E quarto para melhoria Os resíduos ainda mostram algum sinal de variação cíclica. A ACF e PACF sugerem a necessidade de ambos os coeficientes MA 1 e SMA 1. Uma versão melhorada ARIMA 1,0,1 x 0,1,1 com constante. Adicionamos os termos MA 1 e SMA 1 indicados ao modelo anterior, obtemos um modelo ARIMA 1,0,1 x 0,1,1 com constante, cuja equação de previsão é. Isto é quase o mesmo que o ARIMA 0,1, 1 x 0,1,1, exceto que substitui a diferença não sazonal por um termo AR 1, uma diferença parcial e incorpora um termo constante representando a tendência de longo prazo. Portanto, este modelo assume uma tendência mais estável do que o ARIMA 0,1 , 1 x 0,1,1 modelo, e que é a principal diferença entre eles. O modelo de ajuste resultados são os seguintes. Notice que o estimado AR 1 coeficiente 1 na equação do modelo é 0 96, que é muito próximo de 1 0, mas não tão perto como para sugerir que ele absolutamente deve ser substituído por uma primeira diferença seu erro padrão é 0 02, por isso é cerca de 2 padrão e As outras estatísticas do modelo estimam os coeficientes MA 1 e SMA 1 e as estatísticas de erro nos períodos de estimativa e validação são, de outra forma, quase idênticas às do modelo ARIMA 0,1,1 x 0,1,1. MA 1 e SMA 1 são 0 45 e 0 91 neste modelo versus 0 48 e 0 91 no outro. O MEAN estimado de 0 68 é o aumento anual médio de tendência de longo prazo previsto Este é essencialmente o mesmo valor que foi obtido No modelo 1,0,0 x 0,1,0 com constante O erro padrão da média estimada é 0 26, portanto a diferença entre 0 75 e 0 68 não é significativa. Se a constante não foi incluída neste Modelo, seria um modelo de tendência de amortecimento a tendência em suas previsões de muito longo prazo seria gradualmente aplanar. As previsões de ponto deste modelo parecem bastante semelhantes aos do modelo 0,1,1 x 0,1,1 , Porque a tendência média é semelhante à tendência local no final da série. No entanto, os intervalos de confiança para este modelo alargam som De forma menos rápida devido ao seu pressuposto de que a tendência é estável. Observe que os limites de confiança para as previsões de dois anos estão agora dentro das linhas horizontais de 24 e 44, enquanto que os limites de 0,1,1 x 0,1 , 1 modelo não. ARIMA sazonal versus suavização exponencial e ajuste sazonal Agora vamos comparar o desempenho dos dois melhores modelos ARIMA contra modelos de suavização exponencial simples e linear acompanhados de ajuste sazonal multiplicativo, eo modelo de Winters, como mostrado nos slides de previsão Com o ajuste seasonal. As estatísticas do erro para as previsões um-período-adiante para todos os modelos são extremamente próximas neste caso É duro escolher um vencedor baseado somente nestes números Retorne ao topo da página. Quais são os tradeoffs entre os vários Modelos sazonais Os três modelos que usam o ajuste sazonal multiplicativo lidar com a sazonalidade de uma forma explícita - ou seja, os índices sazonais são quebrados como uma parte explícita do modelo Os modelos ARIMA d De acordo com a sazonalidade de uma maneira mais implícita - não podemos facilmente ver na produção ARIMA como a média de dezembro, digamos, difere da média de julho Dependendo se é considerado importante isolar o padrão sazonal, isso pode ser um fator de Escolhendo entre modelos Os modelos ARIMA têm a vantagem de que, uma vez inicializados, têm menos partes móveis do que os modelos exponenciais de suavização e de ajuste e, como tal, podem ser menos propensos a superar os dados. Os modelos ARIMA também possuem uma teoria subjacente mais sólida Com relação ao cálculo de intervalos de confiança para previsões de horizonte mais longo do que os outros modelos. Existem diferenças mais dramáticas entre os modelos com relação ao comportamento de suas previsões e intervalos de confiança para previsões mais de 1 período no futuro. Os pressupostos que são feitos em relação às mudanças na tendência e padrão sazonal são muito importantes. Entre os dois modelos ARIMA, um modelo A estima um Enquanto que o outro modelo B incorpora uma tendência média de longo prazo Poderíamos, se desejamos, nivelar a tendência de longo prazo no modelo B, suprimindo o termo constante Entre os modelos de suavização-mais-ajuste exponencial, Um modelo C assume uma tendência plana, enquanto o outro modelo D assume uma tendência variável no tempo O modelo E de Winters também assume uma tendência variando no tempo. Modelos que assumem uma tendência constante são relativamente mais confiantes em suas previsões de longo prazo do que modelos que Os modelos que não assumem tendências que variam em função do tempo geralmente têm intervalos de confiança mais estreitos para as previsões de horizonte mais longo, mas o menor não é melhor a menos que os intervalos de confiança não sejam melhores. Esta suposição está correta. Os dois modelos de suavização exponencial combinados com o ajuste sazonal assumem que o padrão sazonal permaneceu constante ao longo dos 23 anos na amostra de dados, enquanto os outros três Na medida em que o padrão sazonal representa a maior parte da variação mensal nos dados, é importante fazer previsões sobre o que acontecerá em vários meses no futuro Se se acredita que o padrão sazonal mudou lentamente ao longo do tempo , Outra abordagem seria apenas usar um histórico de dados mais curto para ajustar os modelos que estimam índices sazonais fixos. Para o registro, aqui estão as previsões e 95 limites de confiança para maio de 1995 24 meses à frente que são produzidos pelos cinco modelos. As previsões são, na verdade, surpreendentemente próximas uma da outra, em relação às larguras de todos os intervalos de confiança A previsão do ponto SES é a mais baixa, porque é o único modelo que não assume uma tendência ascendente no final da série O ARIMA 1,0 ,1 x 0,1,1 c model has the narrowest confidence limits, because it assumes less time-variation in the parameters than the other models Also, its point forecast is slightly larger than those of the other models, because it is extrapolating a long-term trend rather than a short-term trend or zero trend. The Winters model is the least stable of the models and its forecast therefore has the widest confidence limits, as was apparent in the detailed forecast plots for the models And the forecasts and confidence limits of the ARIMA 0,1,1 x 0,1,1 model and those of the LES seasonal adjustment model are virtually identical. To log or not to log Something that we have not yet done, but might have, is include a log transformation as part of the model Seasonal ARIMA models are inherently additive models, so if we want to capture a multiplicative seasonal pattern we must do so by logging the data prior to fitting the ARIMA model In Statgraphics, we would just have to specify Natural Log as a modeling option--no big deal In this case, the deflation transformation seems to have done a satisfactory job of stabilizing the amplitudes of the seasonal cycles, so there does not appear to be a compelling reason to a dd a log transformation as far as long term trends are concerned If the residuals showed a marked increase in variance over time, we might decide otherwise. There is still a question of whether the errors of these models have a consistent variance across months of the year If they don t, then confidence intervals for forecasts might tend to be too wide or too narrow according to the season The residual-vs-time plots do not show an obvious problem in this regard, but to be thorough, it would be good to look at the error variance by month If there is indeed a problem, a log transformation might fix it Return to top of page.

No comments:

Post a Comment