Monday 20 November 2017

Arima Model Example In Stata Forex


Modelo de caminhada aleatória Quando confrontado com uma série de tempo que mostra crescimento irregular, como o X2 analisado anteriormente, a melhor estratégia pode não ser tentar prever diretamente o nível da série em cada período (ou seja, a quantidade Y t). Em vez disso, pode ser melhor tentar prever a mudança que ocorre de um período para o outro (ou seja, a quantidade Y t-Y t-1). Ou seja, pode ser melhor olhar a primeira diferença da série, para ver se um padrão previsível pode ser encontrado lá. Para fins de previsão de um período de antecedência, é tão bom prever a próxima mudança quanto a prever o próximo nível da série, uma vez que a mudança prevista pode ser adicionada ao nível atual para produzir um nível previsto. O caso mais simples de tal modelo é aquele que sempre prevê que a próxima mudança será zero, como se a série fosse igualmente susceptível de subir ou diminuir no próximo período, independentemente do que tenha feito no passado. Heres uma imagem que ilustra um processo aleatório para o qual este modelo é apropriado: em cada período de tempo, indo da esquerda para a direita, o valor da variável leva um passo aleatório independente para cima ou para baixo, uma chamada caminhada aleatória. Se os movimentos para cima e para baixo forem igualmente prováveis ​​em cada cruzamento, então todos os possíveis caminhos de esquerda para direita através da grade são igualmente prováveis ​​a priori. Veja este link para uma boa simulação. Uma analogia comumente usada é a de um bêbado que cambaleia aleatoriamente para a esquerda ou a direita enquanto tenta avançar: o caminho que ele traça será uma caminhada aleatória. Para um exemplo do mundo real, considere a taxa de câmbio diária entre o dólar e o euro. Um enredo de toda a história, de 1º de janeiro de 1999 a 5 de dezembro de 2014 (4006 observações), parece assim: o padrão histórico parece bastante interessante, com muitos picos e vales. (QuotChartistsquot muitas vezes tentam extrapolar tais padrões ajustando linhas de tendência ou curvas locais, o que eu não recomendo. Em média, 49 deles adivinharão corretamente a direção em que o mercado se moverá entre hoje e algumas datas futuras futuras.) Agora, Heres um enredo das mudanças diárias (primeira diferença): a volatilidade (variância) não foi constante ao longo do tempo, mas as mudanças do dia-a-dia são quase completamente aleatórias, como mostrado por uma trama de suas autocorrelações. A autocorrelação no intervalo k é a correlação entre a variável e ela mesma atrasada por k períodos. Se os valores da série são completamente aleatórios no sentido de serem estatisticamente independentes, os valores reais das autocorrelações são zero e os valores estimados não devem ser significativamente diferentes de zero. As linhas vermelhas neste gráfico são bandas de significância para testar se as autocorrelações das mudanças diárias são diferentes de zero no nível de significância de 0,05 e, em geral, não são. Em particular, eles são completamente insignificantes nos primeiros atrasos e não há padrão sistemático. (Para grandes amostras, as autocorrelações são significativamente diferentes de zero no nível de 0,05 se sua magnitude exceder mais ou menos duas divididas pela raiz quadrada do tamanho da amostra. Aqui o tamanho da amostra é 4006 e 2SQRT (4006) é aproximadamente 0,03 , Como se vê na localização das linhas vermelhas na trama.) O modelo de previsão sugerido por essas parcelas é que apenas não prevê nenhuma mudança de um período para o outro, porque os dados passados ​​não fornecem informações sobre a direção dos movimentos futuros: Este é o chamado modelo aleatório-walk-without-drift. Assume que, em cada momento, a série apenas faz um passo aleatório longe da sua última posição gravada, com etapas cujo valor médio é zero. Se o tamanho médio do passo for algum valor diferente de zero 945. o processo é dito ser um random-walk-with - drift. Cuja equação de previsão é 374 t Y t-1 945. O bêbado na imagem acima está faltando um sapato, então ele provavelmente estava à deriva. Em geral, as etapas podem ser variáveis ​​aleatórias discretas ou contínuas, e a escala de tempo também pode ser discreta ou contínua. Os padrões de caminhada aleatórios são comumente vistos na história de preços de ativos financeiros para os quais existem mercados especulativos, como ações e moedas. Isso não significa que os movimentos nesses preços sejam aleatórios no sentido de ser sem propósito. Quando eles vão para cima e para baixo, é sempre por uma razão, mas a direção do próximo movimento não pode ser predita ex ante: ele só pode ser explicado ex post, porque se a direção e a magnitude do próximo movimento de preços pudessem ter sido previstas em Avançar, então os especuladores já teriam subido ou diminuído por esse montante. Os padrões de caminhada aleatórios também são amplamente encontrados em outras partes da natureza, por exemplo, no fenômeno do movimento browniano que foi explicado pela primeira vez por Einstein. (Retornar ao topo da página.) É difícil dizer se o tamanho médio do passo em uma caminhada aleatória é realmente zero, e muito menos estimar seu valor preciso, meramente observando a amostra de dados históricos. Se você simular um processo de caminhada aleatória (por exemplo, criando um modelo de planilha que usa a função RAND () na fórmula para gerar os valores da etapa), você achará tipicamente que diferentes iterações do mesmo modelo renderão imagens dramaticamente diferentes, Muitos dos quais terão tendências de aparência significativa, como mostrado no link de simulação mencionado acima. Na verdade, o mesmo modelo geralmente renderá tendências ascendentes e descendentes em iterações repetidas, bem como curvas de aparência interessante que parecem exigir algum tipo de modelo complexo. Esta é apenas uma ilusão estatística, como a chamada mão quothot em basketball e outros exemplos de quotstreakinessquot em esportes. Seu cérebro tenta encontrar padrões difíceis, mesmo quando eles não estão lá. Veja o site Hot Hand in Sports para obter mais informações sobre isso. Nas aplicações, é melhor aproveitar outras fontes de informação e considerações teóricas para decidir se deve incluir um termo de deriva no modelo e, em caso afirmativo, como estimar seu valor. No caso das taxas de câmbio, não há razão para assumir uma tendência de longo prazo em uma direção ou a outra, pelo menos, não uma tendência que se opõe ao ruído. A variação diária média é 0,000012 para esta amostra de dados de taxa de câmbio e o erro padrão da média é de 0,00012, portanto a média da amostra é diferente de zero por apenas 110º de um erro padrão, o que não é significativo por nenhuma medida. Novamente, porém, o valor médio das etapas em uma amostra finita de dados de caminhada aleatória geralmente não fornece uma boa estimativa da taxa atual de deriva, se houver. No geral, parece que um modelo de caminhada aleatória sem drift é apropriado para esta série de tempo. Se o modelo for ajustado para todo o histórico dos dados diários, voltando para 1999, as previsões e 50 limites de confiança produzidos pelo modelo são assim: (Este gráfico foi produzido pela Statgraphics. 50 em vez de 95 limites são mostrados apenas para Faça com que eles se encaixem melhor na imagem. Na verdade, não há nada especial sobre 95, além da convenção.) Aqui está uma visão aproximada dos pontos e previsões de dados reais no final da série: as principais propriedades do modelo que São ilustrados por este gráfico são os seguintes: a. As previsões de um passo a frente dentro da amostra seguem exatamente o mesmo caminho que os dados. Exceto que eles ficaram atrasados ​​por um período. (Você deve olhar com atenção para ver isso: à primeira vista, pode parecer que o modelo se ajusta perfeitamente aos dados, mas na verdade ele está fazendo erros em todos os períodos, e esses erros são variáveis ​​aleatórias independentes.) B. As previsões de longo prazo fora da amostra seguem uma linha recta horizontal ancorada no último valor observado. Porque nenhuma derivação ascendente ou descendente ou qualquer outro padrão de tempo sistemático é assumido. (Se a derivação não-zero foi assumida, esta linha pode inclinar-se para cima ou para baixo). C. As bandas de confiança para previsões de longo prazo crescem de uma forma que se parece com uma parábola paralela. Por razões explicadas abaixo. (Retornar ao topo da página.) No modelo de caminhada aleatória sem deriva, o erro padrão da previsão anterior de 1 passo é o valor médio-quadrado-quadrado das mudanças de período a período na amostra de dados , Ou seja, é a raiz quadrada da média de valores quadrados da primeira diferença da série. Para um random-walk-with-derrift, o erro padrão de previsão é o desvio padrão da amostra das mudanças de período a período. (A diferença entre o valor RMS e o desvio padrão das mudanças geralmente é insignificante a menos que a volatilidade seja muito pequena em comparação com a deriva.) O erro que o modelo faz em uma previsão de passo a passo k é a soma de k independentemente E variáveis ​​aleatórias distribuídas de forma idêntica, porque o modelo continua a fazer a mesma previsão enquanto a variável leva k etapas aleatórias. Uma vez que a variância de uma soma de variáveis ​​aleatórias independentes é a soma das variâncias, segue-se que a variância do erro de previsão de passo-a-passo é maior do que a previsão de um período antecipado por um fator de k. E porque o desvio padrão do erro de previsão é a raiz quadrada de sua variação, segue-se que o erro padrão de uma previsão de passo a passo é maior do que a previsão de 1 passo por um fator de raiz quadrada - de-k. Esta é a chamada raiz quotsquare da regra timequot para os erros de previsões de caminhada aleatórias, e explica a forma de paralisia lateral das bandas de confiança para previsões de longo prazo: essa é a forma do gráfico de YSQRT (X). Para esta amostra de dados muito grande, o valor da raiz-médio-quadrado e o desvio padrão da amostra das mudanças diárias são iguais a 0,00778 para 3 dígitos significativos, então o erro padrão de um erro de previsão do passo k é 0,00778SQRT (k ), E os limites de confiança são calculados a partir dele da maneira usual. Um intervalo 95 é (aproximadamente) o ponto de previsão mais ou menos 2 erros padrão, e um intervalo de confiança 50 é o ponto de previsão mais ou menos dois terços de um erro padrão. No caso dos dados da taxa de câmbio, não é realmente apropriado usar toda a amostra para estimar o desvio padrão das mudanças diárias, porque claramente não tem sido constante ao longo do tempo. Um histórico de dados mais curto poderia ser usado para resolver esse problema, e outros tipos de informações, como os preços das opções cambiais, também poderiam ser considerados. O modelo de caminhada aleatória pode parecer trivial se você nunca viu antes: o que poderia ser mais simples do que sempre prever que amanhã será o mesmo que hoje. Isso nem exige nenhum conhecimento de estatísticas. Por esse motivo às vezes é chamado de Modelo simplista. No entanto, não é nada trivial. O padrão quadrado-raiz-de-tempo em suas faixas de confiança para previsões de longo prazo é de grande importância nas finanças (é a base da teoria do preço das opções) e o modelo de caminhada aleatória geralmente fornece uma boa referência para Julgar o desempenho de modelos mais complicados. O modelo de caminhada aleatória também pode ser visto como um caso especial importante de um modelo ARIMA (quota-padrão integrado de movimentação integrada). Especificamente, é um quotARIMA (0,1,0) quot modelo. Os modelos ARIMA mais gerais são capazes de lidar com padrões de tempo mais interessantes que envolvem etapas correlatas, como reversão média, oscilação, meios variáveis ​​no tempo e sazonalidade. Esses tópicos são discutidos em detalhes nas páginas ARIMA dessas notas. Para uma discussão muito mais completa do modelo de caminhada aleatória, ilustrada por uma amostra mais curta dos dados da taxa de câmbio, veja as QuotNotes no folheto do modelo de caminhada aleatória.8.9 Modelos sazonais ARIMA Até agora, restringimos nossa atenção aos dados não sazonais E modelos ARIMA não sazonais. No entanto, os modelos ARIMA também são capazes de modelar uma ampla gama de dados sazonais. Um modelo ARIMA sazonal é formado pela inclusão de termos sazonais adicionais nos modelos ARIMA que vimos até agora. Está escrito da seguinte forma: onde m número de períodos por estação. Usamos a notação de maiúsculas para as partes sazonais do modelo e a notação em minúsculas para as partes não-sazonais do modelo. A parte sazonal do modelo consiste em termos que são muito semelhantes aos componentes não-sazonais do modelo, mas envolvem retrocessos do período sazonal. Por exemplo, um modelo ARIMA (1,1,1) (1,1,1) 4 (sem uma constante) é para dados trimestrais (m4) e pode ser escrito como Os termos sazonais adicionais são simplesmente multiplicados pelo não-sazonal Termos. A parte sazonal de um modelo AR ou MA será vista nos atrasos sazonais do PACF e da ACF. Por exemplo, um modelo ARIMA (0,0,0) (0,0,1) 12 mostrará: um pico no intervalo 12 no ACF, mas nenhum outro pico significativo. O PACF mostrará decadência exponencial nos atrasos sazonais que é, nos atrasos 12, 24, 36,. Da mesma forma, um modelo ARIMA (0,0,0) (1,0,0) 12 mostrará: decaimento exponencial nos desacelerados sazonais do ACF, um único pico significativo no intervalo 12 no PACF. Ao considerar as ordens sazonais adequadas para um modelo ARIMA, restrinja a atenção para os atrasos sazonais. O procedimento de modelagem é quase o mesmo que para dados não sazonais, exceto que precisamos selecionar os termos sazonais AR e MA, bem como os componentes não sazonais do modelo. O processo é melhor ilustrado através de exemplos. Exemplo 8.3 Comércio a retalho trimestral europeu Vamos descrever o procedimento sazonal de modelagem ARIMA utilizando dados trimestrais do comércio varejista europeu de 1996 a 2011. Os dados são traçados na Figura 8.14. Figura 8.14: Índice trimestral do comércio varejista na área do euro (17 países), 19962011, abrangendo o comércio por grosso ea retalho e reparação de veículos motorizados e motocicletas. (Índice: 2005 100). Lote 40 euretail, ylab quotRetail indexquot. Xlab quotYearquot 41 Os dados são claramente não estacionários, com alguma sazonalidade, então primeiro vamos ter uma diferença sazonal. Os dados estatisamente diferenciados são mostrados na Figura 8.15. Estes também parecem não ser estacionários, e então tomamos uma primeira diferença adicional, mostrada na Figura 8.16. Tsdisplay 40 diff 40 diff 40 euretail, 4 41 41 41 Nosso objetivo agora é encontrar um modelo ARIMA apropriado baseado no ACF e PACF mostrado na Figura 8.16. O pico significativo no intervalo 1 na ACF sugere um componente não-sazonal de MA (1) e o pico significativo no intervalo 4 no ACF sugere um componente sazonal de MA (1). Consequentemente, começamos com um modelo ARIMA (0,1,1) (0,1,1) 4, indicando uma diferença inicial e sazonal e não sazonal e sazonal MA (1). Os resíduos para o modelo ajustado são mostrados na Figura 8.17. (Por lógica análoga, também poderíamos ter começado com um modelo ARIMA (1,1,0) (1,1,0) 4). Ajuste lt - Arima 40 euretail, ordem c 40 0. 1. 1 41. sazonal c 40 0. 1. 1 41 41 tsdisplay 40 resíduos 40 aptos 41 41 Tanto o ACF como o PACF mostram picos significativos no intervalo 2 e picos quase significativos no intervalo 3, indicando que alguns termos não sazonais adicionais precisam ser incluídos no modelo. O AICc do modelo ARIMA (0,1,2) (0,1,1) 4 é 74,36, enquanto que o modelo ARIMA (0,1,3) (0,1,1) 4 é 68,53. Também tentamos outros modelos com termos AR, mas nenhum que deu um valor AICc menor. Consequentemente, escolhemos o modelo ARIMA (0,1,3) (0,1,1) 4. Os seus resíduos são plotados na Figura 8.18. Todos os pontos estão agora dentro dos limites de significância e, portanto, os resíduos parecem ser ruídos brancos. Um teste de Ljung-Box também mostra que os resíduos não possuem autocorrelações restantes. Fit3 lt - Arima 40 euretail, ordem c 40 0. 1. 3 41. sazonal c 40 0. 1. 1 41 41 res lt - residuals 40 fit3 41 tsdisplay 40 res 41 Caixa. Teste 40 res, lag 16. fitdf 4. tipo quotLjungquot 41 Então, agora temos um modelo ARIMA sazonal que passa as verificações necessárias e está pronto para a previsão. As previsões do modelo para os próximos três anos são mostradas na Figura 8.19. Observe como as previsões seguem a tendência recente nos dados (isso ocorre devido ao duplo diferencial). Os grandes e rapidamente aumentados intervalos de previsão mostram que o índice de comércio varejista pode começar a aumentar ou a diminuir a qualquer momento, enquanto as previsões de pontos tendem para baixo, os intervalos de previsão permitem que os dados se apresentem para cima durante o período de previsão. Figura 8.19: Previsões dos dados do índice do comércio varejista europeu usando o modelo ARIMA (0,1,3) (0,1,1) 4. Intervalos de predição 80 e 95 são mostrados. Gráfico 40 previsão 40 fit3, h 12 41 41 Poderíamos ter usado auto. arima () para fazer a maior parte deste trabalho para nós. Isso teria dado o seguinte resultado. Gt auto. Arima 40 euretail 41 ARIMA 40 1. 1. 1 41 40 0. 1. 1 41 91 4 93 Coeficientes. Ar1 ma1 sma1 0,8828 - 0,5208 - 0,9704 s. E. 0.1424 0.1755 0.6792 sigma 2 estimado como 0.1411. Probabilidade de log - 30.19 AIC 68.37 AICc 69.11 BIC 76.68 Observe que selecionou um modelo diferente (com um valor AICc maior). Auto. arima () leva alguns atalhos para acelerar a computação e nem sempre dará o melhor modelo. Você pode desligar os atalhos e, às vezes, ele retornará um modelo diferente. Gt auto. Arima 40 euretail, stepwise FALSE, aproximação FALSE 41 ARIMA 40 0. 1. 3 41 40 0. 1. 1 41 91 4 93 Coeficientes. Ma1 ma2 ma3 sma1 0,2625 0,3697 0,4194 - 0,6615 s. E. 0.1239 0.1260 0.1296 0.1555 sigma 2 estimado como 0.1451. Probabilidade de log - 28.7 AIC 67.4 AICc 68.53 BIC 77.78 Desta vez, retornou o mesmo modelo que identificamos. Exemplo 8.4 Venda de medicamentos com cortecosteróides na Austrália Nosso segundo exemplo é mais difícil. Vamos tentar prever as vendas mensais de medicamentos do cortecosteróide na Austrália. Estes são conhecidos como medicamentos H02 sob o esquema de classificação química anatômica terapêutica. Figura 8.20: vendas de medicamentos de cortecosteróides na Austrália (em milhões de scripts por mês). Os dados registrados foram exibidos no painel inferior. Lh02 lt-log 40 h02 41 par 40 mfrow c 40 2. 1 41 41 gráfico 40 h02, vendas de ylab quotH02 (milhões de scripts) quot. Xlab quotYearquot 41 plot 40 lh02, ylab quotLog H02 salesquot. Xlab quotYearquot 41 Os dados de julho de 1991 a junho de 2008 são plotados na Figura 8.20. Há um pequeno aumento na variação com o nível, e, portanto, tomamos logaritmos para estabilizar a variância. Os dados são fortemente sazonais e, obviamente, não estacionários, e assim será usado o diferencial sazonal. Os dados estatisamente diferenciados são mostrados na Figura 8.21. Não é claro, neste momento, se devemos fazer outra diferença ou não. Nós decidimos não, mas a escolha não é óbvia. As últimas observações parecem ser diferentes (mais variáveis) dos dados anteriores. Isso pode ser devido ao fato de que os dados às vezes são revisados, pois as vendas anteriores são relatadas tarde. Figura 8.21: vendas de medicamentos do cortecosteróide diferenciados na estação na Austrália (em milhões de scripts por mês). Tsdisplay 40 diff 40 lh02, 12 41. principal quotSeasonally Differenced H02 scriptsquot. Xlab quotYearquot 41 Nas parcelas dos dados estatisamente diferenciados, há picos no PACF em atrasos 12 e 24, mas nada em atrasos sazonais no ACF. Isso pode sugerir um termo AR (2) sazonal. Nos desfasamentos não sazonais, existem três picos significativos no PACF sugerindo um possível termo AR (3). O padrão no ACF não é indicativo de nenhum modelo simples. Consequentemente, esta análise inicial sugere que um modelo possível para esses dados é um ARIMA (3,0,0) (2,1,0) 12. Ajustamos este modelo, juntamente com algumas variações e calculamos os valores de AICc que são mostrados na tabela a seguir. Gt fit lt - Arima 40 h02, ordem c 40 3. 0. 1 41. sazonal c 40 0. 1. 2 41. lambda 0 41 ARIMA 40 3. 0. 1 41 40 0. 1. 2 41 91 12 93 Caixa Transformação Cox. Lambda 0 Coeficientes. Ar1 ar2 ar3 ma1 sma1 sma2 - 0.1603 0.5481 0.5678 0.3827 - 0.5222 - 0.1768 s. E. 0,1636 0,0878 0,0942 0,1895 0,0861 0,0872 sigma 2 estimado como 0,004145. Probabilidade de log 250.04 AIC - 486.08 AICc - 485.48 BIC - 463.28 Os resíduos deste modelo são mostrados na Figura 8.22. Existem picos significativos tanto no ACF quanto no PACF, e o modelo falha no teste de Ljung-Box. O modelo ainda pode ser usado para previsão, mas os intervalos de predição podem não ser precisos devido aos resíduos correlacionados. Tsdisplay 40 resíduos 40 fit 41 41 Box. Teste 40 resíduos 40 cabem 41. lag 36. fitdf 6. tipo quotLjungquot 41 Em seguida, tentaremos usar o algoritmo automático ARIMA. Executar auto. arima () com argumentos deixados em seus valores padrão levou a um modelo ARIMA (2,1,3) (0,1,1) 12. No entanto, o modelo ainda falha no teste de Ljung-Box. Às vezes, não é possível encontrar um modelo que passe todos os testes. Finalmente, tentamos rodar auto. arima () com diferenciais especificados para d0 e D1, e permitindo modelos maiores do que o habitual. Isso levou a um modelo ARIMA (4,0,3) (0,1,1) 12, que passou todos os testes. Ajuste lt-auto. Arima 40 h02, lambda 0. d 0. D 1. max. Ordem 9, passo a passo FALSO, aproximação FALSE 41 tsdisplay 40 resíduos 40 caber 41 41 Caixa. Teste 40 resíduos 40 ajuste 41. lag 36. fitdf 8. tipo quotLjungquot 41 Avaliação do conjunto de testes: Vamos comparar alguns dos modelos instalados até agora usando um conjunto de testes composto pelos dois últimos anos de dados. Assim, nós ajustamos os modelos usando dados de julho de 1991 a junho de 2006 e prevemos as vendas de roteiros para julho de 2006 junho de 2008. Os resultados estão resumidos na tabela a seguir. Getrmse lt - function 40 x, ​​h. 41 123 trem. Fim do tempo 40 x 41 91 comprimento 40 x 41 - h 93 teste. Início lt-time 40 x 41 91 comprimento 40 x 41 - h 1 93 trem lt - janela 40 x, ​​comboio final. Fim 41 janela de teste 40 x, ​​teste de início. Comece 41 em forma de trem Arima 40. 41 fc lt - previsão 40 ajuste, hh 41 retorno 40 precisão 40 fc, teste 41 91 2. quotRMSEquot 93 41 125 getrmse 40 h02, h 24. ordem c 40 3. 0. 0 41, sazonal c 40 2. 1. 0 41, lambda 0 41 getrmse 40 h02, h 24. ordem c 40 3. 0. 1 41, sazonal c 40 2. 1. 0 41, lambda 0 41 getrmse 40 h02, h 24. ordem c 40 3. 0. 2 41, sazonal c 40 2. 1. 0 41, lambda 0 41 getrmse 40 h02, h 24. ordem c 40 3. 0. 1 41, sazonal c 40 1. 1. 0 41, lambda 0 41 getrmse 40 h02, h 24. ordem c 40 3. 0. 1 41, c 40 sazonal. 1. 1 41, lambda 0 41 getrmse 40 h02, h 24. ordem c 40 3. 0. 1 41, sazonal c 40 0. 1. 2 41, lambda 0 41 getrmse 40 h02, h 24. ordem c 40 3. 0. 1 41, sazonal c 40 1. 1. 1 41, lambda 0 41 getrmse 40 h02, h 24. ordem c 40 4. 0. 3 41, sazonal c 40 0. 1. 1 41, lambda 0 41 getrmse 40 h02, h 24. ordem c 40 3. 0. 3 41, s c seasonal 40. 1. 1 41, lambda 0 41 getrmse 40 h02, h 24. ordem c 40 4. 0.2 41, sazonal c 40 0. 1. 1 41, lambda 0 41 getrmse 40 h02, h 24. ordem c 40 3. 0. 2 41 , Sazonal c 40 0. 1. 1 41, lambda 0 41 getrmse 40 h02, h 24. ordem c 40 2. 1. 3 41, s seasonal c 40 0. 1. 1 41, lambda 0 41 getrmse 40 h02, h 24 Ordem c 40 2. 1. 4 41, c 40 sazonal 1. 1 41, lambda 0 41 getrmse 40 h02, h 24. ordem c 40 2. 1. 5 41, sazonal c 40 0. 1. 1 41 , Lambda 0 41 Os modelos que têm os valores AICc mais baixos tendem a dar resultados ligeiramente melhores do que os outros modelos, mas não há uma grande diferença. Além disso, o único modelo que passou os testes residuais não forneceu os melhores valores RMSE fora de amostra. Quando os modelos são comparados usando valores de AICc, é importante que todos os modelos tenham as mesmas ordens de diferenciação. No entanto, ao comparar modelos usando um conjunto de testes, não importa como as previsões foram produzidas - as comparações são sempre válidas. Conseqüentemente, na tabela acima, podemos incluir alguns modelos com apenas diferenciações sazonais e alguns modelos com diferenciamento inicial e sazonal. Mas na tabela anterior contendo valores de AICc, comparamos modelos com apenas diferenciações sazonais. Nenhum dos modelos considerados aqui passa todos os testes residuais. Na prática, normalmente usaríamos o melhor modelo que pudéssemos encontrar, mesmo que não passasse todos os testes. As previsões do modelo ARIMA (3,0,1) (0,1,2) 12 (que tem o valor RMSE mais baixo no conjunto de teste e o melhor valor AICc entre modelos com apenas diferenças sazonais e menos de seis parâmetros) são Mostrado na figura abaixo.

No comments:

Post a Comment