Simulação de média móvel automática
Modelos ARMA (p, q) para análise de séries temporais - Parte 3 Este é o terceiro e último post da mini-série sobre modelos de média móvel auto-regressiva (ARMA) para análise de séries temporais. Weve introduziu modelos autorregressivos e modelos de média móvel nos dois artigos anteriores. Agora é hora de combiná-los para produzir um modelo mais sofisticado. Em última análise, isso nos levará aos modelos ARIMA e GARCH que nos permitirão prever os retornos dos ativos e prever a volatilidade. Estes modelos constituirão a base para a negociação de sinais e técnicas de gestão de risco. Se você leu Parte 1 e Parte 2 você terá visto que tendemos a seguir um padrão para a nossa análise de um modelo de série de tempo. Ill repeti-lo brevemente aqui: Racional - Por que estamos interessados neste modelo específico Definição - Uma definição matemática para reduzir a ambigüidade. Correlograma - Traçar um correlograma de amostra para visualizar o comportamento de um modelo. Simulação e Montagem - Ajustar o modelo a simulações, a fim de assegurar que o weve compreendeu o modelo corretamente. Dados financeiros reais - Aplicar o modelo aos preços dos ativos reais reais. Previsão - Previsão de valores subseqüentes para construir sinais de negociação ou filtros. Para seguir este artigo é aconselhável dar uma olhada nos artigos anteriores sobre a análise de séries temporais. Todos podem ser encontrados aqui. Critério Bayesiano de Informações Na Parte 1 deste artigo, analisámos o Critério de Informação Akaike (AIC) como um meio de nos ajudar a escolher entre os melhores modelos de séries temporais. Uma ferramenta estreitamente relacionada é o critério Bayesiano de Informação (BIC). Essencialmente, tem comportamento semelhante ao AIC, pois penaliza os modelos por terem muitos parâmetros. Isto pode conduzir a overfitting. A diferença entre o BIC eo AIC é que o BIC é mais rigoroso com a penalização de parâmetros adicionais. Critério Bayesiano de Informações Se tomarmos a função de verossimilhança para um modelo estatístico, que tenha k parâmetros, e L maximize a probabilidade. Então o critério Bayesiano de Informação é dado por: Onde n é o número de pontos de dados na série temporal. Usaremos o AIC eo BIC abaixo ao escolher modelos ARMA (p, q) apropriados. Ljung-Box Test Na Parte 1 deste artigo, Rajan mencionou nos comentários de Disqus que o teste de Ljung-Box era mais apropriado do que usar o Critério de Informação Akaike do Critério de Informação Bayesiano para decidir se um modelo ARMA era um bom ajuste para um tempo Series. O teste de Ljung-Box é um teste de hipóteses clássico que é projetado para testar se um conjunto de autocorrelações de um modelo de séries de tempo ajustado diferem significativamente de zero. O teste não testar cada atraso individual para aleatoriedade, mas sim testa a aleatoriedade sobre um grupo de defasagens. Teste de Ljung-Box Definimos a hipótese nula como: Os dados da série de tempo em cada lag são i. i.d .. isto é, as correlações entre os valores da série de população são zero. Definimos a hipótese alternativa como: Os dados da série de tempo não são i. i.d. E possuem correlação serial. Calculamos a seguinte estatística de teste. Q: Onde n é o comprimento da amostra de séries temporais, hat k é a autocorrelação da amostra com atraso k eh é o número de atrasos no teste. A regra de decisão sobre se rejeitar a hipótese nula é verificar se Q gt chi2, para uma distribuição qui-quadrado com h graus de liberdade no percentil 100 (1-alfa). Embora os detalhes do teste possam parecer um pouco complexos, podemos de fato usar R para calcular o teste para nós, simplificando o procedimento um pouco. Agora que discutimos o BIC e o teste de Ljung-Box, estávamos prontos para discutir o nosso primeiro modelo misto, ou seja, a Média Móvel Autoresgressiva de ordem p, q, ou ARMA (p, Q). Até o momento, consideramos processos autorregressivos e processos de média móvel. O modelo anterior considera seu próprio comportamento passado como insumos para o modelo e, como tal, tenta capturar efeitos de participantes no mercado, como momentum e reversão média na negociação de ações. O último modelo é usado para caracterizar informações de choque em uma série, como um anúncio de ganhos surpresa ou evento inesperado (como o derramamento de óleo BP Deepwater Horizon). Assim, um modelo ARMA tenta capturar ambos os aspectos ao modelar séries de tempo financeiro. Note-se que um modelo ARMA não leva em conta a volatilidade clustering, um fenômeno empírico chave de muitas séries financeiras. Não é um modelo condicionalmente heterocedástico. Para isso teremos de esperar pelos modelos ARCH e GARCH. Definição O modelo ARMA (p, q) é uma combinação linear de dois modelos lineares e, portanto, é ainda linear: Modelo de ordem temporal p, q Um modelo de série temporal, é um modelo de média móvel autorregressiva de ordem p, q . Onde está o ruído branco com E (wt) 0 e variância sigma2. Onde está o ruído branco com E (wt) 0 e variância sigma2. Se considerarmos o Backward Shift Operator. (Veja um artigo anterior), então podemos reescrever o acima como uma função theta e phi de: Podemos ver diretamente que, ao definir p neq 0 e q0, recuperamos o modelo AR (p). Da mesma forma, se definimos p 0 e q neq 0, recuperamos o modelo MA (q). Uma das principais características do modelo ARMA é que ele é parcimonioso e redundante em seus parâmetros. Ou seja, um modelo ARMA, muitas vezes, exigem menos parâmetros do que um modelo AR (p) ou MA (q) sozinho. Além disso, se reescrevemos a equação em termos do BSO, então os polinômios theta e phi podem às vezes compartilhar um fator comum, levando assim a um modelo mais simples. Simulações e Correlogramas Como com os modelos de média autorregressiva e móvel, vamos agora simular várias séries ARMA e, em seguida, tentar ajustar modelos ARMA a estas realizações. Nós realizamos isso porque queremos garantir que entendemos o procedimento de montagem, incluindo como calcular os intervalos de confiança para os modelos, bem como garantir que o procedimento realmente recuperar estimativas razoáveis para os parâmetros ARMA original. Na Parte 1 e Parte 2 construímos manualmente as séries AR e MA tirando N amostras de uma distribuição normal e, em seguida, criando o modelo de série temporal específico usando atrasos dessas amostras. No entanto, há uma maneira mais simples de simular AR, MA, ARMA e ARIMA dados, simplesmente usando o método arima. sim em R. Vamos começar com o mais simples possível não trivial ARMA modelo, ou seja, o ARMA (1,1 ) modelo. Ou seja, um modelo autorregressivo de ordem um combinado com um modelo de média móvel de ordem um. Tal modelo tem apenas dois coeficientes, alfa e beta, que representam os primeiros desfasamentos da série de tempo em si e os termos de ruído de choque branco. Esse modelo é dado por: Precisamos especificar os coeficientes antes da simulação. Vamos tomar alpha 0,5 e beta -0,5: A saída é a seguinte: Vamos também traçar o correlograma: Podemos ver que não há autocorrelação significativa, o que é de esperar de um modelo ARMA (1,1). Finalmente, vamos tentar determinar os coeficientes e seus erros padrão usando a função arima: Podemos calcular os intervalos de confiança para cada parâmetro usando os erros padrão: Os intervalos de confiança contêm os valores dos parâmetros verdadeiros para ambos os casos, no entanto, 95 intervalos de confiança são muito amplos (uma consequência dos erros padrão razoavelmente grandes). Vamos agora tentar um modelo ARMA (2,2). Ou seja, um modelo AR (2) combinado com um modelo MA (2). Precisamos especificar quatro parâmetros para este modelo: alfa1, alfa2, beta1 e beta2. Vamos pegar alpha1 0.5, alpha2-0.25 beta10.5 e beta2-0.3: A saída do nosso modelo ARMA (2,2) é a seguinte: E a autocorelação correspondente: Podemos agora tentar montar um modelo ARMA (2,2) para Os dados: Também podemos calcular os intervalos de confiança para cada parâmetro: Observe que os intervalos de confiança para os coeficientes para a componente média móvel (beta1 e beta2) não contêm realmente o valor do parâmetro original. Contudo, para fins comerciais, precisamos apenas de um poder preditivo que exceda o acaso e produza lucros suficientes acima dos custos de transação, a fim de ser rentável em termos de custos. A longo prazo. Agora que temos visto alguns exemplos de modelos ARMA simulados, precisamos de um mecanismo para escolher os valores de p e q quando se encaixam nos modelos a dados financeiros reais. Escolhendo o melhor modelo ARMA (p, q) Para determinar qual ordem p, q do modelo ARMA é apropriada para uma série, precisamos usar o AIC (ou BIC) em um subconjunto de valores para p, q, e Em seguida, aplicar o teste Ljung-Box para determinar se um bom ajuste foi alcançado, para valores específicos de p, q. Para mostrar este método, vamos primeiro simular um determinado processo ARMA (p, q). Em seguida, faremos um loop sobre todos os valores pairwise de p in e q in e calculamos o AIC. Vamos selecionar o modelo com o menor AIC e, em seguida, executar um teste de Ljung-Box sobre os resíduos para determinar se conseguimos um bom ajuste. Vamos começar simulando uma série ARMA (3,2): Agora vamos criar um objeto final para armazenar o melhor ajuste do modelo eo menor valor AIC. Percorremos as várias combinações p, q e usamos o objeto atual para armazenar o ajuste de um modelo ARMA (i, j), para as variáveis looping i e j. Se o AIC atual for menor que qualquer AIC previamente calculado, definiremos o AIC final para este valor atual e selecionaremos essa ordem. Após a terminação do loop, temos a ordem do modelo ARMA armazenado em final. order e o ARIMA (p, d, q) se encaixa (com o componente d integrado definido como 0) armazenado como final. arma: Permite a saída do AIC , Ordem e coeficientes ARIMA: Podemos ver que a ordem original do modelo ARMA simulado foi recuperada, nomeadamente com p3 e q2. Podemos plotar o corelograma dos resíduos do modelo para ver se eles parecem uma realização de ruído branco discreto (DWN): O corelograma realmente parece uma realização de DWN. Finalmente, realizamos o teste de Ljung-Box para 20 lags para confirmar isso: Observe que o valor p é maior que 0,05, o que indica que os resíduos são independentes no nível 95 e, portanto, um modelo ARMA (3,2) Bom ajuste do modelo. No entanto, este é precisamente o procedimento que vamos usar quando chegarmos a ajustar modelos ARMA (p, q) para o índice SampP500 na seção a seguir. Dados Financeiros Agora que descrevemos o procedimento para escolher o modelo de série temporal ideal para uma série simulada, é bastante simples aplicá-lo aos dados financeiros. Para este exemplo, vamos escolher mais uma vez o SampP500 US Equity Index. Permite fazer o download dos preços de fechamento diários usando o quantmod e, em seguida, criar o fluxo de retorno do log: Permite executar o mesmo procedimento de ajuste que para a série ARMA (3,2) simulada acima no log retorna série do SampP500 usando o AIC: Tem a ordem ARMA (3,3): Permite traçar os resíduos do modelo ajustado para o fluxo de retorno diário do SampP500: Observe que há alguns picos significativos, especialmente em defasagens maiores. Isto é indicativo de um ajuste pobre. Vamos realizar um teste de Ljung-Box para ver se temos evidências estatísticas para isso: Como nós suspeitamos, o valor p é menor que 0,05 e, como tal, não podemos dizer que os resíduos são uma realização de ruído branco discreto. Portanto, há autocorrelação adicional nos resíduos que não é explicada pelo modelo ARMA (3,3). Próximas etapas Como discutimos ao longo desta série de artigos, vimos evidências de heterocedasticidade condicional (agrupamento de volatilidade) na série SampP500, especialmente nos períodos em torno de 2007-2008. Quando usamos um modelo GARCH mais tarde na série de artigos, veremos como eliminar essas autocorrelações. Na prática, os modelos ARMA nunca são geralmente bons ajustes para retorno de ações log. Precisamos levar em conta a heterocedasticidade condicional e usar uma combinação de ARIMA e GARCH. O próximo artigo irá considerar ARIMA e mostrar como o componente integrado difere do modelo ARMA que temos considerado neste artigo. Apenas começando com quantitativa TradingPractical resultados em simulação e previsão Referências Anis, A. A. E Lloyd, E. H. (1976) O valor esperado da gama de Hurst ajustada ajustada de summands normais independentes, Biometrika 63, pp 111116. CrossRef Askew, A. J. Yeh, W. W.G. E Hall, WA (1971) Um estudo comparativo da simulação da seca crítica, Research de Recursos Hídricos 7, pp 5262. CrossRef Ballerini, R. e Boes, DC (1985) Hurst comportamento do processo de mudança de nível, Water Resources Research 12, 11, pp 16421648. CrossRef Boes, DC e Salas, JD (1978) Nonstationaridade da média e do fenômeno Hurst, Water Resources Research 14, 1, pp 135143. CrossRef Box, GEP E Cox, D. R. (1964) Uma análise de transformações, Journal of the Royal Statistical Society, Série B 26, pp 211252. Box, G. E.P. E Jenkins, G. M. (1976) Time Series Analysis: Forecasting and Control, Segunda Edição, Holden-Day, San Francisco. Feller, W. (1951) A distribuição assintótica do intervalo de somas de variáveis aleatórias independentes, Annals of Mathematical Statistics 22, pp. 427432. CrossRef Fisher, R. A. (1970) Métodos estatísticos para pesquisadores, Oliver e Boyd, Edinburg, Reino Unido. Gnedenko, B. V. (1968) Teoria da Probabilidade, Chelsea, Nova Iorque. Granger, C. W.J. E Joyeux, R. (1980) Uma introdução a modelos de séries temporais de memória longa e diferenciação fraccionada, Journal of Time Series Analysis 1, pp 1529. CrossRef Hall, W. A. Askew, A. J. E Yeh, W. W.G. (1969) Utilização do período crítico na análise de reservatórios, Research de Recursos Hídricos 5, 6, pp 12051215. CrossRef Hipel, K. W. (1975) Caixa-Jenkins contemporâneo que modela em recursos hídricos, Ph. D. Tese, Universidade de Waterloo, Waterloo, Ontário. Hipel, K. W. E McLeod, A. I. (1978a) Preservação da gama ajustada ajustada, 2, estudos de simulação utilizando modelos Box-Jenkins, Water Resources Research 14, 3, pp 509516. CrossRef Hipel, K. W. E McLeod, A. I. (1978b) Preservação da gama ajustada ajustada, 3, algoritmos fracionários de ruído gaussiano, Water Resources Research 14, 3, pp 517518. CrossRef Hipel, K. W. E McLeod, A. I. (1993) Time Series Modelagem de Recursos Hídricos e Sistemas Ambientais, Elsevier, Amsterdam. Hipel, K. W. McBean, E. A. E McLeod, A. I. (1979) Selecção de modelos de geração hidrológica, Jornal da Divisão de Planeamento e Gestão de Recursos Hídricos, ASCE 105, WR2, pp 223242. Hosking, J. R.M. (1981) Differencing fraccional, Biometrika 68, pp 165176 CrossRef Hosking, J. R.M. (1984) Modelando a persistência em séries temporais hidrológicas utilizando diferenças fracionárias, Water Resources Research 20, 12, pp 18981908. CrossRef Hurst, H. E. (1951) Capacidade de armazenamento a longo prazo de reservatórios, Transactions of American Society of Civil Engineers 116, pp 770808. Hurst, H. E. (1956) Métodos de utilização de armazenamento a longo prazo em reservatórios, Processos do Instituto de Engenheiros Civis 1, pp 519543. CrossRef Jimenez, C. McLeod, A. I. E Hipel, K. W. (1989) Estimativa do filtro de Kalman para modelos periódicos de média movimentação autorregressiva, Hidrologia Estocástica e Hidráulica 3, 3, pp 229242. CrossRef Klemes, V. (1974) O fenômeno de Hurst: um enigma, Water Resources Research 10, 4, pp 675688. CrossRef Li, WK E McLeod, A. I. (1986) Fractional time series modeling, Biometrika 73, 1, pp 217221. CrossRef Mandelbrot, BB e Wallis, JR (1968) Noah, Joseph e hidrologia operacional, Pesquisa de Recursos Hídricos, 5,5, pp 909918. CrossRef Mandelbrot, BB e Wallis, JR (1969) Experimentos computacionais com ruídos gaussianos fracionários, Partes 1 a 3, Water Resources Research 5, pp 228267. CrossRef McLeod, AI (1975) Derivação da função de autocovariância teórica de séries temporais médias auto-regressivas em movimento, Journal of the Royal Statistical Society, Série C (Applied Statistics) 24, 2, pp 255256. McLeod, A. I. E Hipel, K. W. (1978a) Preservação da escala ajustada rwaled, 1, uma reavaliação do fenômeno de Hurst, Water Resources Research 14, 3, pp 491508. CrossRef McLeod, A. I. E Hipel, K. W. (1978b) Procedimentos de simulação para modelos Box-Jenkins, Water Resources Research 14, 5, pp. 969975. CrossRef McLeod, A. I. Noakes, D. J. Hipel, K. W. E Thompstone, R. M. (1987) Combinando previsões hidrológicas, Jornal da Divisão de Planejamento e Gestão de Recursos Hídricos, ASCE, 113, 1, pp 2941. CrossRef Moss, M. E. e Bryson, M. C. (1974) Estrutura de autocorrelação de fluxos mensais, Water Resources Research 10, pp 737744. CrossRef Noakes, D. J. McLeod, A. I. E Hipel, K. W. (1985) Forecasting mensal flowflow série temporal, International Journal of Forecasting 1, pp 179190. CrossRef Noakes, D. J. Hipel, K. W. McLeod, A. I. Jimenez, J. e Yakowitz, S. (1988) Previsão de séries temporais geofísicas anuais, International Journal of Forecasting 4, pp 103115. CrossRef Pitman, E. J.G. (1939) Uma nota sobre a correlação normal, Biometrika 31, pp 912. Ralston, A. (1965) Um Primeiro Curso em Análise Numérica, McGraw-Hill, Nova Iorque. Rao, C. R. (1973) Inferência estatística linear e suas aplicações, segunda edição, John Wiley, Nova Iorque. CrossRef Salas, J. D. e Boes, D. C. (1980) Shifting level modeling of hydrologic series, Advances in Water Resources 3, pp. 5963. CrossRef Salas, J. D. Boes, D. C. Yevjevich, V. e Pegram, G. G.S. (1979) fenômeno de Hurst como um comportamento pré-assintótico, Journal of Hydrology 44, pp 115. CrossRef Salas, J. D. Delleur, J. W. Yevjevich, V. e Lane, W. L. (1980) Modelagem aplicada de séries hidrológicas, publicações de recursos hídricos, Littleton, Colorado. Thompstone, R. M. Hipel, K. W. E McLeod, A. I. (1983) Modelagem da função de transferência-ruído para a previsão do influxo da potência, INFOR 21, PP 258269 Thompstone, R. M. Hipel, K. W. E McLeod, A. I. (1985) Forecasting quarter-monthly riverflows, Water Resources Bulletin 21, 5, págs. 731741. CrossRef Thompstone, R. M. Hipel, K. W. E McLeod, A. I. (1987) Simulação de séries temporais hidrológicas mensais, em I. B. MacNeill and G. J. Umphrey (eds), A. I. McLeod (assoc. ed.), Avanços em Ciências Estatísticas, Festschrift em honra do Professor V. M. Aniversário de Joshis 70th, Vol. IV, Stochastic Hydrology, D. Reidel Publishing Co. Dordrecht, Holanda, pp 5771. Vogel, R. M. E Stedinger, JR (1988) O valor de modelos de fluxo estocástico em aplicações de design de reservatórios de mais de um ano, Water Resources Research 24, 9, pp 14831490. CrossRef Wilcoxon, F. (1945) Comparações individuais por métodos de classificação, Biometrics 1, pp 8083 CrossRef Yakowitz, SJ (1985a) Estimulação não paramétrica da densidade e predição para sequências de Markov, Journal of American American Statistical Association 80, pp 215221. CrossRef Yakowitz, S. J. (1985b) Modelos de fluxo Markov e problema de aviso de inundação, Water Resources Research 21, pp 8188. Gerador Média Movente CrossRefAutoregressive O processo de média móvel autorregressiva (ARMA) é um processo aleatório de tempo discreto e contínuo. Este gerador escolhe aleatoriamente os parâmetros do modelo a partir do intervalo que você pode definir a condição para (fraco) stationarity. Parte da saída inclui a função de autocorrelação (ACF), a função de autocorrelação parcial (PACF) e suas amostras (SACF, SPACF), que servem como uma ferramenta básica para a identificação do modelo na abordagem de Box8211Jenkins procurando o chamado corte. Autregressive Moving-Average Simulation (Primeira Ordem) A Demonstração é definida de tal forma que a mesma série aleatória de pontos é usada não importa como as constantes e são variadas. No entanto, quando o botão quotrandomizequot é pressionado, uma nova série aleatória será gerada e usada. Manter a série aleatória idêntica permite ao usuário ver exatamente os efeitos na série ARMA de mudanças nas duas constantes. A constante é limitada a (-1,1) porque a divergência da série ARMA resulta quando. A Demonstração destina-se apenas a um processo de primeira ordem. Os termos AR adicionais permitiriam a geração de séries mais complexas, enquanto que os termos MA adicionais aumentariam o alisamento. Para uma descrição detalhada dos processos ARMA, ver, por exemplo, G. Box, G. M. Jenkins e G. Reinsel, Análise de séries temporais: Previsão e Controlo. 3a ed. Englewood Cliffs, NJ: Prentice-Hall, 1994. LINKS RELACIONADOS
Comments
Post a Comment