Série de tempo irregular da média móvel exponencial


Modelos de suavização média e exponencial em movimento Como um primeiro passo para se deslocar além dos modelos médios, modelos de caminhada aleatórios e modelos de tendência linear, padrões e tendências não-sazonais podem ser extrapolados usando um modelo de média móvel ou suavização. O pressuposto básico por trás da média e dos modelos de suavização é que as séries temporais são localmente estacionárias com uma média que varia lentamente. Por isso, tomamos uma média móvel (local) para estimar o valor atual da média e, em seguida, use isso como a previsão para um futuro próximo. Isso pode ser considerado como um compromisso entre o modelo médio e o modelo random-walk-without-drift. A mesma estratégia pode ser usada para estimar e extrapolar uma tendência local. Uma média móvel geralmente é chamada de uma versão quotsmoothedquot da série original porque a média a curto prazo tem o efeito de suavizar os solavancos na série original. Ao ajustar o grau de alisamento (a largura da média móvel), podemos esperar encontrar algum tipo de equilíbrio ideal entre o desempenho dos modelos de caminhada aleatória e média. O tipo mais simples de modelo de média é o. Média Móvel simples (igualmente ponderada): A previsão para o valor de Y no tempo t1 que é feita no tempo t é igual à média simples das observações m mais recentes: (Aqui e em outro lugar usarei o símbolo 8220Y-hat8221 para repousar Para uma previsão das séries temporais Y feitas o mais cedo possível por um determinado modelo.) Esta média é centrada no período t (m1) 2, o que implica que a estimativa da média local tende a ficar para trás do verdadeiro Valor da média local em cerca de (m1) 2 períodos. Assim, dizemos que a idade média dos dados na média móvel simples é (m1) 2 em relação ao período para o qual a previsão é calculada: esta é a quantidade de tempo pelo qual as previsões tenderão a atrasar os pontos de viragem nos dados . Por exemplo, se você estiver calculando a média dos últimos 5 valores, as previsões serão cerca de 3 períodos atrasados ​​na resposta a pontos de viragem. Observe que se m1, o modelo de média móvel simples (SMA) é equivalente ao modelo de caminhada aleatória (sem crescimento). Se m for muito grande (comparável ao comprimento do período de estimativa), o modelo SMA é equivalente ao modelo médio. Tal como acontece com qualquer parâmetro de um modelo de previsão, é costume ajustar o valor de k para obter o melhor quotfitquot para os dados, ou seja, os menores erros de previsão em média. Aqui é um exemplo de uma série que parece exibir flutuações aleatórias em torno de uma média que varia lentamente. Primeiro, vamos tentar ajustá-lo com um modelo de caminhada aleatória, o que equivale a uma média móvel simples de 1 termo: o modelo de caminhada aleatória responde muito rapidamente às mudanças na série, mas ao fazê-lo, elege muito da quotnoisequot no Dados (as flutuações aleatórias), bem como o quotsignalquot (a média local). Se, em vez disso, tentemos uma média móvel simples de 5 termos, obtemos um conjunto de previsões mais lisas: a média móvel simples de 5 meses produz erros significativamente menores do que o modelo de caminhada aleatória neste caso. A idade média dos dados nesta previsão é de 3 ((51) 2), de modo que tende a atrasar os pontos de viragem em cerca de três períodos. (Por exemplo, uma desaceleração parece ter ocorrido no período 21, mas as previsões não se desviam até vários períodos depois). Observe que as previsões de longo prazo do modelo SMA são uma linha reta horizontal, assim como na caminhada aleatória modelo. Assim, o modelo SMA assume que não há tendência nos dados. No entanto, enquanto as previsões do modelo de caminhada aleatória são simplesmente iguais ao último valor observado, as previsões do modelo SMA são iguais a uma média ponderada de valores recentes. Os limites de confiança calculados pela Statgraphics para as previsões de longo prazo da média móvel simples não se ampliam à medida que o horizonte de previsão aumenta. Isso obviamente não está correto. Infelizmente, não existe uma teoria estatística subjacente que nos diga como os intervalos de confiança devem se ampliar para esse modelo. No entanto, não é muito difícil calcular estimativas empíricas dos limites de confiança para as previsões do horizonte mais longo. Por exemplo, você poderia configurar uma planilha em que o modelo SMA seria usado para prever 2 passos à frente, 3 passos à frente, etc., dentro da amostra de dados históricos. Você poderia então calcular os desvios padrão da amostra dos erros em cada horizonte de previsão e, em seguida, construir intervalos de confiança para previsões de longo prazo, adicionando e subtraindo múltiplos do desvio padrão apropriado. Se tentarmos uma média móvel simples de 9 termos, obtemos previsões ainda mais suaves e mais de um efeito de atraso: a idade média é agora de 5 períodos (91) 2). Se tomarmos uma média móvel de 19 termos, a média de idade aumenta para 10: Observe que, de fato, as previsões estão atrasadas em torno de 10 pontos. Qual quantidade de suavização é melhor para esta série. Aqui está uma tabela que compara suas estatísticas de erro, incluindo também uma média de 3 termos: Modelo C, a média móvel de 5 termos, produz o menor valor de RMSE por uma pequena margem ao longo dos 3 Médias temporais e de 9 termos, e suas outras estatísticas são quase idênticas. Assim, entre os modelos com estatísticas de erro muito semelhantes, podemos escolher se preferimos um pouco mais de capacidade de resposta ou um pouco mais de suavidade nas previsões. (Retornar ao topo da página.) Browns Suavização exponencial simples (média móvel ponderada exponencialmente) O modelo de média móvel simples descrito acima tem a propriedade indesejável de que trata as últimas observações k de forma igualitária e ignora completamente todas as observações precedentes. Intuitivamente, os dados passados ​​devem ser descontados de forma mais gradual - por exemplo, a observação mais recente deve ter um pouco mais de peso que o segundo mais recente, e o segundo mais recente deve ter um pouco mais de peso do que o terceiro mais recente, e em breve. O modelo de suavização exponencial simples (SES) realiza isso. Deixe 945 indicar uma constante de quotesmoothing (um número entre 0 e 1). Uma maneira de escrever o modelo é definir uma série L que represente o nível atual (isto é, o valor médio local) da série como estimado a partir de dados até o presente. O valor de L no tempo t é calculado de forma recursiva a partir de seu próprio valor anterior como este: Assim, o valor suavizado atual é uma interpolação entre o valor suavizado anterior e a observação atual, onde 945 controla a proximidade do valor interpolado para o mais recente observação. A previsão para o próximo período é simplesmente o valor suavizado atual: Equivalentemente, podemos expressar a próxima previsão diretamente em termos de previsões anteriores e observações anteriores, em qualquer uma das seguintes versões equivalentes. Na primeira versão, a previsão é uma interpolação entre previsão anterior e observação anterior: na segunda versão, a próxima previsão é obtida ajustando a previsão anterior na direção do erro anterior em uma quantidade fracionada de 945. É o erro cometido em Tempo t. Na terceira versão, a previsão é uma média móvel ponderada exponencialmente (com desconto) com o fator de desconto 1- 945: a versão de interpolação da fórmula de previsão é a mais simples de usar se você estiver implementando o modelo em uma planilha: ela se encaixa em uma Célula única e contém referências de células que apontam para a previsão anterior, a observação anterior e a célula onde o valor de 945 é armazenado. Note-se que se 945 1, o modelo SES é equivalente a um modelo de caminhada aleatória (sem crescimento). Se 945 0, o modelo SES é equivalente ao modelo médio, supondo que o primeiro valor suavizado seja igual à média. (Voltar ao topo da página.) A idade média dos dados na previsão de suavização simples-exponencial é 1 945 em relação ao período para o qual a previsão é calculada. (Isso não deve ser óbvio, mas pode ser facilmente demonstrado pela avaliação de uma série infinita.) Portanto, a previsão média móvel simples tende a atrasar os pontos de viragem em cerca de 1 945 períodos. Por exemplo, quando 945 0.5 o atraso é de 2 períodos quando 945 0.2 o atraso é de 5 períodos quando 945 0.1 o atraso é de 10 períodos e assim por diante. Para uma média de idade dada (ou seja, a quantidade de lag), a previsão de suavização exponencial simples (SES) é um pouco superior à previsão da média móvel simples (SMA) porque coloca um peso relativamente maior na observação mais recente - isto é. É um pouco mais quotresponsivech para as mudanças ocorridas no passado recente. Por exemplo, um modelo SMA com 9 termos e um modelo SES com 945 0,2 ambos têm uma idade média de 5 para os dados em suas previsões, mas o modelo SES coloca mais peso nos últimos 3 valores do que o modelo SMA e no Ao mesmo tempo, não possui 8220forget8221 sobre valores com mais de 9 períodos de tempo, como mostrado neste gráfico: Outra vantagem importante do modelo SES sobre o modelo SMA é que o modelo SES usa um parâmetro de suavização que é continuamente variável, portanto, pode otimizar facilmente Usando um algoritmo quotsolverquot para minimizar o erro quadrático médio. O valor ideal de 945 no modelo SES para esta série é 0.2961, como mostrado aqui: A idade média dos dados nesta previsão é 10.2961 3,4 períodos, o que é semelhante ao de uma média móvel simples de 6 termos. As previsões de longo prazo do modelo SES são uma linha direta horizontal. Como no modelo SMA e no modelo de caminhada aleatória sem crescimento. No entanto, note que os intervalos de confiança computados por Statgraphics agora divergem de forma razoável e que eles são substancialmente mais estreitos do que os intervalos de confiança para o modelo de caminhada aleatória. O modelo SES assume que a série é um pouco mais previsível do que o modelo de caminhada aleatória. Um modelo SES é realmente um caso especial de um modelo ARIMA. Então a teoria estatística dos modelos ARIMA fornece uma base sólida para o cálculo de intervalos de confiança para o modelo SES. Em particular, um modelo SES é um modelo ARIMA com uma diferença não-sazonal, um termo MA (1) e nenhum termo constante. Também conhecido como um modelo quotARIMA (0,1,1) sem constantequot. O coeficiente MA (1) no modelo ARIMA corresponde à quantidade 1- 945 no modelo SES. Por exemplo, se você ajustar um modelo ARIMA (0,1,1) sem constante para a série analisada aqui, o coeficiente MA (1) estimado é 0.7029, o que é quase exatamente um menos 0.2961. É possível adicionar a hipótese de uma tendência linear constante não-zero ao modelo SES. Para fazer isso, basta especificar um modelo ARIMA com uma diferença não-sazonal e um termo MA (1) com uma constante, ou seja, um modelo ARIMA (0,1,1) com constante. As previsões a longo prazo terão uma tendência que é igual à tendência média observada durante todo o período de estimação. Você não pode fazer isso em conjunto com o ajuste sazonal, porque as opções de ajuste sazonal são desativadas quando o tipo de modelo é definido como ARIMA. No entanto, você pode adicionar uma tendência exponencial constante a longo prazo a um modelo de suavização exponencial simples (com ou sem ajuste sazonal) usando a opção de ajuste de inflação no procedimento de Previsão. A taxa de quotinflação adequada (taxa de crescimento) por período pode ser estimada como o coeficiente de inclinação em um modelo de tendência linear ajustado aos dados em conjunto com uma transformação de logaritmo natural, ou pode ser baseado em outras informações independentes sobre perspectivas de crescimento a longo prazo . (Voltar ao topo da página.) Browns Linear (ou seja, duplo) Suavização exponencial Os modelos SMA e os modelos SES assumem que não há nenhuma tendência de nenhum tipo nos dados (o que normalmente é OK ou pelo menos não muito ruim para 1- Previsões passo a passo quando os dados são relativamente barulhentos) e podem ser modificados para incorporar uma tendência linear constante como mostrado acima. E quanto a tendências de curto prazo Se uma série exibir uma taxa de crescimento variável ou um padrão cíclico que se destaca claramente contra o ruído e, se houver necessidade de prever mais de 1 período à frente, a estimativa de uma tendência local também pode ser um problema. O modelo de alisamento exponencial simples pode ser generalizado para obter um modelo de alisamento exponencial linear (LES) que calcula estimativas locais de nível e tendência. O modelo de tendência mais simples do tempo é o modelo de suavização exponencial linear Browns, que usa duas séries suavizadas diferentes centradas em diferentes pontos no tempo. A fórmula de previsão é baseada em uma extrapolação de uma linha através dos dois centros. (Uma versão mais sofisticada deste modelo, Holt8217s, é discutida abaixo.) A forma algébrica do modelo de alisamento exponencial linear Brown8217s, como a do modelo de suavização exponencial simples, pode ser expressa em várias formas diferentes, mas equivalentes. A forma quotstandardquot deste modelo geralmente é expressa da seguinte maneira: Seja S denotar a série de suavização individual obtida pela aplicação de suavização exponencial simples para a série Y. Ou seja, o valor de S no período t é dado por: (Lembre-se que, sob simples Suavização exponencial, esta seria a previsão de Y no período t1.) Então, deixe Squot indicar a série duplamente suavizada obtida aplicando o alisamento exponencial simples (usando o mesmo 945) para a série S: Finalmente, a previsão para Y tk. Para qualquer kgt1, é dada por: Isto produz e 1 0 (isto é, traga um pouco e deixe a primeira previsão igual a primeira observação real) e e 2 Y 2 8211 Y 1. Após o que as previsões são geradas usando a equação acima. Isso produz os mesmos valores ajustados que a fórmula com base em S e S, se estes últimos foram iniciados usando S 1 S 1 Y 1. Esta versão do modelo é usada na próxima página que ilustra uma combinação de suavização exponencial com ajuste sazonal. Holt8217s Linear Exponential Suavizante Brown8217s modelo LES calcula estimativas locais de nível e tendência ao suavizar os dados recentes, mas o fato de que ele faz com um único parâmetro de suavização coloca uma restrição nos padrões de dados que ele pode caber: o nível e a tendência Não podem variar a taxas independentes. O modelo LES de Holt8217s aborda esse problema ao incluir duas constantes de suavização, uma para o nível e outra para a tendência. A qualquer momento t, como no modelo Brown8217s, existe uma estimativa L t do nível local e uma estimativa T t da tendência local. Aqui, eles são computados de forma recursiva a partir do valor de Y observado no tempo t e as estimativas anteriores do nível e tendência por duas equações que aplicam o alisamento exponencial separadamente. Se o nível estimado e a tendência no tempo t-1 são L t82091 e T t-1. Respectivamente, então a previsão de Y tshy que teria sido feita no tempo t-1 é igual a L t-1 T t-1. Quando o valor real é observado, a estimativa atualizada do nível é calculada de forma recursiva interpolando entre Y tshy e sua previsão, L t-1 T t-1, usando pesos de 945 e 1- 945. A alteração no nível estimado, Lt 8209 L t82091. Pode ser interpretado como uma medida ruim da tendência no tempo t. A estimativa atualizada da tendência é então calculada de forma recursiva interpolando entre L t 8209 L t82091 e a estimativa anterior da tendência, T t-1. Usando pesos de 946 e 1-946: a interpretação da constante de simulação de tendência 946 é análoga à da constante de alívio de nível 945. Modelos com valores pequenos de 946 assumem que a tendência muda muito lentamente ao longo do tempo, enquanto modelos com 946 maiores assumem que está mudando mais rapidamente. Um modelo com um grande 946 acredita que o futuro distante é muito incerto, porque os erros na estimativa de tendência se tornam bastante importantes ao prever mais de um período à frente. (Voltar ao topo da página.) As constantes de suavização 945 e 946 podem ser estimadas da maneira usual, minimizando o erro quadrático médio das previsões de 1 passo à frente. Quando isso é feito em Statgraphics, as estimativas revelam-se 945 0,3048 e 946 0,008. O valor muito pequeno de 946 significa que o modelo assume mudanças muito pequenas na tendência de um período para o outro, então, basicamente, esse modelo está tentando estimar uma tendência de longo prazo. Por analogia com a noção de idade média dos dados utilizados na estimativa do nível local da série, a idade média dos dados utilizados na estimativa da tendência local é proporcional a 1 946, embora não exatamente igual a ela. . Neste caso, isso é 10.006 125. Este não é um número muito preciso na medida em que a precisão da estimativa de 946 não é realmente 3 casas decimais, mas é da mesma ordem geral de grandeza que o tamanho da amostra de 100, então Este modelo está com uma média de bastante história na estimativa da tendência. O gráfico de previsão abaixo mostra que o modelo de LES estima uma tendência local um pouco maior no final da série do que a tendência constante estimada no modelo SEStrend. Além disso, o valor estimado de 945 é quase idêntico ao obtido pela montagem do modelo SES com ou sem tendência, então este é quase o mesmo modelo. Agora, isso parece previsões razoáveis ​​para um modelo que deveria estimar uma tendência local Se você 8220eyeball8221 este gráfico, parece que a tendência local virou para baixo no final da série O que aconteceu Os parâmetros deste modelo Foi estimado pela minimização do erro quadrado das previsões de 1 passo à frente, não de previsões a mais longo prazo, caso em que a tendência não faz muita diferença. Se tudo o que você está procurando é erros de 1 passo a passo, você não está vendo a imagem maior das tendências em relação a (digamos) 10 ou 20 períodos. Para obter este modelo mais em sintonia com a extrapolação dos dados no olho, podemos ajustar manualmente a constante de alívio da tendência, de modo que ele use uma linha de base mais curta para a estimativa de tendência. Por exemplo, se optar por definir 946 0,1, a idade média dos dados utilizados na estimativa da tendência local é de 10 períodos, o que significa que estamos em média a tendência nos últimos 20 períodos ou mais. Aqui é o que parece o gráfico de previsão se definimos 946 0,1 enquanto mantemos 945 0,3. Isso parece intuitivamente razoável para esta série, embora seja provavelmente perigoso extrapolar esta tendência mais de 10 períodos no futuro. E as estatísticas de erro Aqui está uma comparação de modelo para os dois modelos mostrados acima, bem como três modelos SES. O valor ideal de 945 para o modelo SES é de aproximadamente 0,3, mas resultados semelhantes (com um pouco mais ou menos capacidade de resposta, respectivamente) são obtidos com 0,5 e 0,2. (A) Holts linear exp. Alisamento com alpha 0.3048 e beta 0.008 (B) Holts linear exp. Alisamento com alfa 0.3 e beta 0.1 (C) Suavização exponencial simples com alfa 0.5 (D) Suavização exponencial simples com alfa 0.3 (E) Suavização exponencial simples com alfa 0.2 Suas estatísticas são quase idênticas, então realmente podemos usar a escolha com base De erros de previsão de 1 passo à frente na amostra de dados. Temos de voltar atrás em outras considerações. Se acreditamos firmemente que faz sentido basear a estimativa da tendência atual sobre o que aconteceu nos últimos 20 períodos, podemos fazer um caso para o modelo LES com 945 0,3 e 946 0,1. Se quisermos ser agnósticos sobre se existe uma tendência local, então um dos modelos SES pode ser mais fácil de explicar e também daria mais previsões do meio da estrada para os próximos 5 ou 10 períodos. (Retornar ao topo da página.) Qual tipo de tendência-extrapolação é melhor: horizontal ou linear Evidências empíricas sugerem que, se os dados já foram ajustados (se necessário) para inflação, então pode ser imprudente extrapolar linear de curto prazo Tendências muito distantes no futuro. As tendências evidentes hoje podem diminuir no futuro devido a causas variadas, como obsolescência do produto, aumento da concorrência e recessões cíclicas ou aumentos em uma indústria. Por este motivo, o alisamento exponencial simples geralmente apresenta melhor fora da amostra do que seria de esperar, apesar da sua extrapolação de tendência horizontal de quotnaivequot. As modificações de tendências amortecidas do modelo de alisamento exponencial linear também são freqüentemente usadas na prática para introduzir uma nota de conservadorismo em suas projeções de tendência. O modelo LES da modificação amortecida pode ser implementado como um caso especial de um modelo ARIMA, em particular, um modelo ARIMA (1,1,2). É possível calcular intervalos de confiança em torno de previsões de longo prazo produzidas por modelos exponenciais de suavização, considerando-os como casos especiais de modelos ARIMA. (Beware: nem todo o software calcula os intervalos de confiança para esses modelos corretamente.) A largura dos intervalos de confiança depende de (i) o erro RMS do modelo, (ii) o tipo de alisamento (simples ou linear) (iii) o valor (S) da (s) constante (s) de suavização e (iv) o número de períodos adiante que você está prevendo. Em geral, os intervalos se espalham mais rápido, à medida que 945 se ampliam no modelo SES e se espalham muito mais rápido quando o alisamento linear, em vez do simples, é usado. Este tópico é discutido mais adiante na seção de modelos ARIMA das notas. (Retornar ao topo da página.) 5.2 Smoothing Time Series Smoothing geralmente é feito para nos ajudar a melhorar padrões, tendências, por exemplo, em séries temporais. Geralmente suavizar a irregularidade irregular para ver um sinal mais claro. Para dados sazonais, podemos suavizar a sazonalidade para que possamos identificar a tendência. O Smoothing não nos fornece um modelo, mas pode ser um bom primeiro passo na descrição de vários componentes da série. O termo filtro às vezes é usado para descrever um procedimento de suavização. Por exemplo, se o valor suavizado para um determinado horário for calculado como uma combinação linear de observações para os tempos circundantes, pode-se dizer que aplicamos um filtro linear aos dados (não o mesmo que dizer que o resultado é uma linha reta, por o caminho). O uso tradicional do termo média móvel é que, em cada ponto do tempo, determinamos médias (possivelmente ponderadas) dos valores observados que circundam um determinado momento. Por exemplo, no tempo t. Uma média móvel centrada de comprimento 3 com pesos iguais seria a média de valores às vezes t -1. T. E t1. Para tirar a sazonalidade de uma série, para que possamos melhor ver a tendência, usaríamos uma média móvel com um período de duração sazonal. Assim, na série suavizada, cada valor suavizado foi calculado em média em todas as estações. Isso pode ser feito observando uma média móvel unilateral em que você mede todos os valores para os anos anteriores de dados ou uma média móvel centrada em que você usa valores antes e depois da hora atual. Para dados trimestrais, por exemplo, podemos definir um valor suavizado para o tempo t como (x t x t-1 x t-2 x t-3) 4, a média deste tempo e os 3 trimestres anteriores. No código R, este será um filtro unilateral. Uma média móvel centrada cria um pouco de dificuldade quando temos um número par de períodos de tempo no período sazonal (como costumamos fazer). Para suavizar a sazonalidade em dados trimestrais. Para identificar a tendência, a convenção usual é usar a média móvel alisada no tempo t é Suavizar a sazonalidade nos dados mensais. A fim de identificar a tendência, a convenção usual é usar a média móvel suavizada no tempo t é. Isto é, aplicamos o peso 124 aos valores nos tempos t6 e t6 e peso 112 a todos os valores em todos os momentos entre t5 e t5. No comando R filter, bem, especifique um filtro de frente e verso quando quisermos usar valores que venham antes e depois do tempo para o qual foram suavizados. Observe que na página 71 do nosso livro, os autores aplicam pesos iguais em uma média móvel sazonal centrada. Isso também está bem. Por exemplo, um suavizado trimestral pode ser alisado no tempo t é frac x frac x frac xt frac x frac x Um mensageiro mensal pode aplicar um peso de 113 a todos os valores desde os tempos t-6 até t6. O código que os autores usam na página 72 aproveita o comando rep que repete um valor um certo número de vezes. Eles não usam o parâmetro de filtro dentro do comando de filtro. Exemplo 1 Produção Trimestral de Cerveja na Austrália Tanto na Lição 1 quanto na Lição 4, analisamos uma série de produção trimestral de cerveja na Austrália. O código R que se segue cria uma série suavizada que nos permite ver o padrão de tendência e traça esse padrão de tendência no mesmo gráfico que as séries temporais. O segundo comando cria e armazena a série suavizada no objeto chamado trendpattern. Observe que, dentro do comando do filtro, o parâmetro chamado filtro fornece os coeficientes para o alisamento e os lados 2 fazem com que um cálculo centrado seja calculado. Beerprod scan (beerprod. dat) trendpattern filter (beerprod, filtro c (18, 14, 14, 14, 18), sides2) trama (beerprod, tipo b, principal tendência média móvel) linhas (trendpattern) Heres o resultado: Nós Pode subtrair o padrão de tendência dos valores dos dados para obter uma melhor visão da sazonalidade. Heres como isso seria feito: Seasonals beerprod - traço trendpattern (seasonals, tipo b, padrão sazonal principal para a produção de cerveja) O resultado segue: Outra possibilidade para a série de suavização ver tendência é o filtro one-sided filterpattern2 filter (beerprod, filtro c (14, 14, 14, 14), lados1) Com isso, o valor suavizado é a média do ano passado. Exemplo 2. Desemprego mensal dos EUA No trabalho de casa para a semana 4, você analisou uma série mensal de desemprego americano de 1948 a 1978. Heres um alisamento feito para olhar a tendência. (Time de tendência, mainTrend no desemprego dos EUA, 1948-1978, ano de xlab) Somente a tendência suavizada é plotada. (Figura 2.1). O segundo comando identifica as características do tempo do calendário da série. Isso faz com que o enredo tenha um eixo mais significativo. A trama segue. Para as séries não sazonais, você não deve suavizar qualquer extensão específica. Para alisar, você deve experimentar as médias móveis de diferentes intervalos. Esses períodos de tempo poderiam ser relativamente curtos. O objetivo é eliminar as bordas difíceis para ver qual tendência ou padrão podem estar lá. Outros métodos de suavização (Seção 2.4) A Seção 2.4 descreve várias alternativas sofisticadas e úteis para o alisamento médio móvel. Os detalhes podem parecer incompletos, mas isso é bom porque não queremos ficar atolados em muitos detalhes para esses métodos. Dos métodos alternativos descritos na Seção 2.4, lowess (regressão ponderada localmente) pode ser o mais utilizado. Exemplo 2 Continuação O traçado seguinte é linha de tendência suavizada para a série de desemprego dos EUA, encontrada usando um método mais suave, em que uma quantidade substancial (23) contribuiu para cada estimativa suavizada. Observe que isso suavizou a série de forma mais agressiva do que a média móvel. Os comandos utilizados foram desempregados (desemprego, começo c (1948,1), freq12) trama (lowess (desempregado, f 23), alavanca Lowess principal da tendência de desemprego dos EUA) Suavização exponencial simples A equação de previsão básica para o alisamento exponencial único é muitas vezes Dado como hat alpha xt (1-alpha) hat t text Previstamos o valor de x no tempo t1 para ser uma combinação ponderada do valor observado no tempo t e o valor previsto no tempo t. Embora o método seja chamado de método de suavização, é usado principalmente para previsões de curto prazo. O valor de é chamado de constante de suavização. Por qualquer motivo, 0.2 é uma escolha padrão popular de programas. Isso coloca um peso de .2 na observação mais recente e um peso de 1 .2 .8 na previsão mais recente. Com um valor relativamente pequeno, o alisamento será relativamente mais extenso. Com um valor relativamente grande, o alisamento é relativamente menos extenso à medida que mais peso será colocado no valor observado. Este é um método simples de previsão de um passo para a frente que, a primeira vista, parece não exigir um modelo para os dados. De fato, esse método é equivalente ao uso de um modelo ARIMA (0,1,1) sem constante. O procedimento ideal é ajustar um modelo ARIMA (0,1,1) ao conjunto de dados observado e usar os resultados para determinar o valor de. Isso é ideal no sentido de criar o melhor para os dados já observados. Embora o objetivo seja o alisamento e a previsão um passo a frente, a equivalência ao modelo ARIMA (0,1,1) traz um bom ponto. Não devemos aplicar cegamente alisamento exponencial porque o processo subjacente pode não ser bem modelado por um ARIMA (0,1,1). ARIMA (0,1,1) e Equivalência de Suavização Exponencial Considere um ARIMA (0,1,1) com média 0 para as primeiras diferenças, xt - x t-1: start hat amp amp xt theta1 wt amp amp xt theta1 (xt - hat t) amp amp (1 theta1) xt - theta1hat tende. Se deixarmos (1 1) e assim - (1) 1, vemos a equivalência com a equação (1) acima. Por que o Método é Chamado Suavização Exponencial Isso produz o seguinte: begin hat amp amp alpha phxt (1-alpha) alfa x (1-alfa) som amplificador amp alpha xt alfa (1-alfa) x (1-alfa) 2hat fim Continuar Desta forma, substituindo sucessivamente o valor previsto no lado direito da equação. Isso leva a: hat alpha alfa (1-alpha) x alfa (1-alfa) 2 x pontos alfa (1-alfa) jx pontos alfa (1-alfa) x1 texto A equação 2 mostra que o valor previsto é uma média ponderada De todos os valores passados ​​da série, com pesos exponencialmente alternativos à medida que avançamos na série. Suavização exponencial otimizada em R Basicamente, apenas nos ajustamos a ARIMA (0,1,1) aos dados e determinamos o coeficiente. Podemos examinar o ajuste do liso, comparando os valores previstos com a série real. O suavizado exponencial tende a ser usado mais como uma ferramenta de previsão do que um verdadeiro mais suave, por isso estava olhando para ver se nós temos um bom ajuste. Exemplo 3. N 100 observações mensais do logaritmo de um índice de preços do petróleo nos Estados Unidos. A série de dados é: Um ajuste ARIMA (0,1,1) em R deu um coeficiente MA (1) 0,3877. Assim (1 1) 1.3877 e 1- -0.3877. A equação de previsão de suavização exponencial é hat 1.3877xt - 0.3877hat t No momento 100, o valor observado da série é x 100 0.86601. O valor previsto para a série naquele momento é Assim, a previsão para o tempo 101 é 1.3877x - 0.3877hat 1.3877 (0.86601) -0.3877 (0.856789) 0.8696 A seguir, o quão bem é mais adequado para a série. É um bom ajuste. Isso é um bom sinal para a previsão, o objetivo principal para este mais suave. Aqui estão os comandos usados ​​para gerar a saída para este exemplo: planilha oilindex scan (oildata. dat) (oilindex, tipo b, registro principal da série de índice de óleo) expsmoothfit arima (oilindex, order c (0,1,1)) expsmoothfit Para ver os resultados de arima previstos oilindex - linhas de gráficos preditos expsmoothfitresiduais (linhas de indexação de óleo (indexação de óleo, tipo, alinhamento exponencial principal de índice de óleo) 1.3877oilindex100-0.3877predicteds100 previsão para o tempo 101 Suavização exponencial dupla Suavização exponencial dupla pode ser usada quando há Tendência (tanto a longo prazo quanto a curto prazo), mas sem sazonalidade. Essencialmente, o método cria uma previsão combinando estimativas exponencialmente suavizadas da tendência (inclinação de uma linha reta) e do nível (basicamente, a interceptação de uma linha reta). Dois pesos diferentes, ou parâmetros de suavização, são usados ​​para atualizar esses dois componentes em cada momento. O nível suavizado é mais ou menos equivalente a um simples alisamento exponencial dos valores de dados e a tendência suavizada é mais ou menos equivalente a um alisamento exponencial simples das primeiras diferenças. O procedimento é equivalente ao encaixe de um modelo ARIMA (0,2,2), sem constante pode ser realizada com um ajuste ARIMA (0,2,2). (1-B) 2 xt (1 theta1B theta2B2) wt. Médias móveis de Expansão de Navegação para Série de Tempo Irregular Na análise de séries temporais, muitas vezes há necessidade de funções de suavização que reagem rapidamente às mudanças no sinal. No aplicativo típico, você pode estar processando um sinal de entrada em tempo real e quer calcular coisas como o valor médio recente ou obter uma inclinação instantânea para isso. Mas os sinais do mundo real são frequentemente barulhentos. Algumas amostras ruidosas farão com que o valor atual do sinal, ou sua inclinação, varie amplamente. Médias móveis A função de alisamento mais simples é uma média móvel com janelas. À medida que as amostras chegam, você toma uma média dos valores N mais recentes. Isso suavizará os picos, mas apresenta um atraso de 8211 ou latência. Sua média sempre será adiada pela largura da sua média móvel. O exemplo acima é relativamente caro para calcular. Para cada amostra, você deve iterar em todo o tamanho da janela. Mas há formas mais baratas de manter a soma de todas as amostras na janela em um buffer e ajustar a soma como novas amostras entrar: Outro tipo de média móvel é a média móvel 8220weighted8221 que pesa cada posição na janela de amostra. Antes de calcular a média, multiplique cada amostra pelo peso dessa posição da janela. Tecnicamente isso é chamado de 8220convolution8221. Uma função de ponderação típica aplica uma curva de sino à janela de amostra. Isso dá um sinal que está mais ajustado ao centro da janela, e ainda é um pouco tolerante às amostras ruidosas. Na análise financeira, você costuma usar uma função de ponderação que valora mais as amostras recentes, para dar uma média móvel que acompanha mais as amostras recentes. As amostras mais antigas recebem progressivamente menos peso. Isso mitiga um pouco os efeitos da latência, embora ainda dê um alisamento razoavelmente bom. Com uma média ponderada, você sempre precisa repetir todo o tamanho da janela para cada amostra (a menos que você possa restringir os pesos permitidos a certas funções). A média móvel exponencial Outro tipo de média é a média móvel exponencial, ou EMA. Isso geralmente é usado onde a latência é crítica, como na análise financeira em tempo real. Nesta média, os pesos diminuem exponencialmente. Cada amostra é avaliada um pouco menor do que a próxima amostra mais recente. Com esta restrição, você pode calcular a média móvel de forma muito eficiente. Onde alfa é uma constante que descreve como os pesos das janelas diminuem ao longo do tempo. Por exemplo, se cada amostra fosse ponderada em 80 do valor da amostra anterior, você definiu alfa 0.2. O alfa menor torna-se maior a sua média móvel. (Por exemplo, torna-se mais suave, mas menos reactivo para novas amostras). Os pesos para uma EMA com alpha0.20 Como você pode ver, para cada nova amostra, você só precisa média com o valor da média anterior. Então, a computação é muito rápida. Em teoria, todas as amostras anteriores contribuem para a média atual, mas sua contribuição se torna exponencialmente menor ao longo do tempo. Esta é uma técnica muito poderosa, e provavelmente a melhor se você quiser obter uma média móvel que responda rapidamente a novas amostras, possui boas propriedades de suavização e é rápido para calcular. O código é trivial: EMA para Série de Tempo Irregular O EMA padrão é bom quando o sinal é amostrado em intervalos de tempo regulares. Mas e se as suas amostras vierem a intervalos irregulares Imagine um sinal contínuo que é amostrado em intervalos irregulares. Esta é a situação habitual na análise financeira. Em teoria, há uma função contínua para o valor de qualquer instrumento financeiro, mas você só pode provar esse sinal sempre que alguém realmente executa um comércio. Portanto, seu fluxo de dados consiste em um valor, além do tempo em que foi observado. Uma maneira de lidar com isso é converter o sinal irregular em um sinal regular, interpolando entre observações e resampling. Mas isso perde dados e re-introduz a latência. É possível calcular um EMA para uma série de tempo irregular diretamente: nesta função, você passa a amostra atual do seu sinal e a amostra anterior e a quantidade de tempo decorrido entre os dois eo valor anterior retornado por este função. Então, o quão bem isso funciona. Para demonstrar I8217ve gerou uma onda senoidal, então a amostra em intervalos irregulares e introduziu cerca de 20 ruídos. Esse é o sinal variará aleatoriamente - 20 do sinal seno original 8220true8221. Quão bem a média móvel exponencial irregular recupera o sinal. A linha vermelha é a onda senoidal original 8211 amostrada em intervalos irregulares. A linha azul é o sinal com o ruído adicionado. A linha azul é o único sinal que a EMA vê. A linha verde é o EMA suavizado. Você pode vê-lo recuperar o sinal muito bem. Um pouco vacilante, mas o que você pode esperar de um sinal de fonte tão ruidoso. Ele é deslocado cerca de 15 para a direita, porque a EMA apresenta alguma latência. Quanto mais suave você quiser, mais latência você verá. Mas disso, você pode, por exemplo, calcular uma inclinação instantânea para um sinal irregular ruidoso. O que você pode fazer com esse Hmm8230. Recursos:

Comments

Popular Posts