Média Móvel Centrada Em R


No pacote do zoológico, rollmean e rollapply têm argumentos que permitem inúmeras variações. Note-se que, uma vez que esta foi escrita, a versão de desenvolvimento do zoológico foi alterada para que, em vez de escrever parcialmente TRUE, uma regra de regras parcial ou a regra 3. O problema era que, à medida que novas regras de final foram adicionadas à versão de desenvolvimento (agora existem 3 e 4 Será adicionado antes da sua divulgação) tendo um argumento separado para cada um desordenar a interface do usuário. Também a regra é mais consistente com aproximadamente no núcleo de R. De fato, rule1 e rule2 terão o mesmo significado em rollapply e em aproximadamente (do núcleo de R) para uma melhor consistência e facilidade de uso. Os parênteses em torno do exemplo abaixo são atualmente necessários na versão de desenvolvimento para evitar que ele chame o método rollmean. Onde o princípio das regras ainda não foi implementado, mas a necessidade de o fazer será eliminada no momento em que for lançado oficialmente. Respondido 12 de dezembro 10 às 14: 295.2 Smoothing Time Series Smoothing geralmente é feito para nos ajudar a melhorar padrões, tendências, por exemplo, em séries temporais. Geralmente suavizar a irregularidade irregular para ver um sinal mais claro. Para dados sazonais, podemos suavizar a sazonalidade para que possamos identificar a tendência. O Smoothing não nos fornece um modelo, mas pode ser um bom primeiro passo na descrição de vários componentes da série. O termo filtro às vezes é usado para descrever um procedimento de suavização. Por exemplo, se o valor suavizado para um determinado horário for calculado como uma combinação linear de observações para os tempos circundantes, pode-se dizer que aplicamos um filtro linear aos dados (não o mesmo que dizer que o resultado é uma linha reta, por o caminho). O uso tradicional do termo média móvel é que, em cada ponto do tempo, determinamos médias (possivelmente ponderadas) dos valores observados que circundam um determinado momento. Por exemplo, no tempo t. Uma média móvel centrada de comprimento 3 com pesos iguais seria a média de valores às vezes t -1. T. E t1. Para tirar a sazonalidade de uma série, para que possamos melhor ver a tendência, usaríamos uma média móvel com um período de duração sazonal. Assim, na série suavizada, cada valor suavizado foi calculado em média em todas as estações. Isso pode ser feito observando uma média móvel unilateral em que você mede todos os valores para os anos anteriores de dados ou uma média móvel centrada em que você usa valores antes e depois da hora atual. Para dados trimestrais, por exemplo, podemos definir um valor suavizado para o tempo t como (x t x t-1 x t-2 x t-3) 4, a média deste tempo e os 3 trimestres anteriores. No código R, este será um filtro unilateral. Uma média móvel centrada cria um pouco de dificuldade quando temos um número par de períodos de tempo no período sazonal (como costumamos fazer). Para suavizar a sazonalidade em dados trimestrais. Para identificar a tendência, a convenção usual é usar a média móvel alisada no tempo t é Suavizar a sazonalidade nos dados mensais. A fim de identificar a tendência, a convenção usual é usar a média móvel suavizada no tempo t é. Isto é, aplicamos o peso 124 aos valores nos tempos t6 e t6 e peso 112 a todos os valores em todos os momentos entre t5 e t5. No comando R filter, bem, especifique um filtro de frente e verso quando quisermos usar valores que venham antes e depois do tempo para o qual foram suavizados. Observe que na página 71 do nosso livro, os autores aplicam pesos iguais em uma média móvel sazonal centrada. Isso também está bem. Por exemplo, um suavizado trimestral pode ser alisado no tempo t é frac x frac x frac xt frac x frac x Um mensageiro mensal pode aplicar um peso de 113 a todos os valores desde os tempos t-6 até t6. O código que os autores usam na página 72 aproveita o comando rep que repete um valor um certo número de vezes. Eles não usam o parâmetro de filtro dentro do comando de filtro. Exemplo 1 Produção Trimestral de Cerveja na Austrália Tanto na Lição 1 quanto na Lição 4, analisamos uma série de produção trimestral de cerveja na Austrália. O código R que se segue cria uma série suavizada que nos permite ver o padrão de tendência e traça esse padrão de tendência no mesmo gráfico que as séries temporais. O segundo comando cria e armazena a série suavizada no objeto chamado trendpattern. Observe que, dentro do comando do filtro, o parâmetro chamado filtro fornece os coeficientes para o alisamento e os lados 2 fazem com que um cálculo centrado seja calculado. Beerprod scan (beerprod. dat) trendpattern filter (beerprod, filtro c (18, 14, 14, 14, 18), sides2) trama (beerprod, tipo b, principal tendência média móvel) linhas (trendpattern) Heres o resultado: Nós Pode subtrair o padrão de tendência dos valores dos dados para obter uma melhor visão da sazonalidade. Heres como isso seria feito: Seasonals beerprod - traço trendpattern (seasonals, tipo b, padrão sazonal principal para a produção de cerveja) O resultado segue: Outra possibilidade para a série de suavização ver tendência é o filtro one-sided filterpattern2 filter (beerprod, filtro c (14, 14, 14, 14), lados1) Com isso, o valor suavizado é a média do ano passado. Exemplo 2. Desemprego mensal dos EUA No trabalho de casa para a semana 4, você analisou uma série mensal de desemprego americano de 1948 a 1978. Heres um alisamento feito para olhar a tendência. (Time de tendência, mainTrend no desemprego dos EUA, 1948-1978, ano de xlab) Somente a tendência suavizada é plotada. (Figura 2.1). O segundo comando identifica as características do tempo do calendário da série. Isso faz com que o enredo tenha um eixo mais significativo. A trama segue. Para as séries não sazonais, você não deve suavizar qualquer extensão específica. Para alisar, você deve experimentar as médias móveis de diferentes intervalos. Esses períodos de tempo poderiam ser relativamente curtos. O objetivo é eliminar as bordas difíceis para ver qual tendência ou padrão podem estar lá. Outros métodos de suavização (Seção 2.4) A Seção 2.4 descreve várias alternativas sofisticadas e úteis para o alisamento médio móvel. Os detalhes podem parecer incompletos, mas isso é bom porque não queremos ficar atolados em muitos detalhes para esses métodos. Dos métodos alternativos descritos na Seção 2.4, lowess (regressão ponderada localmente) pode ser o mais utilizado. Exemplo 2 Continuação O traçado seguinte é linha de tendência suavizada para a série de desemprego dos EUA, encontrada usando um método mais suave, em que uma quantidade substancial (23) contribuiu para cada estimativa suavizada. Observe que isso suavizou a série de forma mais agressiva do que a média móvel. Os comandos utilizados foram desempregados (desemprego, começo c (1948,1), freq12) trama (lowess (desempregado, f 23), alavanca Lowess principal da tendência de desemprego dos EUA) Suavização exponencial simples A equação de previsão básica para o alisamento exponencial único é muitas vezes Dado como hat alpha xt (1-alpha) hat t text Previstamos o valor de x no tempo t1 para ser uma combinação ponderada do valor observado no tempo t e o valor previsto no tempo t. Embora o método seja chamado de método de suavização, é usado principalmente para previsões de curto prazo. O valor de é chamado de constante de suavização. Por qualquer motivo, 0.2 é uma escolha padrão popular de programas. Isso coloca um peso de .2 na observação mais recente e um peso de 1 .2 .8 na previsão mais recente. Com um valor relativamente pequeno, o alisamento será relativamente mais extenso. Com um valor relativamente grande, o alisamento é relativamente menos extenso à medida que mais peso será colocado no valor observado. Este é um método simples de previsão de um passo para a frente que, a primeira vista, parece não exigir um modelo para os dados. De fato, esse método é equivalente ao uso de um modelo ARIMA (0,1,1) sem constante. O procedimento ideal é ajustar um modelo ARIMA (0,1,1) ao conjunto de dados observado e usar os resultados para determinar o valor de. Isso é ideal no sentido de criar o melhor para os dados já observados. Embora o objetivo seja o alisamento e a previsão um passo a frente, a equivalência ao modelo ARIMA (0,1,1) traz um bom ponto. Não devemos aplicar cegamente alisamento exponencial porque o processo subjacente pode não ser bem modelado por um ARIMA (0,1,1). ARIMA (0,1,1) e Equivalência de Suavização Exponencial Considere um ARIMA (0,1,1) com média 0 para as primeiras diferenças, xt - x t-1: start hat amp amp xt theta1 wt amp amp xt theta1 (xt - hat t) amp amp (1 theta1) xt - theta1hat tende. Se deixarmos (1 1) e assim - (1) 1, vemos a equivalência com a equação (1) acima. Por que o Método é Chamado Suavização Exponencial Isso produz o seguinte: begin hat amp amp alpha phxt (1-alpha) alfa x (1-alfa) som amplificador amp alpha xt alfa (1-alfa) x (1-alfa) 2hat fim Continuar Desta forma, substituindo sucessivamente o valor previsto no lado direito da equação. Isso leva a: hat alpha alfa (1-alpha) x alfa (1-alfa) 2 x pontos alfa (1-alfa) jx pontos alfa (1-alfa) x1 texto A equação 2 mostra que o valor previsto é uma média ponderada De todos os valores passados ​​da série, com pesos exponencialmente alternativos à medida que avançamos na série. Suavização exponencial otimizada em R Basicamente, apenas nos ajustamos a ARIMA (0,1,1) aos dados e determinamos o coeficiente. Podemos examinar o ajuste do liso, comparando os valores previstos com a série real. O suavizado exponencial tende a ser usado mais como uma ferramenta de previsão do que um verdadeiro mais suave, por isso estava olhando para ver se nós temos um bom ajuste. Exemplo 3. N 100 observações mensais do logaritmo de um índice de preços do petróleo nos Estados Unidos. A série de dados é: Um ajuste ARIMA (0,1,1) em R deu um coeficiente MA (1) 0,3877. Assim (1 1) 1.3877 e 1- -0.3877. A equação de previsão de suavização exponencial é hat 1.3877xt - 0.3877hat t No momento 100, o valor observado da série é x 100 0.86601. O valor previsto para a série naquele momento é Assim, a previsão para o tempo 101 é 1.3877x - 0.3877hat 1.3877 (0.86601) -0.3877 (0.856789) 0.8696 A seguir, o quão bem é mais adequado para a série. É um bom ajuste. Isso é um bom sinal para a previsão, o objetivo principal para este mais suave. Aqui estão os comandos usados ​​para gerar a saída para este exemplo: planilha oilindex scan (oildata. dat) (oilindex, tipo b, registro principal da série de índice de óleo) expsmoothfit arima (oilindex, order c (0,1,1)) expsmoothfit Para ver os resultados de arima previstos oilindex - linhas de gráficos preditos expsmoothfitresiduais (linhas de indexação de óleo (indexação de óleo, tipo, alinhamento exponencial principal de índice de óleo) 1.3877oilindex100-0.3877predicteds100 previsão para o tempo 101 Suavização exponencial dupla Suavização exponencial dupla pode ser usada quando há Tendência (tanto a longo prazo quanto a curto prazo), mas sem sazonalidade. Essencialmente, o método cria uma previsão combinando estimativas exponencialmente suavizadas da tendência (inclinação de uma linha reta) e do nível (basicamente, a interceptação de uma linha reta). Dois pesos diferentes, ou parâmetros de suavização, são usados ​​para atualizar esses dois componentes em cada momento. O nível suavizado é mais ou menos equivalente a um simples alisamento exponencial dos valores de dados e a tendência suavizada é mais ou menos equivalente a um alisamento exponencial simples das primeiras diferenças. O procedimento é equivalente ao encaixe de um modelo ARIMA (0,2,2), sem constante pode ser realizada com um ajuste ARIMA (0,2,2). (1-B) 2 xt (1theta1B theta2B2) wt.6.2 Médias móveis ma 40 elecsales, ordem 5 41 Na segunda coluna desta tabela, uma média móvel da ordem 5 é mostrada, fornecendo uma estimativa do ciclo de tendência. O primeiro valor nesta coluna é a média das cinco primeiras observações (1989-1993), o segundo valor na coluna 5-MA é a média dos valores 1990-1994 e assim por diante. Cada valor na coluna 5-MA é a média das observações no período de cinco anos centrado no ano correspondente. Não há valores nos dois primeiros anos ou nos últimos dois anos porque não temos duas observações em ambos os lados. Na fórmula acima, a coluna 5-MA contém os valores de chapéu com k2. Para ver como se parece a estimativa do ciclo de tendência, nós o traçamos juntamente com os dados originais na Figura 6.7. Planilha 40 elesales, quot principal de vendas de eletricidade residencial, ylab quotGWhot. Xlab quotYearquot 41 linhas 40 ma 40 elecsales, 5 41. col quotredquot 41 Observe como a tendência (em vermelho) é mais suave que os dados originais e captura o movimento principal das séries temporais sem todas as pequenas flutuações. O método de média móvel não permite estimativas de T onde t é próximo das extremidades da série, portanto, a linha vermelha não se estende às bordas do gráfico de cada lado. Mais tarde, usaremos métodos mais sofisticados de estimativa do ciclo de tendência que permitem estimativas próximas aos pontos finais. A ordem da média móvel determina a suavidade da estimativa do ciclo da tendência. Em geral, uma ordem maior significa uma curva mais suave. O gráfico a seguir mostra o efeito de alterar a ordem da média móvel para os dados residenciais de vendas de eletricidade. As médias móveis simples, como estas, geralmente são de ordem ímpar (por exemplo, 3, 5, 7, etc.). É assim que são simétricas: em uma média móvel da ordem m2k1, há k observações anteriores, k observações posteriores e a observação do meio Que estão em média. Mas se eu fosse igual, não seria mais simétrico. Médias móveis das médias móveis É possível aplicar uma média móvel a uma média móvel. Um dos motivos para isso é fazer uma média móvel em ordem uniforme simétrica. Por exemplo, podemos tomar uma média móvel da ordem 4 e, em seguida, aplicar outra média móvel da ordem 2 aos resultados. Na Tabela 6.2, isso foi feito nos primeiros anos dos dados de produção de cerveja trimestral australiana. Beer2 lt - window 40 ausbeer, começar 1992 41 ma4 lt-ma 40 beer2, order 4. center FALSE 41 ma2x4 lt-ma 40 beer2, order 4. center TRUE 41 A notação 2times4-MA na última coluna significa 4-MA Seguido por um 2-MA. Os valores na última coluna são obtidos tomando uma média móvel da ordem 2 dos valores na coluna anterior. Por exemplo, os dois primeiros valores na coluna 4-MA são 451.2 (443410420532) 4 e 448.8 (410420532433) 4. O primeiro valor na coluna 2times4-MA é a média desses dois: 450.0 (451.2448.8) 2. Quando um 2-MA segue uma média móvel de ordem par (como 4), é chamado de média móvel centrada da ordem 4. Isso ocorre porque os resultados agora são simétricos. Para ver que este é o caso, podemos escrever o 2times4-MA da seguinte forma: comece o amplificador de amplificação. Bigfrac (y y y y) frac (y y y y) Grande amplificação fractura fractura fratão frac14y frac14y frac18y. Fim É agora uma média ponderada de observações, mas é simétrico. Outras combinações de médias móveis também são possíveis. Por exemplo, um 3x3-MA é freqüentemente usado e consiste em uma média móvel da ordem 3, seguida de outra média móvel da ordem 3. Em geral, uma ordem final MA deve ser seguida por uma ordem final MA para torná-la simétrica. Da mesma forma, uma ordem ímpar MA deve ser seguida por uma ordem ímpar MA. Estimando o ciclo de tendência com dados sazonais O uso mais comum de médias móveis centradas é estimar o ciclo de tendência a partir de dados sazonais. Considere o 2x4-MA: fractura de fractura e fractura fratura de fractura. Quando aplicado a dados trimestrais, cada trimestre do ano recebe peso igual à medida que o primeiro e o último termos se aplicam ao mesmo trimestre em anos consecutivos. Consequentemente, a variação sazonal será promediada e os valores resultantes do chapéu t terão pouca ou nenhuma variação sazonal restante. Um efeito semelhante seria obtido usando um 2x 8-MA ou um 2x 12-MA. Em geral, 2 vezes m-MA é equivalente a uma média móvel ponderada da ordem m1 com todas as observações tomando peso 1m, exceto para os primeiros e últimos termos que tomam pesos 1 (2m). Então, se o período sazonal é igual e de ordem m, use um 2-m-MA para estimar o ciclo da tendência. Se o período sazonal for estranho e de ordem m, use um m-MA para estimar o ciclo de tendências. Em particular, um 2x 12-MA pode ser usado para estimar o ciclo de tendência dos dados mensais e um 7-MA pode ser usado para estimar o ciclo de tendência dos dados diários. Outras opções para a ordem do MA geralmente resultarão em estimativas do ciclo de tendência sendo contaminadas pela sazonalidade nos dados. Exemplo 6.2 Fabricação de equipamentos elétricos A Figura 6.9 mostra um 2x12-MA aplicado ao índice de pedidos de equipamentos elétricos. Observe que a linha suave mostra nenhuma sazonalidade é quase o mesmo que o ciclo de tendência mostrado na Figura 6.2, que foi estimado usando um método muito mais sofisticado do que as médias móveis. Qualquer outra escolha para a ordem da média móvel (exceto 24, 36, etc.) teria resultado em uma linha suave que mostra algumas flutuações sazonais. Lote 40 elecequip, ylab quotNome ordem de pedidos. Quotgrayquot quotgrayquot principal quotEquipamento de equipamentos elétricos (área do euro) 41 linhas 40 ma 40 elecequip, ordem 12 41. col quotredquot 41 médias móveis ponderadas As combinações de médias móveis resultam em médias móveis ponderadas. Por exemplo, o 2x4-MA discutido acima é equivalente a um 5-MA ponderado com pesos dados por frac, frac, frac, frac, frac. Em geral, um m-MA ponderado pode ser escrito como hat t sum k aj y, onde k (m-1) 2 e os pesos são dados por a, pontos, ak. É importante que todos os pesos somem para um e que sejam simétricos para que aj. O m-MA simples é um caso especial em que todos os pesos são iguais a 1m. Uma grande vantagem das médias móveis ponderadas é que eles produzem uma estimativa mais suave do ciclo da tendência. Em vez das observações que entram e saem do cálculo em peso total, seus pesos aumentam lentamente e diminuem lentamente resultando em uma curva mais suave. Alguns conjuntos específicos de pesos são amplamente utilizados. Alguns destes são apresentados na Tabela 6.3.

Comments