Tenho dados de painel que inclui estados americanos (1-48) e anos (1900-1917). Todas as variáveis são variáveis no tempo, com uma exceção. Esta exceção é invariante no tempo e uma variável categórica de três níveis que mede as designações regionais para os estados testados usando duas variáveis dummy. Eu também quero olhar para as interações entre um dos manequins e várias variáveis que variam no tempo. As estimativas de OLS deste modelo indicam heterocedasticidade. Dada a organização dos dados, minha pergunta é qual das técnicas de painel é melhor e por que estou usando o Stata. Obrigado, RB perguntou Jan 3 14 at 15:41 Eu diria que depende dos dados. Mas existem algumas idéias gerais sobre a especificação do modelo. O método de efeitos fixos é consistente e, portanto, deve ser usado para controlar os fatores de confusão no nível do sujeito. Se não houver nenhum confundidor de sujeito-nível, o método de efeitos aleatórios é eficiente para explicar erros correlacionados. OLS vs. Efeitos fixos. F-teste do significado conjunto dos efeitos fixos intercepta. A hipótese nula é que todos os interceptos de efeito fixo são zero. Se o nulo for rejeitado, então precisamos usar o método de efeitos fixos. O teste F é automaticamente realizado quando executamos xtreg em Stata. Ele aparece na parte inferior da saída de regressão. Efeitos fixos vs. aleatórios: teste de Hausman. A hipótese nula é que os coeficientes de inclinação dos dois modelos que estão sendo comparados não diferem significativamente. Se as estimativas são diferentes, então rejeitamos os efeitos de romom e devemos usar efeitos fixos, caso contrário, usamos o método de efeitos aleatórios mais eficiente. Existe um comando hausman em Stata. Eu acho que a rugas é a variável invariante no tempo (3 níveis, 2 dummies), que é criada usando agregações dos dados transversais (estados). Então, se eu executar o modelo de efeitos fixos em Stata os dois dummies abandonar. É a solução para soltar os dois manequins e basta olhar para os estados individuais que compõem estas duas manequins Obrigado novamente, RB ndash user36830 Jan 3 14 às 16:28 Você está certo, user36830. De um modo geral, o método de efeitos fixos não pode lidar com covariáveis invariantes no tempo, mas o artigo recente pode ser do seu interesse. Se você estiver realmente interessado nos efeitos de covariantes invariantes no tempo, pode recorrer ao método de efeitos aleatórios. Há também outro modelo de dados de painéis longitudinais denominado modelos de média populacional (ou marginal) (por exemplo, modelos de equações de estimativa generalizada), em comparação com modelos específicos de sujeito. Veja meu esclarecimento aqui. Análise dinâmica de dados de painel (DPD) A Stata possui um conjunto de ferramentas para a análise dinâmica de dados de painel: xtabond implementa o estimador de Arellano e Bond, que usa condições de momento em que Atrasos da variável dependente e as primeiras diferenças das variáveis exógenas são instrumentos para a primeira equação diferenciada. Xtdpdsys implementa o estimador do sistema de Arellano e BoverBlundell e Bond, que usa as condições de momento xtabond e condições de momento em que as primeiras diferenças retardadas da variável dependente são instrumentos para a equação de nível. Xtdpd. Para usuários avançados, é uma alternativa mais flexível que pode encaixar modelos com correlações de média móvel de baixa ordem nos erros idiossincráticos e variáveis predeterminadas com uma estrutura mais complicada do que a permitida com xtabond e xtdpdsys. As ferramentas de pós-estimativa permitem testar a correlação serial nos resíduos primeiro-diferenciados e testar a validade das restrições overidentifying. Baseando-se no trabalho de Layard e Nickell (1986), Arellano e Bond (1991) encaixam um modelo dinâmico de demanda de mão-de-obra a um grupo de empresas desequilibrado localizado no Reino Unido. Primeiro, modelamos o emprego em salários, estoque de capital, produção industrial, manequins de ano e uma tendência de tempo, incluindo um atraso de emprego e dois atrasos de salários e estoque de capital. Usaremos o estimador ArellanondashBond de uma etapa e solicitaremos seu VCE robusto: Como incluímos um atraso de n no nosso modelo de regressão, xtabond usou os retornos 2 e de volta como instrumentos. Diferenças das variáveis exógenas também servem como instrumentos. Aqui nós remodelamos o nosso modelo, usando xtdpdsys em vez disso para que possamos obter as estimativas ArellanondashBoverBlundellndashBond: Comparando os rodapés dos dois commandsrsquo saída ilustra a diferença chave entre os dois estimadores. Xtdpdsys incluiu as diferenças retardadas de n como instrumentos na equação de nível xtabond não. As condições de momento destes estimadores GMM são válidas apenas se não houver correlação serial nos erros idiossincráticos. Como a primeira diferença de ruído branco é necessariamente autocorrelacionada, precisamos apenas nos preocupar com a segunda e maior autocorrelação. Podemos usar estat abond para testar a autocorrelação: Referências Arellano, M. e S. Bond. 1991. Alguns testes de especificação para dados de painel: evidência Monte Carlo e uma aplicação para equações de emprego. A Revisão dos Estudos Econométricos 58: 277ndash297. Layard, R. e S. J. Nickell. 1986. Desemprego na Grã-Bretanha. () E suas limitações O comando mais óbvio de Statarsquos para calcular médias móveis é a função ma () de egen (egen) . Dada uma expressão, cria uma média móvel - period dessa expressão. Por padrão, é tomado como 3. deve ser ímpar. No entanto, como a entrada manual indica, egen, ma () não pode ser combinado com varlist:. E, por esse motivo, não é aplicável aos dados do painel. Em qualquer caso, fica fora do conjunto de comandos especificamente escritos para séries temporais, veja as séries temporais para detalhes. Abordagens alternativas Para calcular médias móveis para dados de painel, existem pelo menos duas opções. Ambos dependem do conjunto de dados ter sido tsset previamente. Isso vale muito a pena fazer: não só você pode salvar a si mesmo repetidamente especificando variável de painel e variável de tempo, mas Stata se comporta de forma inteligente, dada qualquer lacuna nos dados. 1. Escreva sua própria definição usando generate Usando operadores de séries temporais como L. e F. Dar a definição da média móvel como o argumento para uma declaração de geração. Se você fizer isso, você não estará, naturalmente, limitado às médias móveis ponderadas (não ponderadas) centradas calculadas por egen, ma (). Por exemplo, as médias móveis ponderadas de três períodos seriam dadas por e alguns pesos podem ser facilmente especificados: Você pode, naturalmente, especificar uma expressão como log (myvar) em vez de um nome de variável como myvar. Uma grande vantagem dessa abordagem é que a Stata automaticamente faz a coisa certa para os dados do painel: os valores iniciais e retardatários são elaborados dentro dos painéis, exatamente como a lógica determina que eles devam ser. A desvantagem mais notável é que a linha de comando pode ficar bastante longa se a média móvel envolver vários termos. Outro exemplo é uma média móvel unilateral baseada apenas em valores anteriores. Isso poderia ser útil para gerar uma expectativa adaptativa do que uma variável será baseada puramente em informações até à data: o que alguém poderia prever para o período atual baseado nos últimos quatro valores, usando um esquema de ponderação fixo Especialmente comumente usado com timeseries trimestrais.) 2. Use egen, filter () de SSC Use o filtro de função egen escrito pelo usuário () do pacote egenmore em SSC. No Stata 7 (atualizado após 14 de novembro de 2001), você pode instalar este pacote após o qual a ajuda egenmore aponta para detalhes sobre filter (). Os dois exemplos acima seriam renderizados (nesta comparação, a abordagem de gerar é talvez mais transparente, mas veremos um exemplo do oposto em um momento). Os retornos são um numlist. Leva-se a defasagens negativas: nesse caso -11 se expande para -1 0 1 ou chumbo 1, atraso 0, atraso 1. Os coeficientes, outro número, multiplicam os itens correspondentes retardados ou principais: neste caso, esses itens são F1.myvar . Myvar e L1.myvar. O efeito da opção de normalização é escalar cada coeficiente pela soma dos coeficientes para que o coeficiente (1 1 1) normalize seja equivalente aos coeficientes de 13 13 13 e o coeficiente (1 2 1) normalize seja equivalente aos coeficientes de 14 12 14 Você deve especificar não apenas os atrasos, mas também os coeficientes. Como egen, ma () fornece o caso igualmente ponderado, a razão principal para egen, filter () é suportar o caso desigualmente ponderado, para o qual você deve especificar coeficientes. Poderia também ser dito que obrigar os usuários a especificar coeficientes é uma pequena pressão extra sobre eles para pensar sobre quais coeficientes eles querem. A principal justificativa para pesos iguais é, suponhamos, simplicidade, mas pesos iguais têm propriedades de domínio de frequência ruim, para mencionar apenas uma consideração. O terceiro exemplo acima pode ser qualquer um dos quais é quase tão complicado quanto a abordagem gerar. Há casos em que egen, filter () dá uma formulação mais simples do que gerar. Se você quer um filtro binomial de nove períodos, que os climatologistas acham útil, então parece talvez menos horrível do que, e mais fácil de obter do que, Assim como com a abordagem de geração, egen, filter () funciona corretamente com dados do painel. Na verdade, como dito acima, depende do conjunto de dados ter sido tsset previamente. Uma dica gráfica Depois de calcular suas médias móveis, você provavelmente vai querer olhar para um gráfico. O comando tsgraph escrito pelo usuário é inteligente sobre conjuntos de dados tsset. Instale-o em um Stata 7 atualizado por ssc inst tsgraph. O que sobre subconjunto com se nenhum dos exemplos acima fazer uso de se restrições. Na verdade egen, ma () não permitirá se a ser especificado. Ocasionalmente as pessoas querem usar se ao calcular médias móveis, mas seu uso é um pouco mais complicado do que é normalmente. O que você esperaria de uma média móvel calculada com if. Vamos identificar duas possibilidades: Fraca interpretação: Eu não quero ver nenhum resultado para as observações excluídas. Interpretação forte: Eu nem quero que você use os valores para as observações excluídas. Aqui está um exemplo concreto. Suponha como conseqüência de alguma condição if, as observações 1-42 estão incluídas, mas não as observações 43 sobre. Mas a média móvel de 42 dependerá, entre outras coisas, do valor de observação 43 se a média se estender para trás e para a frente e for de comprimento pelo menos 3, e dependerá também de algumas das observações 44 em diante em algumas circunstâncias. Nossa suposição é que a maioria das pessoas iria para a interpretação fraca, mas se isso está correto, egen, filter () não suporta se. Você sempre pode ignorar o que você donrsquot quer ou mesmo definir valores indesejados para desaparecer depois, usando substituir. Uma nota sobre os resultados faltando nas extremidades da série Como as médias móveis são funções de defasagens e derivações, egen, ma () produz faltando onde não existem os retornos e as derivações, no início e no final da série. Uma opção nomiss força o cálculo de médias móveis mais curtas e não centralizadas para as caudas. Em contraste, nem gerar nem egen, filter () faz, ou permite, nada de especial para evitar resultados em falta. Se algum dos valores necessários para o cálculo estiver faltando, então esse resultado está ausente. Cabe aos usuários decidir se e o que a cirurgia corretiva é necessária para essas observações, presumivelmente depois de olhar para o conjunto de dados e considerar qualquer ciência subjacente que pode ser levado a suportar.
No comments:
Post a Comment