Se houver, entre ajustar uma linha a vários "experimentos" separados e calcular a média dos ajustes, ou calcular a média dos dados das experiências separadas e ajustar os dados médios. Deixe-me elaborar:
Realizo simulações em computador que geram uma curva, mostradas abaixo. Nós extraímos uma quantidade, vamos chamá-la de "A" ajustando a região linear do gráfico (tempos longos). O valor é simplesmente a inclinação da região linear. Obviamente, há um erro associado a essa regressão linear.
Normalmente, executamos 100 dessas simulações com diferentes condições iniciais para calcular um valor médio de "A". Foi-me dito que é melhor calcular a média dos dados brutos (do gráfico abaixo) em grupos de 10, em seguida, ajustar para "A" e calcular a média dos 10 "A" juntos.
Não tenho intuição de saber se há algum mérito nisso ou se é melhor do que ajustar 100 valores "A" individuais e calcular a média deles.
Respostas:
Imagine que estamos em um contexto de dados em painel onde há variação ao longo do tempo e entre empresas . Pense em cada período como um experimento separado. Entendo sua pergunta como se fosse equivalente estimar um efeito usando:i tt Eu t
A resposta em geral é não.
A configuração:
Na minha formulação, podemos pensar em cada período de tempo como um experimento separado.t
Digamos que você tenha um painel equilibrado de comprimento sobre empresas. Se cada período de tempo etc ..., podemos escrever os dados gerais como:n ( X t , y t )T n ( Xt, yt)
Média de ajustes:
Ajuste das médias:
Em geral, isso não é igual à estimativa baseada na variação transversal das médias das séries temporais (isto é, entre o estimador).
Onde etc ...x¯Eu= 1T∑txt , i
Estimativa OLS combinada:
Algo talvez útil para se pensar é a estimativa OLS combinada. O que é isso? Em seguida, use
Vamos e ser nossas estimativas de sobre a amostra completa e no período respectivamente. Então nós temos:S= 1n T∑EuX′X St= 1nX′tXt E[ x x′] t
É como uma média das diferentes estimativas específicas de tempo , mas é um pouco diferente. Em certo sentido, você está dando mais peso a períodos com maior variação das variáveis do lado direito.bt
Caso especial: as variáveis do lado direito são invariantes no tempo e específicas da empresa
Se as variáveis do lado direito de cada empresa forem constantes ao longo do tempo (por exemplo, para qualquer e ), então para todos os teríamos:Eu Xt1 1= Xt2 t1 1 t2 S= St t
Comentário divertido:
Este é o caso de Fama e Macbeth em que quando aplicaram essa técnica de média de estimativas transversais para obter erros padrão consistentes ao estimar como os retornos esperados variam com a covariância das empresas com o mercado (ou com outros fatores de carga).
O procedimento de Fama-Macbeth é uma maneira intuitiva de obter erros padrão consistentes no contexto do painel quando os termos do erro são correlacionados transversalmente, mas independentes ao longo do tempo. Uma técnica mais moderna que produz resultados semelhantes é o agrupamento no prazo.
fonte
(Observação: não tenho reputação suficiente para comentar, por isso estou postando isso como resposta.)
Para a questão específica colocada, a resposta de fcop está correta: ajustar a média é o mesmo que calcular a média dos ajustes (pelo menos para os mínimos quadrados lineares). No entanto, vale ressaltar que qualquer uma dessas abordagens " on-line " ingênuas pode fornecer resultados tendenciosos, em comparação com o ajuste de todos os dados de uma só vez. Como os dois são equivalentes, vou focar na abordagem "ajustar a média". Essencialmente, o ajuste das curvas médias ignora a incerteza relativa nos valores de entre pontos diferentes . Por exemplo, se , e , entãoy¯[ x ] = ⟨ y[ x ] ⟩ y x y1 1[ x1 1] = y2[ x1 1] = 2 y1 1[ x2] = 1 y1 1[ x2] = 3 y¯[ x1 1] = y¯[ x2] = 2 , mas qualquer ajuste de curva deve se preocupar muito mais com desajuste em comparação com .x1 1 x2
Observe que a maioria das plataformas de software científicas deve ter ferramentas para calcular / atualizar um verdadeiro ajuste de mínimos quadrados "online" (conhecido como mínimos quadrados recursivos ). Portanto, todos os dados podem ser usados (se isso for desejável).
fonte