Como a matriz de erros var / cov é calculada na prática por pacotes de análise estatística?
Essa ideia é clara para mim em teoria. Mas não na prática. Quero dizer, se eu tiver um vetor de variáveis aleatórias , entendo que a matriz de variância / covariância receberá o produto externo dos vetores desvio-da-média: .
Mas quando tenho uma amostra, os erros das minhas observações não são variáveis aleatórias. Ou melhor, são, mas somente se eu coletar um número de amostras idênticas da mesma população. Caso contrário, eles são dados. Então, novamente, minha pergunta é: como um pacote estatístico pode produzir uma matriz var / cov a partir de uma lista de observações (isto é, uma amostra) fornecida pelo pesquisador?
variance
error
covariance-matrix
beta-regression
Riccardo
fonte
fonte
Respostas:
A matriz de covariância para um modelo do tipo é geralmente calculada como que é o soma dos quadrados dos resíduos, e representa os graus de liberdade (tipicamente o número de observações menos o número de parâmetros).y=Xβ+ϵ
Para erros padrão robustos e ou em cluster, o produto é modificado levemente. Também pode haver outras maneiras de calcular a matriz de covariância, por exemplo, conforme sugerido pela expectativa de produtos externos.XtX
fonte
Isso está incluído em Regressão prática e Anova usando R de Julian J. Faraway, página 21 .
Exemplo de seu cálculo em R, com base no modelo linear de milhas por galão regrediram em várias especificações do modelo do carro incluídos no
mtcars
banco de dados:ols = lm(mpg ~ disp + drat + wt, mtcars)
. Estes são os cálculos manuais e a saída dalm()
função:estimado na página 8 deste documento on-line como
fonte
Com regressão linear, estamos ajustando um modelo . é a variável dependente, os são as variáveis preditoras (explicativas). Usamos os dados fornecidos a nós (o conjunto de treinamento ou a amostra) para estimar a população 's. Os não são considerados variáveis aleatórias. Os são aleatórios devido ao componente de erro.Y X β X YY=β∗X+ε Y X β X Y
fonte