Por favor, veja editar.
Quando você tem dados com caudas pesadas, fazer uma regressão com erros de student-t parece uma coisa intuitiva. Ao explorar essa possibilidade, encontrei este artigo:
Breusch, TS, Robertson, JC, & Welsh, AH (01 de novembro de 1997). As novas roupas do imperador: uma crítica ao modelo de regressão multivariada. Statistica Neerlandica, 51, 3.) ( link , pdf )
O que argumenta que o parâmetro de escala e o parâmetro de graus de liberdade não são identificáveis entre si em algum sentido e que, por causa disso, fazer uma regressão com erros t não faz nada além do que uma regressão linear padrão faz.
Zellner (1976) propôs um modelo de regressão no qual o vetor de dados (ou o vetor de erro) é representado como uma realização a partir da distribuição multivariada de Student t. Esse modelo atraiu considerável atenção porque parece ampliar a suposição gaussiana usual para permitir distribuições de erro de cauda mais pesada. Vários resultados na literatura indicam que os procedimentos de inferência padrão para o modelo gaussiano permanecem apropriados sob o pressuposto distributivo mais amplo, levando a reivindicações de robustez dos métodos padrão. Mostramos que, embora matematicamente os dois modelos sejam diferentes, para fins de inferência estatística eles são indistinguíveis. As implicações empíricas do modelo t multivariado são exatamente as mesmas do modelo gaussiano. Portanto, a sugestão de uma representação distributiva mais ampla dos dados é espúria e as alegações de robustez são enganosas. Essas conclusões são alcançadas tanto da perspectiva freqüentista quanto da bayesiana.
Isso me surpreende.
Não tenho sofisticação matemática para avaliar bem seus argumentos, por isso tenho algumas perguntas: é verdade que fazer regressões com erros t geralmente não é útil? Se às vezes são úteis, entendi errado o artigo ou é enganoso? Se eles não são úteis, isso é um fato bem conhecido? Existem outras maneiras de contabilizar dados com caudas pesadas?
Edit : Após uma leitura mais detalhada, do parágrafo 3 e da seção 4, parece que o artigo abaixo não está falando sobre o que eu estava pensando como uma regressão aluno-t (erros são distribuições univariadas de t independentes). Os erros são extraídos de uma única distribuição e não são independentes. Se bem entendi, essa falta de independência é precisamente o que explica por que você não pode estimar a escala e os graus de liberdade de forma independente.
Acho que este documento fornece uma lista de documentos para evitar a leitura.
fonte
Respostas:
Sua edição está correta. Os resultados apresentados no artigo aplicam-se apenas a erros multivariados-t. Se você estiver usando erros t independentes, estará seguro.
Não acho que o artigo seja bem conhecido, mas acho que está correto.
A literatura estatística está cheia de "generalizações" que, em muitos casos, são reparameterizações, transformações um a um ou, às vezes, inúteis porque não contribuem significativamente na generalização de algumas propriedades do modelo em questão.
fonte