(ATUALIZAÇÃO: Eu mergulhei mais fundo nisso e publiquei os resultados aqui )
A lista de testes estatísticos nomeados é enorme. Muitos dos testes comuns se baseiam na inferência de modelos lineares simples, por exemplo, um teste t de uma amostra é apenas y = β + ε que é testado com relação ao modelo nulo y = μ + ε ou seja, que β = μ onde μ é nulo valor - tipicamente μ = 0.
Acho que isso é um pouco mais instrutivo para fins de ensino do que o modelo de aprendizagem mecânica nomeada, quando usá-los e suas suposições como se não tivessem nada a ver um com o outro. Essa abordagem promove não promove a compreensão. No entanto, não consigo encontrar um bom recurso para coletar isso. Estou mais interessado em equivalências entre os modelos subjacentes do que no método de inferência deles. Embora, até onde eu possa ver, os testes de razão de verossimilhança em todos esses modelos lineares produzam os mesmos resultados que a inferência "clássica".
Aqui estão as equivalências que eu aprendi até agora, ignorando o termo de erro e assumindo que todas as hipóteses nulas são a ausência de um efeito:
Teste t de uma amostra: .
Teste t de amostra pareada:
Isso é idêntico ao teste t de uma amostra nas diferenças entre pares.
Teste t de duas amostras:
onde x é um indicador (0 ou 1).
Correlação de Pearson:
Observe a semelhança com um teste t de duas amostras que é apenas regressão em um eixo x binário.
Correlação de Spearman:
Isso é idêntico a uma correlação de Pearson em x e y transformados em rank.
ANOVA unidirecional:
onde são indicadores que selecionam o relevante(um é 1; os outros são 0). O modelo poderia provavelmente ser escrito na forma de matriz como como .
ANOVA bidirecional:
por dois fatores de dois níveis. Aqui são vectores de betas onde um é seleccionado pelo indicador de vector . O mostrado aqui é o efeito de interação.
Poderíamos adicionar mais "testes nomeados" a esta lista de modelos lineares? Por exemplo, regressão multivariada, outros testes "não paramétricos", testes binomiais ou RM-ANOVAs?
ATUALIZAÇÃO: perguntas foram feitas e respondidas sobre ANOVA e testes t como modelos lineares aqui no SO. Veja esta pergunta e marque perguntas relacionadas .
fonte
x = rnorm(100); y = rnorm(100); summary(lm(rank(x) ~ rank(y))); cor.test(x, y, method='spearman')
Respostas:
Não é uma lista exaustiva, mas se você incluir modelos lineares generalizados , o escopo desse problema se tornará substancialmente maior.
Por exemplo:
Além disso, o teste t para variações desiguais é bem aproximado usando a estimativa de erro robusta de Huber White.
fonte