Introdução às estatísticas não paramétricas

11

Eu tenho estudado estatística nos últimos dois anos. Quase tudo o que aprendi é sobre estatística paramétrica. Agora eu gostaria de aprender mais sobre estatísticas não paramétricas. Alguém pode sugerir uma introdução concisa (talvez também legível) a essa área?

LaTeXFan
fonte

Respostas:

12

Depende do que você quer dizer com "conciso", que tipo de nível de tratamento você está procurando (incluindo conceitos matemáticos versus intuição), que técnicas você deseja incluir.

Eu sugiro fortemente começar com livros e ler mais de um livro .

As " Estatísticas não paramétricas práticas " de Conover são boas, e eu definitivamente gostaria de incluir em qualquer lista.

As " estatísticas não paramétricas aplicadas " de Daniel são muito boas, razoavelmente abrangentes por seu tamanho.

Achei os " testes sem distribuição " de Neave e Worthington muito legíveis quando foram lançados (e de muitas maneiras ainda são). Atualmente, o código parece um pouco datado, mas, por outro lado, geralmente é legível o suficiente para ser traduzido. Se você pode encontrar, é uma boa introdução; vale a pena comprar em segunda mão, se você não comprar de novo.

Existem dezenas de bons livros, alguns mais antigos que os três que mencionei, outros mais novos; alguns podem ser melhores para você do que qualquer um que eu mencionei. Começava com uma biblioteca universitária e procurava em pesquisas com termos como os títulos acima e, se possível, ver o que há por perto.

Leia alguns deles e encontre vários que você gosta.

Quando fiz não parametria na graduação, havia algo como oito livros na leitura recomendada, talvez mais. Cada um deles tinha algo que a maioria dos outros não possuía. Estou feliz por ter olhado para todos eles.

Glen_b -Reinstate Monica
fonte
4

Se o seu campo de estudo é nas ciências humanas (por exemplo, psicologia, sociologia, educação), eu recomendaria Estatísticas Não Paramétricas para as Ciências do Comportamento de Siegel e Castellan (McGraw-Hill Book Company). (Eu tenho a segunda edição de 1988). Do prefácio:

Uma característica distintiva [é] o esboço passo a passo da aplicação de cada procedimento aos dados reais.

Joel Reyes Noche
fonte
2

Encontrei "Regressão semiparamétrica" ​​de Carroll, Wand et al. para ser bem legível. Está desatualizado, mas é uma boa coisa para começar antes de passar para o livro conciso, mas denso, de Simon Wood sobre GAMs.

Ambos os livros se concentram em modelos de regressão de splines penalizados, o que não é tudo em estatísticas não paramétricas. Mas sem dúvida mais útil para pessoas aplicadas.

generic_user
fonte
11
20826: a título explicativo, para o caso de você achar essa resposta um tanto confusa - 'nonparametric' pode se referir não apenas à forma funcional não especificada (potencialmente infinita-paramétrica) da distribuição (ou seja, você não especifica uma forma paramétrica para ), mas também para a relação entre variáveis ​​( ). A resposta da EGA aqui se refere à segunda coisa e não à primeira. Na verdade, é possível que o termo 'não-paramétrico' em relação aos modelos de regressão se aplique a uma questão ou a ambas ao mesmo tempo (o que costumo chamar de 'duplamente não-paramétrico'). E ( Y ) = g ( x )FY(y)E(Y)=g(x)
Glen_b -Reinstala Monica
direita. apenas curioso, quais são alguns exemplos de instâncias no trabalho aplicado em que a primeira das duas formas de trabalho não paramétrico pode ser útil? ou eu acho que o bootstrap seria um exemplo, certo?
generic_user 16/03
11
ACD, recomendo que você dê uma olhada em qualquer um dos livros mencionados em minhas respostas. Posso apontar - literalmente - para milhares de artigos que os aplicam a problemas reais, que incluem testes de Wilcoxon-Mann-Whitney, testes de qualidade de ajuste como Kolmogorov-Smirnov, medidas de correlação como a regressão de Kendall e Spearman, Theil-Sen , Curvas de sobrevivência de Kaplan-Meier (e testes de log-rank), permutação / randomização (+ outros métodos de reamostragem) e muito mais. No geral, eu diria que, na verdade, pode ser aplicado um pouco mais frequentemente do que o sentido em que você o usa. Sim, a inicialização está incluída.
Glen_b -Reinstala Monica
11
(ctd) ... a área é bastante grande; se você diminuir um pouco, provavelmente encontrarei algumas aplicações em particular.
Glen_b -Reinstala Monica
11
Certo, geralmente são testes que não se baseiam em premissas distributivas. Acho que me pergunto se é possível estimar uma distribuição não paramétrica para um modelo ao mesmo tempo em que estimar as relações entre variáveis ​​(provavelmente com muitos dados). Mas, como você aponta, há muito o que ler.
generic_user 16/03
2

Fiquei surpreso ao não ver todas as estatísticas não paramétricas de Larry Wasserman mencionadas.

Eu acho que é um ótimo livro de tamanho relativamente conciso. Especialmente se alguém já tem alguma experiência em estatística paramétrica, este livro oferece uma visão muito nova sobre " métodos estatísticos que visam manter o número de suposições subjacentes o mais fraco possível ". Achei menos prolixo que outros livros de introdução / cartilha; isso pode ser bom ou ruim, dependendo das preferências. O único "delta" contido neste livro é que ele realmente não cobre testes de classificação.

usεr11852
fonte
(+1) Parece que o livro "All of Statistics" de Wasserman também contém um tratamento, ainda que mais curto, das estatísticas não paramétricas. Ambos os livros, assim como muitos outros, são bons, mas IMHO é um exagero para pesquisadores / cientistas aplicados até certo ponto. Claro, não vai doer conhecer todos os teoremas e provas, mas isso é "bom de ter" ao invés de "necessário", considerando as limitações de tempo e escopo. Ainda estou para encontrar livros estatísticos equilibrados para cientistas aplicados (ou seja, suficientemente rigorosos sem entrar em detalhes muito profundos, além de úteis da perspectiva da aplicação).
Aleksandr Blekh