Qual é a diferença entre estatísticas / métodos livres de distribuição e estatísticas não paramétricas?

12

Da Wikipedia

O primeiro significado de não paramétrico abrange técnicas que não dependem de dados pertencentes a nenhuma distribuição específica. Estes incluem, entre outros:

  • métodos livres de distribuição, que não se baseiam em suposições de que os dados são extraídos de uma determinada distribuição de probabilidade. Como tal, é o oposto das estatísticas paramétricas. Inclui modelos estatísticos não paramétricos, inferência e testes estatísticos.
  • estatística não paramétrica (no sentido de uma estatística sobre dados, que é definida como uma função em uma amostra que não depende de um parâmetro), cuja interpretação não depende da população que se encaixa em distribuições parametrizadas. As estatísticas baseadas nas fileiras de observações são um exemplo dessas estatísticas e desempenham um papel central em muitas abordagens não paramétricas.

Não vejo a diferença entre os dois casos: métodos livres de distribuição e estatísticas não paramétricas. Ambos não assumem os dados provenientes de alguma distribuição? Como eles diferem?

Obrigado e cumprimentos!

Tim
fonte
1
A definição que você cita sugere que o segundo é um subconjunto do primeiro, mas como eles realmente os definiram lá (eu trocaria algumas partes dessas definições para o outro termo!) - e geralmente na prática - elas parecem ser usado de forma intercambiável. Não paramétrico, nesse sentido, significa basicamente 'infinito-paramétrico', enquanto métodos livres de distribuição são aqueles cuja implementação e propriedades como distribuições nulas não dependem da forma distributiva. Alguns livros fazem uma distinção entre os dois; se eu pensar em uma referência, voltarei e a adicionarei.
Glen_b -Reinstate Monica
@Glen_b: Obrigado! Algumas referências também seriam apreciadas!
Tim
@ Glen_b: Por que "o segundo é um subconjunto do primeiro"? Eu sinto o contrário. Você poderia me informar algumas referências? Obrigado!
Tim
"Inclui modelos estatísticos não paramétricos" é o que dá essa impressão. Referências sobre definições dos termos? Vários livros sobre estatísticas livres de distribuição / não paramétricas tentam definições ou distinções; faz muito tempo que não leio vários deles, mas livros comuns como Conover, Bradley, Daniel, Marascuilo e McSweeney, Lindley seriam um começo. Desses, eu estaria inclinado a verificar Bradley primeiro. Só tenho Conover e Neave & Worthington em mãos; Não encontrei uma definição em poucos minutos olhando - para minha surpresa; Eu pensei que ambos teriam alguma coisa.
Glen_b -Reinstala Monica 10/03
@Glen_b: Obrigado! Você acha que algum dos dois significados para estatísticas não paramétricas na citação tem algo a ver com estatísticas sem distribuição?
Tim

Respostas:

5

Um exemplo ilustrativo da diferença - comparando amostras de duas populações.

Com a primeira definição, você ainda pode comparar as médias das duas populações, de alguma forma usando as amostras para extrair inferências (por exemplo, comparando as médias amostrais). As médias da população são parâmetros, mas você não faz suposições sobre a distribuição (por exemplo, você não assume que a população é normalmente distribuída). Portanto, esta é uma estatística "livre de distribuição". Eu, não acho que isso deva ser chamado de parte de estatísticas não paramétricas - por causa da óbvia contradição lógica.

Sob a segunda definição, você não considera a média da população ou qualquer outro parâmetro. Em vez disso, você usa métodos como comparações de classificações. Esta é uma estatística não paramétrica verdadeira.

Peter Ellis
fonte
Obrigado! Nos dois casos, as distribuições de suas estatísticas não se baseiam na verdadeira distribuição da amostra?
Tim
Você concorda com Glen_b que "o segundo é um subconjunto do primeiro"?
Tim
Tim, não acho que o segundo seja um subconjunto do primeiro; releia meu comentário e você verá que não foi nada disso que eu disse. Eu estava descrevendo o que o que você citou parecia estar dizendo. Se eu disser "Parece que Bill pensa em X", não significa "Glen_b pensa em X". Eu posso pensar em nada disso.
Glen_b -Reinstala Monica 10/03
1
Independentemente de quem (se houver) pensa assim, não, o segundo caso não é um subconjunto do primeiro. O segundo caso exclui explicitamente o interesse em parâmetros, que são o foco do primeiro.
Peter Ellis
@PeterEllis Esse é um bom ponto
Glen_b -Reinstate Monica 10/13