Por que as estatísticas paramétricas seriam preferidas às não paramétricas?

60

Alguém pode me explicar por que alguém escolheria um parâmetro paramétrico em vez de um método estatístico não paramétrico para teste de hipóteses ou análise de regressão?

Na minha opinião, é como fazer rafting e escolher um relógio não resistente à água, porque você pode não o molhar. Por que não usar a ferramenta que funciona em todas as ocasiões?

en1
fonte
21
É introduzir viés indutivo no processo de inferência estatística. Essa é uma maneira elegante de dizer: se você souber alguma coisa, forneça como uma dica. Essa dica pode assumir formas como fornecer a forma funcional de probabilidade ou distribuição prévia nos parâmetros. Se a sua dica for boa, o resultado será melhor do que sem uma dica, e se for ruim, o resultado será pior.
Cagdas Ozgenc
6
Não necessariamente. Basicamente, você está procurando algo em uma sobremesa muito grande. Se alguém lhe disser que o que você está procurando está confinado em um determinado território, suas chances de encontrá-lo aumentam. Mas se eles o enganarem com informações erradas, não importa o quanto você procure naquele território, você não o encontrará.
Cagdas Ozgenc
17
Como marceneiro, adoro a analogia no final. Casas e móveis bem construídos e os últimos são construídos usando ferramentas especializadas. As ferramentas de uso geral são ótimas para os proprietários de casas e para os profissionais que precisam fazer um trabalho rapidamente ou quando usar uma ferramenta bruta ou inadequada não fará diferença na qualidade com a qual ninguém se importa. Os artesãos, no entanto, alcançam os melhores resultados empregando a ferramenta certa para o trabalho e, de fato, algumas coisas simplesmente não podem ser feitas sem ela. Ninguém jamais fez um bom encaixe com uma serra manual de uso geral, por exemplo.
whuber
3
Se você cavar uma vala com uma pá ou uma colher de chá, você acaba com uma vala. Só que se você usou a colher de chá, você também é mais velho.
conjugateprior
5
Relacionado (embora talvez não seja obviamente assim): Se a média é tão sensível, por que usá-la em primeiro lugar?
gung - Restabelece Monica

Respostas:

25

Raramente, se é que um teste paramétrico e não paramétrico, na verdade têm o mesmo nulo. O teste paramétrico está testando a média da distribuição, assumindo que os dois primeiros momentos existem. O teste de soma da classificação de Wilcoxon não assume nenhum momento e testa a igualdade de distribuições. Seu parâmetro implícito é uma estranha funcionalidade de distribuições, a probabilidade de que a observação de uma amostra seja menor que a observação da outra. Você pode falar sobre comparações entre os dois testes sob o nulo completamente especificado de distribuições idênticas ... mas você precisa reconhecer que os dois testes estão testando hipóteses diferentes.t

As informações que os testes paramétricos trazem, juntamente com suas suposições, ajudam a melhorar o poder dos testes. É claro que é melhor que essas informações estejam corretas, mas existem poucos ou nenhum domínio do conhecimento humano nos dias de hoje em que essas informações preliminares não existem. Uma exceção interessante que diz explicitamente "não quero assumir nada" é o tribunal onde os métodos não paramétricos continuam a ser amplamente populares - e faz todo o sentido para o aplicativo. Provavelmente, há uma boa razão, trocadilhos, de que Phillip Good tenha criado bons livros sobre estatísticas não paramétricas e estatísticas de tribunais .

Também existem situações de teste em que você não tem acesso aos microdados necessários para o teste não paramétrico. Suponha que você tenha sido solicitado a comparar dois grupos de pessoas para avaliar se um é mais obeso que o outro. Em um mundo ideal, você terá medidas de altura e peso para todos e poderá formar um teste de permutação estratificado por altura. Em um mundo abaixo do ideal (ou seja, real), você pode ter apenas a altura e o peso médios em cada grupo (ou pode haver algumas faixas ou variações dessas características no topo das médias da amostra). Sua melhor aposta é calcular o IMC médio de cada grupo e compará-lo se você tiver apenas os meios; ou assuma um normal bivariado para altura e peso se você tiver meios e variações (você provavelmente precisaria fazer uma correlação de alguns dados externos se eles não vierem com suas amostras),

StasK
fonte
3
Entendo que, no caso de teste, você não tem o mesmo nulo, embora não tenha certeza se faz algum sentido dizer que um nulo é melhor que outro nulo. Mas e o caso da previsão? História completamente diferente, dilema ainda paramétrico x não paramétrico.
EN1
22

Como outros escreveram: se as pré-condições forem atendidas, seu teste paramétrico será mais poderoso que o não-paramétrico.

Na analogia do seu relógio, o não resistente à água seria muito mais preciso, a menos que se molhasse. Por exemplo, seu relógio resistente à água pode estar desligado em uma hora de qualquer maneira, enquanto o relógio não resistente à água seria preciso ... e você precisará pegar um ônibus após sua viagem de rafting. Nesse caso, pode fazer sentido levar o relógio não resistente à água junto com você e garantir que ele não se molhe.


Ponto de bônus: métodos não paramétricos nem sempre são fáceis. Sim, uma alternativa de teste de permutação em teste é simples. Mas uma alternativa não paramétrica a um modelo linear misto com várias interações bidirecionais e efeitos aleatórios aninhados é um pouco mais difícil de configurar do que uma simples chamada nlme(). Fiz isso usando testes de permutação e, na minha experiência, os valores de p dos testes paramétricos e de permutação sempre estiveram bastante próximos, mesmo que os resíduos do modelo paramétrico não fossem normais. Testes paramétricos são frequentemente surpreendentemente resistentes a desvios de suas pré-condições.

S. Kolassa - Restabelecer Monica
fonte
Parece que a visão predominante de que os métodos paramétricos são mais poderosos quando suas suposições são atendidas. Mas se for esse o caso, como é que temos valores-p para avaliar os resultados de ambas as abordagens? Quero dizer, se um teste paramétrico rejeita uma hipótese nula com uma probabilidade de pelo menos 99%, como isso é melhor em um teste não paramétrico que rejeita uma hipótese nula com uma probabilidade de 99%? A probabilidade de 0,99 é diferente em cada caso? Isso não faria sentido.
en1 30/07/2015
11
As hipóteses nulas são diferentes entre um teste paramétrico e sua contraparte não paramétrica. Especificamente, a hipótese nula para um teste paramétrico contém uma suposição paramétrica específica na distribuição da estatística do teste (que geralmente também será calculada de maneiras diferentes para os dois testes) - é por isso que é chamada de "paramétrica", afinal! Portanto, os dois valores de p têm o mesmo nome, mas são calculados com base em diferentes estatísticas de teste, que têm distribuições diferentes sob diferentes hipóteses nulas.
S. Kolassa - Restabelece Monica
... e o @StasK expressou tudo muito melhor do que eu .
S. Kolassa - Restabelece Monica
3
@StephanKolassa, eu realmente comecei a escrever um comentário para a sua resposta, e me empolguei :)
Stask
12

Embora eu concorde que, em muitos casos, as técnicas não paramétricas são favoráveis, também existem situações em que os métodos paramétricos são mais úteis.

Vamos nos concentrar na discussão "teste t de duas amostras versus teste da soma da classificação de Wilcoxon" (caso contrário, temos que escrever um livro inteiro).

  1. Com pequenos grupos de 2-3, apenas o teste t pode teoricamente atingir valores de p abaixo de 5%. Em biologia e química, tamanhos de grupos como esse não são incomuns. É claro que é delicado usar um teste t nesse cenário. Mas talvez seja melhor que nada. (Este ponto está ligado à questão de que, em circunstâncias perfeitas, o teste t tem mais poder do que o teste de Wilcoxon).
  2. Com grandes tamanhos de grupo, também um teste t pode ser visto como não paramétrico, graças ao Teorema do Limite Central.
  3. Os resultados do teste t estão alinhados com o intervalo de confiança do aluno para a diferença média.
  4. Se as variações variam muito entre os grupos, a versão de Welch do teste t tenta levar isso em consideração, enquanto o teste de soma de classificação de Wilcoxon pode falhar muito se os meios forem comparados (por exemplo, probabilidade de erro do primeiro tipo muito diferente do nível nominal )
Michael M
fonte
2
Eu discordo de 1. Simplesmente usar um procedimento porque ele permite que você tome uma decisão não é realmente uma boa razão, especialmente quando você não tem motivos para esperar que esse procedimento seja válido. Se você tem poucos ou nenhum dado, faça um julgamento e não finja que ele se baseia no rigor.
dsaxton
5
Eu concordo com você. É claramente uma das razões pelas quais os resultados geralmente não são reproduzíveis, mesmo se publicados em periódicos de maior classificação. Mas que opções você tem como pesquisador se o orçamento permite apenas pequenas amostras?
Michael M
11
Re 4 e os problemas da aplicação de Wilcoxon-Mann-Whitney quando existem variações desiguais entre os grupos, existem métodos não paramétricos que permitem a heterocedasticidade: pareço relembrar o teste de Cliff ou o teste de Brunner-Munzel, por exemplo. (Eu não acho que nós temos um monte de informações sobre eles neste site.)
Silverfish
@ Silverfish: Eu frequentemente uso os métodos de Brunner e acho que você está certo. Mas duvido que eles estejam realmente comparando meios, exceto quando fazem fortes suposições distributivas.
Michael M
11
@MichaelM Sim, é claro - isso volta à questão dos métodos paramétricos e não paramétricos com hipóteses diferentes, eu acho.
Silverfish 31/07
9

No teste de hipóteses, os testes não paramétricos geralmente testam hipóteses diferentes, e é uma das razões pelas quais nem sempre é possível substituir um teste não paramétrico por um teste paramétrico.

De um modo mais geral, os procedimentos paramétricos fornecem uma maneira de impor estrutura a problemas não estruturados. Isso é muito útil e pode ser visto como um tipo de heurística simplificadora, e não como uma crença de que o modelo é literalmente verdadeiro. Tomemos, por exemplo, o problema de prever uma resposta contínua base em um vetor de preditores usando alguma função de regressão (mesmo assumindo que tal função exista é um tipo de restrição paramétrica). Se não assumirmos absolutamente nada sobreyxffentão não está nada claro como podemos proceder na estimativa dessa função. O conjunto de respostas possíveis que precisamos pesquisar é muito grande. Mas se restringirmos o espaço de respostas possíveis (por exemplo) ao conjunto de funções lineares , então podemos realmente começar a progredir. Não precisamos acreditar que o modelo se mantém exatamente, estamos apenas fazendo uma aproximação devido à necessidade de chegar a alguma resposta, por mais imperfeita que seja.f(x)=j=1pβjxj

dsaxton
fonte
Sim, e isso adiciona um viés de modelo. O que isso diz sobre os relatórios de pesquisadores de valores-p?
Cagdas Ozgenc
@dsaxton O que você diz é verdade sobre o teste de diferentes hipóteses, mas as pessoas ainda as interpretam da mesma maneira. Depois, há também a regressão, na qual os insights obtidos entre análises não paramétricas e paramétricas são praticamente os mesmos.
en1 30/07/2015
@ cagdas-ozgenc Informa que os valores-p são condicionais no modelo. Mas não está claro como as coisas poderiam ser de outra forma ...
conjugateprior
3
+1 por observar que não temos absolutamente nenhuma chance de estimar algo de valor em uma regressão sem algumas suposições sobre a função de regressão.
conjugateprior
9

Modelos semiparamétricos têm muitas vantagens. Eles oferecem testes como o teste de Wilcoxon como um caso especial, mas permitem a estimativa de taxas de efeito, quantis, médias e probabilidades de excedência. Eles se estendem a dados longitudinais e censurados. Eles são robustos no espaço Y e são invariantes à transformação, exceto pelos meios de estimativa. Veja o link http://biostat.mc.vanderbilt.edu/rms para folhetos de cursos para um exemplo / estudo de caso detalhado.

Em contraste com os métodos totalmente paramétricos ( teste , regressão múltipla comum, modelos de efeitos mistos, modelos de sobrevivência paramétricos etc.), os métodos semiparamétricos para ordinal ou contínuo não assumem nada sobre a distribuição de para um dado , nem que a distribuição é unimodal ou suave. A distribuição pode até ter picos severos dentro dela ou nos limites. Os modelos semiparamétricos assumem apenas uma conexão (por exemplo, exponenciação no caso de um modelo de Cox) entre distribuições para duas configurações covariáveis ​​diferentes etYYXX1X2. Exemplos incluem o modelo de chances proporcionais (caso especial: Wilcoxon e Kruskal-Wallis) e o modelo de riscos proporcionais (caso especial: log-rank e teste estratificado de log-rank).

Com efeito, os modelos semiparamétricos têm muitas interceptações. Essas interceptações codificam a distribuição de não parametricamente. No entanto, isso não cria nenhum problema com excesso de parametrização.Y

Frank Harrell
fonte
11
Eu tenho lutado com isso um pouco. Você considera o teste t semi-paramétrico ou não-paramétrico? Por um lado, sempre presumi que o 'jist' dos semi-paramétricos é o seguinte: adote um modelo de probabilidade "funcional" para os dados, estime parâmetros nessa distribuição, independentemente de a distribuição estar correta, e melhore a estimativa de erros para são responsáveis ​​pela incerteza. (Portanto, erros baseados em sanduíche para soluções para equações de pontuação gaussiana seriam um teste T semi-paramétrico). No entanto, semi-paramétricos quase sempre envolvem a parcialização / condicionamento de algo, como nos modelos de Cox.
Adamo
Vou adicionar mais descrição à minha resposta para lidar com isso.
Frank Harrell
6

Entre as respostas fornecidas, eu também chamaria atenção para as estatísticas bayesianas. Alguns problemas não podem ser respondidos apenas pelas probabilidades. Um freqüentista usa raciocínio contrafactual, onde a "probabilidade" refere-se a universos alternativos e uma estrutura de universo alternativo não faz sentido na medida em inferir o estado de um indivíduo, como a culpa ou inocência de um criminoso, ou se o gargalo da frequência do gene em um espécies expostas a uma enorme mudança ambiental levaram à sua extinção. No contexto bayesiano, probabilidade é "crença", não frequência, que pode ser aplicada àquilo que já precipitou.

Agora, a maioria dos métodos bayesianos exige a especificação completa de modelos de probabilidade para o anterior e o resultado. E, a maioria desses modelos de probabilidade é paramétrica. Consistente com o que os outros estão dizendo, eles não precisam ser exatamente corretos para produzir resumos significativos dos dados. "Todos os modelos estão errados, alguns modelos são úteis."

Existem, é claro, métodos bayesianos não paramétricos. Eles têm muitas rugas estatísticas e, de um modo geral, exigem que dados populacionais quase abrangentes sejam usados ​​de maneira significativa.

AdamO
fonte
6

A única razão pela qual estou respondendo, apesar de todas as boas respostas acima, é que ninguém chamou a atenção para o motivo pelo qual usamos testes paramétricos (pelo menos na análise de dados da física de partículas). Porque sabemos a parametrização dos dados. Duh! Essa é uma grande vantagem. Você está resumindo suas centenas, milhares ou milhões de pontos de dados nos poucos parâmetros que lhe interessam e descrevem sua distribuição. Eles informam a física subjacente (ou o que a ciência fornecer aos seus dados).

Obviamente, se você não tem idéia da densidade de probabilidade subjacente, não tem escolha: use testes não paramétricos. Testes não paramétricos têm a virtude de não ter vieses preconcebidos, mas podem ser mais difíceis de implementar - às vezes muito mais difíceis.

Tempo variável
fonte
5

Estatísticas não paramétricas têm seus próprios problemas! Uma delas é a ênfase no teste de hipóteses, geralmente precisamos de intervalos de estimativa e confiança, e colocá-los em modelos complicados com não paramétricos é --- complicado. Há uma publicação muito boa no blog sobre isso, com discussão, em http://andrewgelman.com/2015/07/13/dont-do-the-wilcoxon/ A discussão leva a outra publicação, http: // notstatschat. tumblr.com/post/63237480043/rock-paper-scissors-wilcoxon-test , recomendado para um ponto de vista muito diferente em Wilcoxon. A versão curta é: o Wilcoxon (e outros testes de classificação) podem levar à não-transgressividade.

kjetil b halvorsen
fonte
4
Não tenho certeza de que a transitividade seja o fim e o tudo. E você pode inverter o teste de Wilcoxon para obter um intervalo de confiança do estimador de localização muito robusto e útil.
31715 Frank15
2
A não tradução tem seus pontos na modelagem causal, mas para testes simples de duas amostras de associação, não acho que seja realmente um problema. Além disso, não vejo as diferenças nos intervalos de teste / estimativa / confiança entre métodos não paramétricos e paramétricos. Às vezes, com uma estimativa robusta, você usa um modelo de probabilidade de trabalho para que a estimativa paramétrica correspondente forneça um resumo significativo dos dados (mesmo que não seja o modelo de probabilidade correto por si só). Talvez você possa expandir esta resposta?
Adamo
2
Geralmente, algumas suposições extras são feitas para o teste de Wilcoxon, por exemplo, dominância estocástica de um grupo sobre o outro, que, se verdadeiro, recupera a transitividade.
Scortchi - Restabelece Monica
3

Eu diria que as estatísticas não paramétricas são mais geralmente aplicáveis ​​no sentido de que elas fazem menos suposições do que as estatísticas paramétricas.

No entanto, se alguém usar uma estatística paramétrica e as suposições subjacentes forem cumpridas, as estatísticas paramétricas serão mais poderosas do que as não paramétricas.


fonte
2

As estatísticas paramétricas geralmente são formas de incorporar conhecimento externo [aos dados]. Por exemplo, você sabe que a distribuição de erros é normal e esse conhecimento veio de experiências anteriores ou de alguma outra consideração e não do conjunto de dados. Nesse caso, ao assumir a distribuição normal, você está incorporando esse conhecimento externo em suas estimativas de parâmetros, o que deve melhorar suas estimativas.

Na analogia do seu relógio. Hoje em dia quase todos os relógios são resistentes à água, exceto peças especiais com jóias ou materiais incomuns como madeira. A razão para usá-los é exatamente isso: eles são especiais. Se você quis dizer prova de água, muitos relógios não são à prova d'água. O motivo para usá-los é novamente a sua função: você não usaria um relógio de mergulhador com suíte e gravata. Além disso, atualmente, muitos relógios abrem para trás, para que você possa apreciar o movimento através do cristal. Naturalmente, esses relógios geralmente não são à prova de água.

Aksakal
fonte
11
Eu gosto dessa metáfora! Lembro-me de um professor nos disse que deveríamos tentar diferentes métodos estatísticos na mesma coisa para ver se conseguimos obter os mesmos resultados.
Deep North
2

Este não é um cenário de teste de hipóteses, mas pode ser um bom exemplo para responder sua pergunta: vamos considerar a análise de cluster. Existem muitos métodos de cluster "não paramétricos", como cluster hierárquico, meios K, etc., mas o problema sempre é como avaliar se sua solução de cluster é "melhor" do que outras soluções possíveis (e muitas vezes existem várias soluções possíveis) . Cada algoritmo oferece o melhor possível, no entanto, como você sabe se não há nada melhor ..? Agora, também existem abordagens paramétricas para clustering, o chamado clustering baseado em modelo, como modelos de mistura finita. Com o FMM, você constrói um modelo estatístico que descreve a distribuição de seus dados e os ajusta aos dados. Quando você possui seu modelo, pode avaliar a probabilidade de seus dados, considerando esse modelo, pode usar testes de razão de verossimilhança, comparar AICs e usar vários outros métodos para verificar o ajuste e a comparação de modelos. Os algoritmos de agrupamento não paramétricos apenas agrupam dados usando alguns critérios de similaridade, enquanto que com o FMM, você pode descrever e tentar entender seus dados, verificar o quão bom ele se encaixa, fazer previsões ... Na prática, abordagens não paramétricas são simples, funcionam prontos para o uso e são muito bons, enquanto o FMM pode ser problemático, mas ainda assim, as abordagens baseadas em modelo geralmente fornecem uma saída mais rica.

Tim
fonte
2

As previsões e previsões para novos dados geralmente são muito difíceis ou impossíveis para modelos não paramétricos. Por exemplo, posso prever o número de solicitações de garantia para os próximos 10 anos usando um modelo de sobrevivência Weibull ou Lognormal; no entanto, isso não é possível usando o modelo Cox ou Kaplan-Meier.

Edit: Deixe-me ser um pouco mais claro. Se uma empresa possui um produto com defeito, geralmente está interessada em projetar a taxa de reclamação de garantia futura e o CDF com base nas reclamações de garantia atuais e nos dados de vendas. Isso pode ajudá-los a decidir se é necessário ou não um recall. Não sei como você faz isso usando um modelo não paramétrico.

Glen
fonte
7
Eu peço desculpa mas não concordo. Você pode usar um modelo de Cox para estimar quantis, média (se o valor mais alto de Y não for censurado) e todos os tipos de probabilidades. Não conseguir prever além do intervalo de dados é um problema (como você mencionou), mas você pode estar perigosamente extrapolando.
31715 Frank15
@FrankHarrell Sim, bom ponto, sempre deve ter cuidado ao extrapolar.
30515 Glen
E quanto à floresta aleatória, aprendizagem profunda ou SVM? Eles vencem a maioria, se não todos, os métodos paramétricos de previsão.
EN1
2
Exceto tentar fazer uma árvore de decisão aprender um limite diagonal
bill_e
1

Sinceramente, acredito que não há resposta certa para essa pergunta. A julgar pelas respostas dadas, o consenso é que os testes paramétricos são mais poderosos que os equivalentes não paramétricos. Não vou contestar essa visão, mas a vejo mais como um ponto de vista hipotético do que factual, já que não é algo explicitamente ensinado nas escolas e nenhum revisor de pares jamais lhe dirá "seu trabalho foi rejeitado porque você usou testes não paramétricos". Esta pergunta é sobre algo que o mundo das estatísticas não consegue responder claramente, mas que deu como certo.

Minha opinião pessoal é que a preferência de parâmetros paramétricos ou não paramétricos tem mais a ver com tradição do que qualquer outra coisa (por falta de um termo melhor). As técnicas paramétricas para teste e previsão estavam lá primeiro e têm uma longa história; portanto, não é fácil ignorá-las completamente. A previsão, em particular, possui algumas soluções não paramétricas impressionantes que são amplamente utilizadas como uma ferramenta de primeira escolha atualmente. Penso que esta é uma das razões pelas quais as técnicas de Aprendizado de Máquina, como redes neurais e árvores de decisão, que não são paramétricas por natureza, ganharam popularidade nos últimos anos.

Digio
fonte
3
"o consenso é que os testes paramétricos são mais poderosos que os não paramétricos": os testes não paramétricos geralmente têm menor poder quando as suposições do teste paramétrico estão corretas , essencialmente porque essas suposições significam que os testes paramétricos têm um avanço (informações adicionais sobre a verdadeira distribuição) . Mas, especialmente em amostras grandes, a perda de potência pode ser pequena : Wilcoxon é tão eficiente quanto o teste t em amostras grandes, se a normalidade se mantiver. Se as suposições não forem atendidas, os testes não paramétricos podem ser muito mais poderosos! 3/π95%
Silverfish
"Consenso" significa "acordo geral", não minha visão pessoal.
Digio 11/08/15
2
Não estava me referindo se a afirmação representava sua própria visão pessoal ou a sabedoria coletiva dos outros, apenas apontando que a afirmação só está correta se as condições necessárias para um teste paramétrico se mantiverem verdadeiras . Quando as condições não se mantêm, pode não ser mais o caso de "testes paramétricos serem mais poderosos que os não paramétricos" e, de fato, o inverso pode ser o caso (às vezes por uma margem muito ampla).
Silverfish
Touché! ..... +1
Digio 19/08/2015
0

É uma questão de poder estatístico. Testes não paramétricos geralmente têm menor poder estatístico do que seus equivalentes paramétricos.

Hidden Markov Model
fonte
6
Os testes paramétricos terão mais poder quando suas suposições forem atendidas. Quando suas suposições não são atendidas, os testes não paramétricos podem ser mais poderosos.
gung - Restabelece Monica
3
Essa resposta é muito curta e o poder foi discutido nas respostas anteriores. Você consideraria expandi-lo um pouco?
Scortchi - Restabelece Monica
4
O ganho de potência dos testes paramétricos é minúsculo quando comparado à perda de potência que eles sofrem quando suas suposições não são atendidas.
31815 Frank Harrell
Frank, depende do teste, alguns testes são mais robustos a violações de suas suposições.
Markov escondido modelo
0

Muitas respostas boas já, mas há algumas razões que eu não vi mencionadas:

  1. Familiaridade. Dependendo do seu público, o resultado paramétrico pode ser muito mais familiar do que um resultado não paramétrico aproximadamente equivalente. Se os dois dão conclusões semelhantes, a familiaridade é boa.

  2. Simplicidade. Às vezes, o teste paramétrico é mais simples de executar e relatar. Alguns métodos não paramétricos exigem muito computador. É claro que os computadores ficaram muito mais rápidos e os algoritmos também melhoraram, mas ... os dados ficaram "maiores".

    1. Às vezes, o que geralmente é uma desvantagem do teste paramétrico é realmente uma vantagem, embora isso seja específico para pares de testes específicos. Por exemplo, sou geralmente fã de regressão quantílica, pois faz menos suposições do que os métodos usuais. Mas às vezes você realmente precisa estimar a média, e não a mediana.
Peter Flom - Restabelece Monica
fonte