Alguém pode me explicar por que alguém escolheria um parâmetro paramétrico em vez de um método estatístico não paramétrico para teste de hipóteses ou análise de regressão?
Na minha opinião, é como fazer rafting e escolher um relógio não resistente à água, porque você pode não o molhar. Por que não usar a ferramenta que funciona em todas as ocasiões?
Respostas:
Raramente, se é que um teste paramétrico e não paramétrico, na verdade têm o mesmo nulo. O teste paramétrico está testando a média da distribuição, assumindo que os dois primeiros momentos existem. O teste de soma da classificação de Wilcoxon não assume nenhum momento e testa a igualdade de distribuições. Seu parâmetro implícito é uma estranha funcionalidade de distribuições, a probabilidade de que a observação de uma amostra seja menor que a observação da outra. Você pode falar sobre comparações entre os dois testes sob o nulo completamente especificado de distribuições idênticas ... mas você precisa reconhecer que os dois testes estão testando hipóteses diferentes.t
As informações que os testes paramétricos trazem, juntamente com suas suposições, ajudam a melhorar o poder dos testes. É claro que é melhor que essas informações estejam corretas, mas existem poucos ou nenhum domínio do conhecimento humano nos dias de hoje em que essas informações preliminares não existem. Uma exceção interessante que diz explicitamente "não quero assumir nada" é o tribunal onde os métodos não paramétricos continuam a ser amplamente populares - e faz todo o sentido para o aplicativo. Provavelmente, há uma boa razão, trocadilhos, de que Phillip Good tenha criado bons livros sobre estatísticas não paramétricas e estatísticas de tribunais .
Também existem situações de teste em que você não tem acesso aos microdados necessários para o teste não paramétrico. Suponha que você tenha sido solicitado a comparar dois grupos de pessoas para avaliar se um é mais obeso que o outro. Em um mundo ideal, você terá medidas de altura e peso para todos e poderá formar um teste de permutação estratificado por altura. Em um mundo abaixo do ideal (ou seja, real), você pode ter apenas a altura e o peso médios em cada grupo (ou pode haver algumas faixas ou variações dessas características no topo das médias da amostra). Sua melhor aposta é calcular o IMC médio de cada grupo e compará-lo se você tiver apenas os meios; ou assuma um normal bivariado para altura e peso se você tiver meios e variações (você provavelmente precisaria fazer uma correlação de alguns dados externos se eles não vierem com suas amostras),
fonte
Como outros escreveram: se as pré-condições forem atendidas, seu teste paramétrico será mais poderoso que o não-paramétrico.
Na analogia do seu relógio, o não resistente à água seria muito mais preciso, a menos que se molhasse. Por exemplo, seu relógio resistente à água pode estar desligado em uma hora de qualquer maneira, enquanto o relógio não resistente à água seria preciso ... e você precisará pegar um ônibus após sua viagem de rafting. Nesse caso, pode fazer sentido levar o relógio não resistente à água junto com você e garantir que ele não se molhe.
Ponto de bônus: métodos não paramétricos nem sempre são fáceis. Sim, uma alternativa de teste de permutação em teste é simples. Mas uma alternativa não paramétrica a um modelo linear misto com várias interações bidirecionais e efeitos aleatórios aninhados é um pouco mais difícil de configurar do que uma simples chamada
nlme()
. Fiz isso usando testes de permutação e, na minha experiência, os valores de p dos testes paramétricos e de permutação sempre estiveram bastante próximos, mesmo que os resíduos do modelo paramétrico não fossem normais. Testes paramétricos são frequentemente surpreendentemente resistentes a desvios de suas pré-condições.fonte
Embora eu concorde que, em muitos casos, as técnicas não paramétricas são favoráveis, também existem situações em que os métodos paramétricos são mais úteis.
Vamos nos concentrar na discussão "teste t de duas amostras versus teste da soma da classificação de Wilcoxon" (caso contrário, temos que escrever um livro inteiro).
fonte
No teste de hipóteses, os testes não paramétricos geralmente testam hipóteses diferentes, e é uma das razões pelas quais nem sempre é possível substituir um teste não paramétrico por um teste paramétrico.
De um modo mais geral, os procedimentos paramétricos fornecem uma maneira de impor estrutura a problemas não estruturados. Isso é muito útil e pode ser visto como um tipo de heurística simplificadora, e não como uma crença de que o modelo é literalmente verdadeiro. Tomemos, por exemplo, o problema de prever uma resposta contínua base em um vetor de preditores usando alguma função de regressão (mesmo assumindo que tal função exista é um tipo de restrição paramétrica). Se não assumirmos absolutamente nada sobrey x f f então não está nada claro como podemos proceder na estimativa dessa função. O conjunto de respostas possíveis que precisamos pesquisar é muito grande. Mas se restringirmos o espaço de respostas possíveis (por exemplo) ao conjunto de funções lineares , então podemos realmente começar a progredir. Não precisamos acreditar que o modelo se mantém exatamente, estamos apenas fazendo uma aproximação devido à necessidade de chegar a alguma resposta, por mais imperfeita que seja.f(x)=∑pj=1βjxj
fonte
Modelos semiparamétricos têm muitas vantagens. Eles oferecem testes como o teste de Wilcoxon como um caso especial, mas permitem a estimativa de taxas de efeito, quantis, médias e probabilidades de excedência. Eles se estendem a dados longitudinais e censurados. Eles são robustos no espaço Y e são invariantes à transformação, exceto pelos meios de estimativa. Veja o link http://biostat.mc.vanderbilt.edu/rms para folhetos de cursos para um exemplo / estudo de caso detalhado.
Em contraste com os métodos totalmente paramétricos ( teste , regressão múltipla comum, modelos de efeitos mistos, modelos de sobrevivência paramétricos etc.), os métodos semiparamétricos para ordinal ou contínuo não assumem nada sobre a distribuição de para um dado , nem que a distribuição é unimodal ou suave. A distribuição pode até ter picos severos dentro dela ou nos limites. Os modelos semiparamétricos assumem apenas uma conexão (por exemplo, exponenciação no caso de um modelo de Cox) entre distribuições para duas configurações covariáveis diferentes et Y Y X X1 X2 . Exemplos incluem o modelo de chances proporcionais (caso especial: Wilcoxon e Kruskal-Wallis) e o modelo de riscos proporcionais (caso especial: log-rank e teste estratificado de log-rank).
Com efeito, os modelos semiparamétricos têm muitas interceptações. Essas interceptações codificam a distribuição de não parametricamente. No entanto, isso não cria nenhum problema com excesso de parametrização.Y
fonte
Entre as respostas fornecidas, eu também chamaria atenção para as estatísticas bayesianas. Alguns problemas não podem ser respondidos apenas pelas probabilidades. Um freqüentista usa raciocínio contrafactual, onde a "probabilidade" refere-se a universos alternativos e uma estrutura de universo alternativo não faz sentido na medida em inferir o estado de um indivíduo, como a culpa ou inocência de um criminoso, ou se o gargalo da frequência do gene em um espécies expostas a uma enorme mudança ambiental levaram à sua extinção. No contexto bayesiano, probabilidade é "crença", não frequência, que pode ser aplicada àquilo que já precipitou.
Agora, a maioria dos métodos bayesianos exige a especificação completa de modelos de probabilidade para o anterior e o resultado. E, a maioria desses modelos de probabilidade é paramétrica. Consistente com o que os outros estão dizendo, eles não precisam ser exatamente corretos para produzir resumos significativos dos dados. "Todos os modelos estão errados, alguns modelos são úteis."
Existem, é claro, métodos bayesianos não paramétricos. Eles têm muitas rugas estatísticas e, de um modo geral, exigem que dados populacionais quase abrangentes sejam usados de maneira significativa.
fonte
A única razão pela qual estou respondendo, apesar de todas as boas respostas acima, é que ninguém chamou a atenção para o motivo pelo qual usamos testes paramétricos (pelo menos na análise de dados da física de partículas). Porque sabemos a parametrização dos dados. Duh! Essa é uma grande vantagem. Você está resumindo suas centenas, milhares ou milhões de pontos de dados nos poucos parâmetros que lhe interessam e descrevem sua distribuição. Eles informam a física subjacente (ou o que a ciência fornecer aos seus dados).
Obviamente, se você não tem idéia da densidade de probabilidade subjacente, não tem escolha: use testes não paramétricos. Testes não paramétricos têm a virtude de não ter vieses preconcebidos, mas podem ser mais difíceis de implementar - às vezes muito mais difíceis.
fonte
Estatísticas não paramétricas têm seus próprios problemas! Uma delas é a ênfase no teste de hipóteses, geralmente precisamos de intervalos de estimativa e confiança, e colocá-los em modelos complicados com não paramétricos é --- complicado. Há uma publicação muito boa no blog sobre isso, com discussão, em http://andrewgelman.com/2015/07/13/dont-do-the-wilcoxon/ A discussão leva a outra publicação, http: // notstatschat. tumblr.com/post/63237480043/rock-paper-scissors-wilcoxon-test , recomendado para um ponto de vista muito diferente em Wilcoxon. A versão curta é: o Wilcoxon (e outros testes de classificação) podem levar à não-transgressividade.
fonte
Eu diria que as estatísticas não paramétricas são mais geralmente aplicáveis no sentido de que elas fazem menos suposições do que as estatísticas paramétricas.
No entanto, se alguém usar uma estatística paramétrica e as suposições subjacentes forem cumpridas, as estatísticas paramétricas serão mais poderosas do que as não paramétricas.
fonte
As estatísticas paramétricas geralmente são formas de incorporar conhecimento externo [aos dados]. Por exemplo, você sabe que a distribuição de erros é normal e esse conhecimento veio de experiências anteriores ou de alguma outra consideração e não do conjunto de dados. Nesse caso, ao assumir a distribuição normal, você está incorporando esse conhecimento externo em suas estimativas de parâmetros, o que deve melhorar suas estimativas.
Na analogia do seu relógio. Hoje em dia quase todos os relógios são resistentes à água, exceto peças especiais com jóias ou materiais incomuns como madeira. A razão para usá-los é exatamente isso: eles são especiais. Se você quis dizer prova de água, muitos relógios não são à prova d'água. O motivo para usá-los é novamente a sua função: você não usaria um relógio de mergulhador com suíte e gravata. Além disso, atualmente, muitos relógios abrem para trás, para que você possa apreciar o movimento através do cristal. Naturalmente, esses relógios geralmente não são à prova de água.
fonte
Este não é um cenário de teste de hipóteses, mas pode ser um bom exemplo para responder sua pergunta: vamos considerar a análise de cluster. Existem muitos métodos de cluster "não paramétricos", como cluster hierárquico, meios K, etc., mas o problema sempre é como avaliar se sua solução de cluster é "melhor" do que outras soluções possíveis (e muitas vezes existem várias soluções possíveis) . Cada algoritmo oferece o melhor possível, no entanto, como você sabe se não há nada melhor ..? Agora, também existem abordagens paramétricas para clustering, o chamado clustering baseado em modelo, como modelos de mistura finita. Com o FMM, você constrói um modelo estatístico que descreve a distribuição de seus dados e os ajusta aos dados. Quando você possui seu modelo, pode avaliar a probabilidade de seus dados, considerando esse modelo, pode usar testes de razão de verossimilhança, comparar AICs e usar vários outros métodos para verificar o ajuste e a comparação de modelos. Os algoritmos de agrupamento não paramétricos apenas agrupam dados usando alguns critérios de similaridade, enquanto que com o FMM, você pode descrever e tentar entender seus dados, verificar o quão bom ele se encaixa, fazer previsões ... Na prática, abordagens não paramétricas são simples, funcionam prontos para o uso e são muito bons, enquanto o FMM pode ser problemático, mas ainda assim, as abordagens baseadas em modelo geralmente fornecem uma saída mais rica.
fonte
As previsões e previsões para novos dados geralmente são muito difíceis ou impossíveis para modelos não paramétricos. Por exemplo, posso prever o número de solicitações de garantia para os próximos 10 anos usando um modelo de sobrevivência Weibull ou Lognormal; no entanto, isso não é possível usando o modelo Cox ou Kaplan-Meier.
Edit: Deixe-me ser um pouco mais claro. Se uma empresa possui um produto com defeito, geralmente está interessada em projetar a taxa de reclamação de garantia futura e o CDF com base nas reclamações de garantia atuais e nos dados de vendas. Isso pode ajudá-los a decidir se é necessário ou não um recall. Não sei como você faz isso usando um modelo não paramétrico.
fonte
Sinceramente, acredito que não há resposta certa para essa pergunta. A julgar pelas respostas dadas, o consenso é que os testes paramétricos são mais poderosos que os equivalentes não paramétricos. Não vou contestar essa visão, mas a vejo mais como um ponto de vista hipotético do que factual, já que não é algo explicitamente ensinado nas escolas e nenhum revisor de pares jamais lhe dirá "seu trabalho foi rejeitado porque você usou testes não paramétricos". Esta pergunta é sobre algo que o mundo das estatísticas não consegue responder claramente, mas que deu como certo.
Minha opinião pessoal é que a preferência de parâmetros paramétricos ou não paramétricos tem mais a ver com tradição do que qualquer outra coisa (por falta de um termo melhor). As técnicas paramétricas para teste e previsão estavam lá primeiro e têm uma longa história; portanto, não é fácil ignorá-las completamente. A previsão, em particular, possui algumas soluções não paramétricas impressionantes que são amplamente utilizadas como uma ferramenta de primeira escolha atualmente. Penso que esta é uma das razões pelas quais as técnicas de Aprendizado de Máquina, como redes neurais e árvores de decisão, que não são paramétricas por natureza, ganharam popularidade nos últimos anos.
fonte
É uma questão de poder estatístico. Testes não paramétricos geralmente têm menor poder estatístico do que seus equivalentes paramétricos.
fonte
Muitas respostas boas já, mas há algumas razões que eu não vi mencionadas:
Familiaridade. Dependendo do seu público, o resultado paramétrico pode ser muito mais familiar do que um resultado não paramétrico aproximadamente equivalente. Se os dois dão conclusões semelhantes, a familiaridade é boa.
Simplicidade. Às vezes, o teste paramétrico é mais simples de executar e relatar. Alguns métodos não paramétricos exigem muito computador. É claro que os computadores ficaram muito mais rápidos e os algoritmos também melhoraram, mas ... os dados ficaram "maiores".
fonte