Refiro-me a práticas que ainda mantêm sua presença, mesmo que os problemas (geralmente computacionais) para os quais foram projetados tenham sido resolvidos.
Por exemplo, a correção de continuidade de Yates foi inventada para aproximar o teste exato de Fisher com o teste , mas não é mais prático, pois o software agora pode lidar com o teste de Fisher mesmo com amostras grandes (sei que isso pode não ser um bom exemplo de " mantendo sua presença ", uma vez que os livros didáticos, como a Análise de dados categóricos da Agresti , muitas vezes reconhecem que a correção de Yates" não é mais necessária ").
Quais são alguns outros exemplos de tais práticas?
references
philosophical
Francis
fonte
fonte
Respostas:
É altamente discutível que o uso de níveis de significância de limite, como ou seja uma ressaca histórica de um período em que a maioria dos pesquisadores dependia de tabelas de valores críticos previamente calculadas. Agora, um bom software fornecerá valores de diretamente. De fato, um bom software permite personalizar sua análise e não depender de testes de livros didáticos.P = 0,01 PP= 0,05 P=0.01 P
Isso é controverso apenas porque alguns problemas de teste de significância exigem decisões, como no controle de qualidade em que aceitar ou rejeitar um lote é a decisão necessária, seguida por uma ação de qualquer maneira. Mas mesmo lá os limites a serem usados devem crescer a partir de uma análise de risco, não depender da tradição. E frequentemente nas ciências, a análise de indicações quantitativas é mais apropriada do que decisões: pensar quantitativamente implica atenção nos tamanhos dos valores de e não apenas em uma dicotomia grosseira, significativa versus não significativa.P
Vou sinalizar que aqui abordo uma questão intrincada e controversa, que é o foco de livros inteiros e provavelmente de milhares de artigos, mas parece um bom exemplo para esse segmento.
fonte
Um método que eu acho que muitos visitantes deste site concordam comigo é a regressão gradual. É ainda feito tudo o tempo, mas você não tem que procurar muito para especialistas neste site dizendo deplorando seu uso. Um método como o LASSO é muito preferido.
fonte
Minha opinião é que, pelo menos na econometria (aplicada), é cada vez mais a norma usar a matriz de covariância robusta ou empírica, em vez da "prática anacrônica" de confiar (assintoticamente) na especificação correta da matriz de covariância. Obviamente, isso não é isento de controvérsia: veja algumas das respostas que eu vinculei aqui no CrossValidated, mas é certamente uma tendência clara.
Outros exemplos incluem dados de painel, Imbens e Wooldridge escrevem, por exemplo, em seus slides de palestras argumentam contra o uso da matriz de covariância de variância de efeitos aleatórios (assumindo implicitamente alguma especificação incorreta no componente de variância como padrão):
Usando modelos lineares generalizados (para distribuições que pertencem à família exponencial), geralmente é recomendável usar sempre o chamado estimador sanduíche, em vez de confiar em premissas distributivas corretas (a prática anacrônica aqui): veja, por exemplo, esta resposta ou Cameron referindo-se contar dados porque a estimativa de probabilidade pseudo-máxima pode ser bastante flexível no caso de erros de especificação (por exemplo, usando Poisson se o binômio negativo estiver correto).
Greene escreve em seu livro no Capítulo 14 (disponível em seu site), por exemplo, com uma nota crítica e detalha mais as vantagens e desvantagens dessa prática:
fonte
fonte
A maioria das práticas anacrônicas deve-se provavelmente à maneira como as estatísticas são ensinadas e ao fato de as análises serem realizadas por um grande número de pessoas que fizeram apenas algumas aulas básicas. Muitas vezes ensinamos um conjunto de idéias e procedimentos estatísticos padrão porque eles formam uma sequência lógica de crescente sofisticação conceitual que faz sentido pedagogicamente (cf. Como podemos conhecer a variação da população? ). Eu também sou culpado disso: ocasionalmente ensino estatísticas 101 e 102, e digo constantemente: 'há uma maneira melhor de fazer isso, mas está além do escopo desta classe'. Para os alunos que não vão além da sequência introdutória (quase todos), eles ficam com estratégias básicas, mas substituídas.
Para um exemplo estatístico, provavelmente a prática anacrônica mais comum é testar algumas suposições e, em seguida, executar uma análise estatística tradicional porque o teste não foi significativo. Uma abordagem mais moderna / avançada / defensável seria usar um método robusto para essa suposição desde o início. Algumas referências para mais informações:
Para exemplos de estatísticas 102, qualquer número de práticas de modelagem foi ultrapassado:
O ponto em todos esses casos é que as pessoas estão fazendo o que foi ensinado primeiro em uma aula introdutória porque simplesmente não conhecem métodos mais avançados e apropriados.
fonte
Um exemplo muito interessante são os testes de raiz unitária em econometria. Embora existam muitas opções disponíveis para testar contra ou para uma raiz de unidade no polinômio de atraso de uma série temporal (por exemplo, o teste Dickey Fuller (aumentado) ou o teste KPSS), o problema pode ser contornado completamente quando se usa a análise bayesiana . Sims apontou isso em seu artigo provocador intitulado Entendendo as Raízes das Unidades: Uma Volta de Helicóptero de 1991.
Os testes de raiz unitária permanecem válidos e utilizados em econometria. Embora eu pessoalmente atribuísse isso principalmente a pessoas relutantes em se adaptar às práticas bayesianas, muitos economistas conservadores defendem a prática de testes de raiz unitária dizendo que uma visão bayesiana do mundo contradiz a premissa da pesquisa econométrica. (Ou seja, os economistas pensam no mundo como um lugar com parâmetros fixos, não parâmetros aleatórios que são governados por algum hiperparâmetro.)
fonte
Pagar taxas de licenciamento por sistemas de software estatístico de alta qualidade. #R
fonte
O ensino / realização de testes bicaudais para a diferença sem testar simultaneamente a equivalência no campo freqüentista do teste de hipóteses é um profundo compromisso com o viés de confirmação .
Há algumas nuances, pois uma análise de poder apropriada, com definição cuidadosa do tamanho do efeito, pode proteger-se disso e fornecer mais ou menos os mesmos tipos de inferências, mas (a) as análises de poder são muitas vezes ignoradas na apresentação de descobertas, e (b) I ter Nunca visto uma análise de potência para, por exemplo, cada coeficiente de estimativa para cada variável de uma regressão múltipla, mas é fácil de fazer para os ensaios combinados de diferença e testes de equivalência (ou seja, de relevância testes).
fonte
Usando um modelo Binomial Negativo em vez de um modelo de Poisson (robusto) para identificar um parâmetro de interesse em uma variável de contagem, apenas porque há excesso de dispersão?
Veja como referência: https://blog.stata.com/2011/08/22/use-poisson-rather-than-regress-tell-a-friend/
A prova de que Poisson é mais robusto no caso de efeitos fixos é bastante recente, pois é ofensiva fazer referência a: Wooldridge, JM, "Estimativa sem distribuição de alguns modelos de dados não-lineares em painel", Journal of Econometrics 90 (1999), 77-97.
fonte
Aqui estão alguns anacronismos:
A suposição neoplatônica de que existe uma única população "verdadeira" no éter teórico que é eterna, fixa e imóvel contra a qual nossas amostras imperfeitas podem ser avaliadas faz pouco para promover o aprendizado e o conhecimento.
O reducionismo inerente a mandatos como o Navalha de Occam é inconsistente com os tempos. OU pode ser resumido como: "Entre hipóteses concorrentes, deve-se selecionar aquela com menos hipóteses". As alternativas incluem o Princípio das Múltiplas Explicações de Epicuro , que afirma aproximadamente: "Se mais de uma teoria for consistente com os dados, mantenha-as todas".
Todo o sistema de revisão por pares precisa desesperadamente de uma revisão.
* Editar *
Com dados massivos contendo dezenas de milhões de recursos, não há mais necessidade de uma fase de seleção variável.
Além disso, as estatísticas inferenciais não têm sentido.
fonte