É sabido que os pesquisadores devem gastar tempo observando e explorando dados e pesquisas existentes antes de formar uma hipótese e, em seguida, coletar dados para testar essa hipótese (referindo-se ao teste de significância de hipótese nula). Muitos livros estatísticos básicos alertam que as hipóteses devem ser formadas a priori e não podem ser alteradas após a coleta de dados, caso contrário a metodologia se tornará inválida.
Entendo que uma das razões pelas quais alterar uma hipótese para ajustar os dados observados é problemática é por causa da maior chance de cometer um erro do tipo I devido a dados espúrios, mas minha pergunta é: essa é a única razão ou existem outros problemas fundamentais em continuar em uma expedição de pesca?
Como uma questão de bônus, existem maneiras de seguir em expedições de pesca sem se expor às possíveis armadilhas? Por exemplo, se você tiver dados suficientes, poderá gerar hipóteses a partir da metade dos dados e usar a outra metade para testá-las?
atualizar
Aprecio o interesse em minha pergunta, mas as respostas e comentários são principalmente direcionados para o que pensei ter estabelecido como informação de base. Estou interessado em saber se existem outras razões pelas quais é ruim, além da possibilidade mais alta de resultados espúrios, e se existem maneiras, como dividir os dados primeiro, de alterar uma hipótese post hoc, mas evitar o aumento de erros do tipo I.
Atualizei o título para refletir a esperança de minha pergunta.
Obrigado e desculpe pela confusão!
fonte
Respostas:
Certamente você pode fazer expedições de pesca, desde que admita que seja uma expedição de pesca e trate-a como tal. Um nome melhor para isso é "análise exploratória de dados".
Uma analogia melhor pode estar atirando em um alvo:
Você pode atirar em um alvo e comemorar se acertar o alvo.
Você pode atirar sem um alvo para testar as propriedades da sua arma.
Mas é trapaça atirar em uma parede e depois pintar um alvo em torno do buraco de bala.
Uma maneira de evitar alguns dos problemas é fazer a exploração em um conjunto de dados de treinamento e testá-lo em um conjunto de dados de "teste" separado.
fonte
But it's cheating to shoot at a wall and then paint a target around the bullet hole.
O problema das expedições de pesca é o seguinte: se você testar hipóteses suficientes, uma delas será confirmada com um baixo valor de p. Deixe-me dar um exemplo concreto.
Imagine que você está fazendo um estudo epidemiológico. Você encontrou 1000 pacientes que sofrem de uma condição rara. Você quer saber o que eles têm em comum. Então você começa a testar - deseja ver se uma característica específica está super-representada nesta amostra. Inicialmente, você testa sexo, raça, certos antecedentes familiares pertinentes (o pai morreu de doença cardíaca antes dos 50 anos de idade ...) mas, eventualmente, como está tendo problemas para encontrar algo que "grude", você começa a adicionar todos os tipos de outros fatores que apenas pode estar relacionado à doença:
...
Agora aqui está a coisa. Se eu selecionar hipóteses "aleatórias" suficientes, torna-se provável que pelo menos uma delas resulte em um valor p menor que 0,05 - porque a própria essência do valor p é "a probabilidade de estar errado em rejeitar a hipótese nula quando houver". não tem efeito ". Em outras palavras, em média, para cada 20 hipóteses falsas que você testa, uma delas fornecerá um p <0,05 .
Isso está muito bem resumido no desenho animado XKCD http://xkcd.com/882/ :
A tragédia é que, mesmo que um autor individual não realize 20 testes de hipóteses diferentes em uma amostra para procurar significado, pode haver outros 19 autores fazendo a mesma coisa; e quem "encontra" uma correlação agora tem um artigo interessante para escrever e que provavelmente será aceito para publicação ...
Isso leva a uma infeliz tendência a descobertas irreprodutíveis. A melhor maneira de se proteger contra isso como autor individual é elevar a fasquia. Em vez de testar o fator individual, pergunte a si mesmo "se eu testar hipóteses de N, qual é a probabilidade de encontrar pelo menos um falso positivo". Quando você está realmente testando "hipóteses de pesca", pode pensar em fazer uma correção de Bonferroni para se proteger contra isso - mas as pessoas freqüentemente não o fazem.
Houve alguns artigos interessantes do Dr. Ioannides - publicados no Atlantic Monthly especificamente sobre esse assunto.
Veja também esta pergunta anterior com várias respostas perspicazes.
atualizar para responder melhor a todos os aspectos da sua pergunta:
Se você tem medo de estar "pescando", mas realmente não sabe qual hipótese formular, definitivamente pode dividir seus dados nas seções "exploração", "replicação" e "confirmação". Em princípio, isso deve limitar sua exposição aos riscos descritos anteriormente: se você tem um valor de p 0,05 nos dados de exploração e obtém um valor semelhante nos dados de replicação e confirmação, o risco de estar errado cai. Um bom exemplo de "fazer o certo" foi mostrado no British Medical Journal (uma publicação muito respeitada com um fator de impacto de 17 anos ou mais)
Exploração e confirmação de fatores associados à gravidez sem complicações em mulheres nulíparas: estudo de coorte prospectivo, Chappell et al.
Aqui está o parágrafo relevante:
Retrocedendo um pouco na literatura, há um bom artigo de Altman et al. Intitulado "Pesquisa de prognóstico e prognóstico: validação de um modelo prognóstico", que é muito mais aprofundado e sugere maneiras de garantir que você não caia em esse erro. Os "pontos principais" do artigo:
Observe em particular a sugestão de que a validação seja feita (parafraseando) com dados de outras fontes - ou seja, não é suficiente dividir seus dados arbitrariamente em subconjuntos, mas você deve fazer o possível para provar que "aprender" no set de um conjunto experimentos podem ser aplicados aos dados de um conjunto diferente de experimentos. Essa é uma barra mais alta, mas reduz ainda mais o risco de que um viés sistemático na sua configuração crie "resultados" que não podem ser verificados independentemente.
É um assunto muito importante - obrigado por fazer a pergunta!
fonte
A pergunta pergunta se existem outros problemas além da inflação de erro tipo I que acompanham as expedições de pesca.
fonte