Alguém pode me ajudar a entender que tipo de problema estou olhando? Não tenho certeza se isso é classificado como teste de hipótese

Por favor, perdoe-me se esta pergunta não estiver clara. Não tenho certeza se estou usando as terminologias corretas.

Realizei um experimento em diferentes ambientes várias vezes. Portanto, meus dados são mais ou menos assim:

Environment1  1.2  2.1  1.1  1.5  1.6
Environment2  4.2  2.6  3.5  2.5  2.9
Environment3  7.2  4.6  5.3  4.5  1.6
Environment4  0.0  0.0  1.2  15.0 0.0
Environment5  3.2  2.4  7.2  5.5  6.6
Environment6  23.2  32.1  18.1  1.5  19.6

Eu posso ver claramente (ou talvez minha intuição diga) que o experimento não foi conduzido adequadamente no Ambiente4 (muito baixo e muito flutuante) e no Ambiente5 (muito alto), mas não tenho certeza de como provar isso. Devo confiar no teste de hipóteses com a hipótese:

O experimento não foi realizado adequadamente nos ambientes 4 e 6.

e, em seguida, use algum procedimento para provar isso? Ou existe uma maneira padrão de mostrar isso? Alguém pode me ajudar como abordar esse tipo de problema? Eu estou usando R.

r distributions hypothesis-testing statistical-significance experiment-design lenda
fonte

Boa pergunta, é um bom exemplo para expor a procedimentos diferentes, porque basicamente sabemos, sem matemática ou formalidade, que os ambientes 4 e 6 são diferentes dos demais (e o ambiente 1 é um pouco diferente de 2, 3 e 5). Assim, qualquer bom procedimento deve ser capaz de produzir o resultado óbvio, apenas a diferença proveniente da quantificação da diferença em sentido matemático. A pergunta óbvia é "existe alguma outra maneira de o experimento realmente produzir esses resultados, além de um erro?"

probabilityislogic

@probabilityislogic: Obrigado. O que você diz é útil: se, de alguma forma, posso quantificar a eficácia do experimento em cada ambiente, posso dizer algo, mas ainda não sei o que dizer ou o que dizer. Ah .. (... sentindo-se estúpido ao digitar quebra-cabeças) :) Com relação à sua pergunta: o experimento foi bastante controlado no sentido de garantir que o ambiente não mudasse. No entanto, o procedimento pode ter dado errado. Pode ser o procedimento não foi executado corretamente de acordo com as diretrizes (talvez?)

Legend

Estou falando mais ou menos como " é uma quantidade fisicamente significativa? O que aconteceria no mundo real se isso estivesse correto"? Também pode ser útil falar com alguém que realmente fez o experimento 4 ou 6 (de preferência a pessoa que registrou os dados).

32.1

$32.1$

probabilityislogic

@probabilityislogic: Entendo. Eu entendi o seu ponto. Os dados são questão é uma variável de tempo de resposta. Minha opinião sobre sua pergunta seria que o valor faz sentido no mundo físico, mas é incomum o suficiente para ser chamado de caso raro. A pessoa com quem falei disse que não fez nada de diferente. Na verdade, os dados que coloquei aqui são apenas uma amostra de todos os dados e há alguns casos como esse espalhados aqui e ali.

Legend

parece que o resultado mais provável é um erro, mas descobertas interessantes podem ser feitas se você "aprofundar", por assim dizer. Poderia ser uma nova descoberta de algum tipo! mas não fique muito animado, provavelmente não é nada, mas pode valer a pena considerar a possibilidade e ver aonde isso o leva.

probabilityislogic

Você pode fazer um teste do aluno para ver se a média é diferente entre o grupo 4,6 e o restante. Mesmo que o tamanho da sua amostra seja pequeno, você concluirá a diferença. Observe que ele informa que o grupo 4,6 é, em média, significativamente diferente do restante, mas que "O experimento não foi conduzido adequadamente nos ambientes 4 e 6", que não pode ser respondido sem o conhecimento de o que "corretamente" significa nas observações.

Robin Girard
fonte

girad: Na verdade, essa pergunta surgiu de alguém da equipe de teste. Devidamente significa que eles receberam um conjunto de instruções a serem executadas para obter um valor final. A experiência será concluída mesmo se uma das instruções for ignorada, mas resultará em uma observação incorreta. Vou verificar o student testque você mencionou. Mas se o teste se baseia na média, a média não deve ser uma medida ruim devido à sua sensibilidade à alteração nos valores dos dados? Obrigado pelo seu tempo.

Legenda

@Legend Um teste de diferença de médias pode ser inadequado, mas isso não é culpa de @robin, como apontado na segunda metade de sua resposta, o que é adequado: o teste a ser usado é determinado pela característica de um conjunto de Os resultados indicam um experimento "impróprio". Você pode realizar um teste F para obter uma diferença de desvios padrão; você pode realizar testes de vários valores extremos; você poderia realizar um teste de Kruskal-Wallis; etc., dependendo do tipo de diferença que você está procurando.

whuber

@ Legend Há também outra dificuldade que é obscurecida pela sua pergunta, porque aqui você adivinhou que 4,6 eram as diferentes amostras. Mas e se você não souber antecipadamente ... terá que testar todas as configurações e provavelmente introduzir um critério de múltiplas hipóteses. Nesse caso, isso parece uma detecção de outliers e muitas questões já foram tratadas aqui.

22611 robin girard

@ whuber: Eu não pretendia ver que é culpa de alguém. Eu sou um novato aqui, então peço desculpas se soou. @robin girard: Essa é uma visão muito interessante. Obrigado. Eu só estava pensando em detecção externa. Você poderá me indicar algum material relevante para este caso em particular? Tudo o que tenho usado antes são simples como k-médias etc.

Legend

Alguém pode me ajudar a entender que tipo de problema estou olhando? Não tenho certeza se isso é classificado como teste de hipótese

Respostas: