Se você jogar uma moeda e receber 268 caras e 98 coroas, poderá calcular a probabilidade de que a moeda seja justa de várias maneiras. Uma observação heurística simples provavelmente concluiria que tal moeda é injusta. Eu calculei o valor p em R com:
> coin <- pbinom(98, 366, 0.5)
> coin*2
[1] 2.214369e-19
Esse valor é menor que 0,05, portanto rejeitamos a hipótese de que seja uma moeda justa.
Mas e se você dissesse que a mesma moeda caiu de lado 676 vezes durante o julgamento. Heuristicamente, você provavelmente chegará à mesma conclusão, mas os testes típicos de moedas justas ainda serão válidos?
Aqui está um gráfico para ilustrar o problema:
Quais são os métodos válidos para testar a hipótese de que há igual probabilidade de um evento ocorrer nas áreas sombreadas?
NOTA: existem 629 movimentos positivos (413 negativos) na ilustração do gráfico.
Código R que gera os dados:
require("quantmod")
ticker <- getSymbols("SLV")[,6]
change <- (ticker - lag(ticker, 24)) / lag(ticker, 24)
change <- na.locf(change, na.rm=TRUE)
# some other calculations
dens <- density(change)
plot(dens)
# some formatting stuff
fonte
Respostas:
Tenho certeza de que a resposta é sim , o teste binomial padrão de 'moeda justa' ainda é válido: se você deseja testar se duas das três probabilidades de uma distribuição multinomial são iguais, mas não está interessado em nenhuma hipótese sobre Na terceira probabilidade, você pode analisar os números dos dois resultados correspondentes como se eles fossem extraídos de uma distribuição binomial .
De fato, isso parece ser um bom exercício sobre estatísticas suficientes e probabilidade condicional:
Você pode pensar nisso como uma distribuição multinomial com três resultados possíveis e, portanto, dois parâmetros estimados (como as três probabilidades devem somar 1). Mas você não está interessado na probabilidade do resultado "intermediário"; portanto, você pode considerar esse o parâmetro incômodo e a diferença entre o número de resultados "superiores" e "inferiores" como o parâmetro de interesse.
É fácil mostrar (usando o teorema de fatoração de Fisher-Neyman ) que os números de resultados 'superiores' e 'inferiores' juntos formam uma estatística (bidimensional) suficiente para o parâmetro de interesse, ou seja, o número de resultados 'médios' não fornece informações adicionais sobre o valor do parâmetro de interesse. O número de resultados "médios" é claramente uma estatística suficiente para o parâmetro de incômodo. Se condicionarmos a este último, acho (não verifiquei corretamente) que a probabilidade condicional resultante terminará igual à probabilidade da distribuição binomial, ou seja, o problema do lançamento de moedas.
fonte
Se você enquadrar isso como um problema binomial (p, 1-p), não como um problema multinomial, você poderá descrever apenas o passado. Você não poderá dizer nada sobre o futuro. Por quê? Sua remoção das "viradas de ponta" do meio está implícita no reagrupamento dos dados.
Em outras palavras, seus "dados descritos" probabilidade "p" de um resultado positivo e a probabilidade "1-p" de um resultado negativo não serão aplicados no próximo "lançamento binomial da moeda", porque no futuro você realmente terá probabilidades "x", "y" e "(1-xy)".
Editar (27/03/2011) ===============================
Adicionei o diagrama a seguir para ajudar a explicar meus comentários abaixo.
fonte