Um teste de moeda justo pode ser aplicado a uma moeda que frequentemente cai no seu limite?

8

Se você jogar uma moeda e receber 268 caras e 98 coroas, poderá calcular a probabilidade de que a moeda seja justa de várias maneiras. Uma observação heurística simples provavelmente concluiria que tal moeda é injusta. Eu calculei o valor p em R com:

> coin <- pbinom(98, 366, 0.5)
> coin*2
[1] 2.214369e-19

Esse valor é menor que 0,05, portanto rejeitamos a hipótese de que seja uma moeda justa.

Mas e se você dissesse que a mesma moeda caiu de lado 676 vezes durante o julgamento. Heuristicamente, você provavelmente chegará à mesma conclusão, mas os testes típicos de moedas justas ainda serão válidos?

Aqui está um gráfico para ilustrar o problema:

Quais são os métodos válidos para testar a hipótese de que há igual probabilidade de um evento ocorrer nas áreas sombreadas?

NOTA: existem 629 movimentos positivos (413 negativos) na ilustração do gráfico.

Código R que gera os dados:

require("quantmod")

ticker <- getSymbols("SLV")[,6]

change <- (ticker - lag(ticker, 24)) / lag(ticker, 24)  
change <- na.locf(change, na.rm=TRUE)   

# some other calculations

dens <- density(change)
plot(dens)

# some formatting stuff
Milktrader
fonte
3
Claramente, os dados em que este gráfico se baseia não são derivados do lançamento de uma moeda e parecem contínuos, não binários. Você poderia nos dizer qual é a pergunta substantiva que está tentando responder? Colocá-lo em termos de um exemplo estereotipado não está ajudando aqui.
onestop 26/03
O gráfico é derivado do cálculo de quanto (em termos de porcentagem) o fechamento de hoje é quando comparado ao fechamento de 24 dias atrás. Os modelos de precificação de opções pressupõem que existe uma probabilidade de 50% de que uma ação seja 10% maior ou 10% menor em n dias. Este gráfico é uma distribuição dos preços reais. Podemos aceitar a hipótese de que há igual probabilidade de o preço de uma ação ser 10% maior ou 10% menor em n dias.
Milktrader 26/03
1
O @Milktrader, em primeiro lugar, os modelos de opção não pressupõem que existe uma probabilidade igual de um retorno ascendente de 10% versus um retorno descendente em porcentagem igual. De fato, os modelos de opção sob uma estrutura de não arbitragem nem sequer funcionam com a distribuição real de retornos. Além disso, mesmo a medida neutra ao risco geralmente assume que os preços têm maior probabilidade de subir do que cair. Finalmente, seu comentário faz duas afirmações muito diferentes sobre os retornos, mesmo que você pareça estar pensando neles da mesma forma. Talvez você possa reformular e esclarecer sua pergunta.
cardeal
@ cardinal Na verdade, estou mais interessado na teoria das probabilidades do que nos modelos de precificação de opções com essa pergunta, embora o tópico dos modelos de precificação de opções seja interessante. É provável que você tenha um modelo de precificação de opção mais robusto, mas o meu mostra que o SLV com 14,81% de probabilidade fecha> 40,04 e 14,52% com o fechamento de <32,75 até a expiração da TAEG (20 dias). Também fico feliz em reformular minha pergunta para esclarecê-la, mas não tenho certeza de como fiz duas declarações exclusivas sobre retornos.
Milktrader 26/03
@ Milktrader, estou apenas tentando descobrir qual problema você está tentando resolver. Minha referência aos modelos de precificação de opções foi realmente feita para se referir até aos mais básicos e "padrão". Atualmente, eles podem parecer assumir uma distribuição simétrica, mas isso ocorre apenas porque as taxas de juros estão próximas de zero.
cardinal

Respostas:

5

Tenho certeza de que a resposta é sim , o teste binomial padrão de 'moeda justa' ainda é válido: se você deseja testar se duas das três probabilidades de uma distribuição multinomial são iguais, mas não está interessado em nenhuma hipótese sobre Na terceira probabilidade, você pode analisar os números dos dois resultados correspondentes como se eles fossem extraídos de uma distribuição binomial .

De fato, isso parece ser um bom exercício sobre estatísticas suficientes e probabilidade condicional:

Você pode pensar nisso como uma distribuição multinomial com três resultados possíveis e, portanto, dois parâmetros estimados (como as três probabilidades devem somar 1). Mas você não está interessado na probabilidade do resultado "intermediário"; portanto, você pode considerar esse o parâmetro incômodo e a diferença entre o número de resultados "superiores" e "inferiores" como o parâmetro de interesse.

É fácil mostrar (usando o teorema de fatoração de Fisher-Neyman ) que os números de resultados 'superiores' e 'inferiores' juntos formam uma estatística (bidimensional) suficiente para o parâmetro de interesse, ou seja, o número de resultados 'médios' não fornece informações adicionais sobre o valor do parâmetro de interesse. O número de resultados "médios" é claramente uma estatística suficiente para o parâmetro de incômodo. Se condicionarmos a este último, acho (não verifiquei corretamente) que a probabilidade condicional resultante terminará igual à probabilidade da distribuição binomial, ou seja, o problema do lançamento de moedas.

uma parada
fonte
1
Isso é muito simples, pois ainda não fiz nenhum cálculo. Tudo o que você escreveu parece bom. A única pergunta que me surge inicialmente é que parece que a estimativa de variação pode ser diferente se você "jogar fora" as amostras correspondentes ao terceiro resultado.
cardeal
Sim, esta é a descrição formal do meu problema. Uma distribuição multinomial pode ser reduzida a uma distribuição binomial? O que me preocupa é o tamanho do resultado "intermediário".
Milktrader 27/03
Estou aceitando isso como "Sim, você pode, desde que sua probabilidade condicional seja igual à probabilidade de distribuição binomial". Não tenho certeza de como você configuraria esse teste, mas isso está além do escopo da minha pergunta original.
Milktrader 28/03
Embora a explicação da resposta envolva probabilidade condicional, pretendi minha resposta à sua pergunta "os testes típicos de moedas justas ainda são válidos?" ser um un condicional sim !
onestop 28/03
3

Se você enquadrar isso como um problema binomial (p, 1-p), não como um problema multinomial, você poderá descrever apenas o passado. Você não poderá dizer nada sobre o futuro. Por quê? Sua remoção das "viradas de ponta" do meio está implícita no reagrupamento dos dados.

Em outras palavras, seus "dados descritos" probabilidade "p" de um resultado positivo e a probabilidade "1-p" de um resultado negativo não serão aplicados no próximo "lançamento binomial da moeda", porque no futuro você realmente terá probabilidades "x", "y" e "(1-xy)".

Editar (27/03/2011) ===============================

Adicionei o diagrama a seguir para ajudar a explicar meus comentários abaixo.

insira a descrição da imagem aqui

bill_080
fonte
Então, não posso afirmar que P (movimento positivo | movimento de 10%)? Ou, se eu souber que há um movimento de 10%, posso dizer que esse movimento tem uma probabilidade (268/366) de ser positivo. Mas acho que sempre posso reivindicar P (10% de movimento | movimento positivo), não? Se a movimentação for positiva, há uma probabilidade (268/629) de que a movimentação exceda 10%. (Não imprimi o total de positivos no gráfico porque não pensava tão à frente).
Milktrader 27/03
@ Milktrader: Seu processo e números originais são baseados em um fechamento diário consistente. Quando você obtiver um fechamento no futuro, ele também será baseado em um fechamento diário. Nenhum dos dois se baseia em um "fechamento preferido" (que requer informações CONHECIDAS após o fato). Você pode representar o processo como um binômio multinomial ou um meio e meio (um processo binomial para selecionar o caminho "Preferido" versus "Não preferido" e, em seguida, outro processo binomial usando suas "Probabilidades preferidas"). Tente. É possível simular o processo geral apenas com as "Probabilidades Preferidas"?
bill_080
Se essas ações movimentarem 10% nos próximos 24 dias, posso afirmar que a probabilidade de movimentação será de 268/366? Não pretendo misturar prazos. (agora analisando a segunda parte do seu comentário) #
Milktrader 27/03
@ Milktrader: A partir dos dados acima, para um delta de 24 dias, você tem 268 Ups, 98 Downs e 676 Nulls (1042 Total de Eventos). Supondo que não haja alterações estruturais, a cada dia de negociação no FUTURO, antes do dia de negociação, você enfrenta as probabilidades de 268/1042 Ups, 98/1042 Downs. Os 676/1042 Nulos restantes aparecerão com mais frequência. Tudo isso lida com o futuro. Após o fechamento, você saberá se é um "dia preferido", mas, novamente, é após o fechamento (não no futuro). Suas "Probabilidades preferidas" só se aplicam após o fato (no passado). Eu adicionei um diagrama na minha resposta acima para ajudar a explicar.
bill_080