Modelos de moedas tendenciosas normalmente têm um parâmetro . Uma maneira de estimar partir de uma série de empates é usar uma distribuição beta anterior e computar a distribuição posterior com probabilidade binomial.θ
Nas minhas configurações, devido a algum processo físico estranho, minhas propriedades da moeda estão mudando lentamente e se torna uma função do tempo . Meus dados são um conjunto de empates ordenados, ou seja, . Posso considerar que tenho apenas um empate para cada em uma grade de tempo discreta e regular.t { H , T , H , H , H , T , . . . } t
Como você modelaria isso? Estou pensando em algo como um filtro Kalman adaptado ao fato de que a variável oculta é e mantendo a probabilidade binomial. O que eu poderia usar para modelar para manter a inferência tratável?P ( θ ( t + 1 ) | θ ( t ) )
Edite as seguintes respostas (obrigado!) : Gostaria de modelar como uma cadeia de Markov da ordem 1, como é feita nos filtros HMM ou Kalman. A única suposição que posso fazer é que é suave. Eu poderia escrever com um pequeno ruído gaussiano (idéia do filtro de Kalman), mas isso quebraria o requisito de que deve permanecer em . Seguindo a idéia de @J Dav, eu poderia usar uma função probit para mapear a linha real para , mas tenho a intuição de que isso daria uma solução não analítica. Uma distribuição beta com médiaθ ( t ) P ( θ ( t + 1 ) | θ ( t ) ) = θ ( t ) + ϵ ϵ θ [ 0 , 1 ] [ 0 , 1 ] θ ( t ) e uma variação maior poderia fazer o truque.
Estou fazendo essa pergunta, pois tenho a sensação de que esse problema é tão simples que deve ter sido estudado antes.
fonte
Respostas:
Duvido que você possa criar um modelo com solução analítica, mas a inferência ainda pode ser tornada tratável usando as ferramentas certas, pois a estrutura de dependência do seu modelo é simples. Como pesquisador de aprendizado de máquina, eu preferiria usar o modelo a seguir, pois a inferência pode ser bastante eficiente usando a técnica de Propagação de Expectativas:
Deixe- ser o resultado de julgamento -ésimo. Vamos definir o parâmetro variável no tempoX(t) t
Para vincular a , introduza variáveis latentesη(t) X(t)
e modelo a serX(t)
Se você estiver interessado em implementar o algoritmo de inferência, dê uma olhada neste artigo . Eles usam um modelo muito semelhante para que você possa adaptar facilmente o algoritmo. Para entender o EP, a página a seguir pode ser útil. Se você estiver interessado em seguir essa abordagem, me avise; Posso fornecer conselhos mais detalhados sobre como implementar o algoritmo de inferência.
fonte
Para elaborar meu comentário, um modelo como p (t) = p exp (-t) é um modelo simples e permite a estimativa de p (t) estimando p usando a estimativa de probabilidade máxima. Mas será que a probabilidade realmente decai exponencialmente. Esse modelo estaria claramente errado se você observar períodos com alta frequência de sucesso do que em períodos anteriores e posteriores. O comportamento oscilatório pode ser modelado como p (t) = p | sint |. Ambos os modelos são muito tratáveis e podem ser resolvidos com a máxima probabilidade, mas oferecem soluções muito diferentes.0 0 0
fonte
Sua probabilidade muda com mas como Michael disse, você não sabe como. linearmente ou não? Parece um problema de seleção de modelo em que sua probabilidade :t p
Uma abordagem exploratória simples seria tentar vários probits para com diferentes não lineares e executar uma seleção do modelo base nos Critérios de Informação padrão.Φ g() g()
Para responder sua pergunta reeditada :
Como você disse, o uso do probit implicaria apenas soluções numéricas, mas você pode usar uma função logística:
Função logística:P[θ(t+1)]=11+exp(θ(t)+ϵ)
Linearizado por:logP1−P=θ(t)+ϵ
Não tenho certeza de como isso pode funcionar sob a abordagem de filtro Kalman, mas ainda acredito que uma especificação não linear como ou muitas outras sem um termo aleatório faça o trabalho. Como você pode ver, essa função é "smoth" no sentido de ser contínua e diferenciável. Infelizmente, adicionar geraria saltos da probabilidade resultante, o que é algo que você não deseja, então meu conselho seria remover .ϵ ϵθ(t+1)=at3+bt2+ct+d ϵ ϵ
Probabilidade de logit:P[Coint+1=H|t]=11+exp(θ(t))
Você já possui randomnes no evento bernoulli (cadeia de Markov) e está adicionando uma fonte adicional devido a . Assim, seu problema pode ser resolvido como um Probit ou Logit estimado por Máxima verossimilhança com como variável explicativa. Suponho que você concorda que essa parcimônia é muito importante. A menos que seu objetivo principal seja aplicar um determinado método (HMM e Kalman Filter) e não fornecer a solução válida mais simples para o seu problema.tϵ t
fonte