Eu tenho dados sobre uma série de apostas vencedoras e perdidas em 5 rodadas de apostas com desgaste após cada rodada. Estou usando uma árvore de decisão como a seguinte para exibir os dados.
Os nós em direção ao topo da árvore são aqueles que estão fazendo apostas vencedoras e os que estão em direção ao fundo da árvore estão correndo e perdendo apostas. Eu quero olhar para (a) atrito em cada nó (b) alterações no tamanho médio das apostas em cada nó. Estou analisando a taxa de atrito em cada nó do nó anterior e a taxa de sobrevivência (usando a quantidade esperada de pessoas em cada nó, se a probabilidade for de 50%). Por exemplo, se a probabilidade é de 50% em cada nó, dos 1.000 que começaram, aproximadamente 500 pessoas devem estar em cada um dos segundos nós, W e L. A hipótese é (a) que a taxa de atrito é maior após a perda Apostas (b) O tamanho médio da aposta é reduzido após perdedores e aumentado após vencedores.
Eu só quero fazer isso em um ambiente univariado muito simples primeiro. Como posso executar um teste t para mostrar que a mudança no tamanho médio da aposta do nó WW para o nó WWW é estatisticamente significativa se 50 pessoas desistiram? Não sei se essa é a abordagem correta: cada aposta subsequente é independente, mas as pessoas estão desistindo de perdedores, para que a amostra não seja correspondida. Se fosse apenas um caso da mesma classe fazendo uma série de exames um após o outro sem que ninguém desistisse, eu entenderia como realizar o teste t apropriado, mas acho que isso é um pouco diferente.
Como posso fazer isso? Além disso, se os resultados estão sendo distorcidos por um pequeno número de clientes, como eu poderia obter os 5% e os 5% inferiores? Basta remover os clientes com o maior valor acumulado da aposta 1 - 3?
Eu tenho os dados dos quais a figura foi gerada, então eu tenho a média, std, std erro etc em cada nó.
fonte
Respostas:
Parece quase "óbvio ao olhar" que os perdedores estavam mais aptos a desistir do que os vencedores.
Você pode tentar um conjunto de tabelas de contingência para estabelecer se o acima é estatisticamente significativo. Por exemplo, dos 450 vencedores da primeira aposta, 25 desistiram e 425 ficaram e dos 550 perdedores, 150 desistiram e 400 ficaram. Etc.
fonte
Essa resposta provavelmente será um pouco fora do tópico, mas vou começar com o que está no tópico. Se me pedissem especificamente para determinar se a alteração no tamanho médio da aposta de WW para WWW era significativa, eu ignoraria as pessoas que não alcançaram esses dois nós. Se o objetivo desta análise é ser capaz de fazer previsões para o comportamento futuro, a mecânica do julgamento deve fazer bem em emular a mecânica do comportamento futuro, mesmo que o jogo não seja um jogo de azar. Qual é o sentido de medir como a aposta de alguém mudaria de WW para WWW se não for o tipo de pessoa que vai de WW para WWW.
Dito isto, em geral, obviamente, não gostamos de excluir sistematicamente determinadas populações. Se eu recebesse esses dados, focaria nos tipos de análise mais factíveis. Mais notavelmente (especialmente se este não é um jogo de azar), os jogadores de um nó semelhante têm muito em comum. Eles tiveram a mesma sequência de (W, L) e não sobraram. Responder a perguntas como "Qual é o efeito de perder uma rodada de apostas no tamanho e no desgaste da aposta" é bastante viável ao se controlar o comportamento dependente do nó, na forma de um modelo de vários níveis.
Um último conselho seria focar nas diferenças de nível de jogador de rodada a rodada. A aposta média que cai 5 centavos depois de um pouco pode ser estatisticamente insignificante, enquanto 90% das apostas dos jogadores que caem provavelmente serão.
fonte