Eu resolvo os cubos de Rubik como um hobby. Registro o tempo que levou para resolver o cubo usando algum software e agora tenho dados de milhares de soluções. Os dados são basicamente uma longa lista de números que representam o tempo que cada resolução seqüencial levou (por exemplo, 22.11, 20.66, 21.00, 18.74, ...)
O tempo que levo para resolver o cubo varia naturalmente de resolver para resolver, portanto, existem boas e más soluções.
Quero saber se "esquento" - se as boas soluções surgem estrias. Por exemplo, se eu tiver apenas algumas boas soluções consecutivas, é mais provável que minha próxima solução seja boa?
Que tipo de análise seria apropriada? Eu posso pensar em algumas coisas específicas a fazer, por exemplo, tratar as soluções como um processo de Markov e ver quão bem uma solução prediz a próxima e comparar com dados aleatórios, ver quanto tempo as faixas mais longas de consecutivas resolvem abaixo da mediana durante o último 100 são e comparando com o que seria esperado em dados aleatórios, etc. Não tenho certeza de quão perspicazes esses testes seriam e me pergunto se existem algumas abordagens bem desenvolvidas para esse tipo de problema.
fonte
Algumas reflexões:
Traçar a distribuição dos tempos. Meu palpite é que eles serão distorcidos positivamente, de modo que alguns tempos de solução sejam realmente lentos. Nesse caso, convém considerar um log ou alguma outra transformação dos tempos da solução.
Crie um gráfico de dispersão de avaliação no eixo xe tempo de solução (ou registre o tempo de solução no eixo y). Isso deve fornecer uma compreensão intuitiva dos dados. Também pode revelar outros tipos de tendências além do "hot streak".
Considere se há um efeito de aprendizado ao longo do tempo. Na maioria dos quebra-cabeças, você fica mais rápido com a prática. A trama deve ajudar a revelar se esse é o caso. Esse efeito é diferente de um efeito "hot streak". Isso levará à correlação entre os ensaios, porque quando você estiver aprendendo pela primeira vez, os ensaios lentos co-ocorrerão com outros estudos lentos e, à medida que você for mais experiente, estudos mais rápidos co-ocorrerão com estudos mais rápidos.
Considere sua definição conceitual de "faixas quentes". Por exemplo, isso se aplica apenas a ensaios que se aproximam no tempo ou se aproximam da ordem. Digamos que você resolveu o cubo rapidamente na terça-feira e depois fez uma pausa e na sexta-feira seguinte você o resolveu rapidamente. Essa é uma sequência quente ou conta apenas se você a fizer no mesmo dia?
Existem outros efeitos que podem ser distintos de um efeito de raia quente? Por exemplo, hora do dia em que você resolve o quebra-cabeça (por exemplo, fadiga), em que grau está realmente se esforçando? etc.
Depois que os efeitos sistemáticos alternativos forem compreendidos, você poderá desenvolver um modelo que inclua o maior número possível. Você pode plotar o resíduo no eixo y e tentar no eixo x. Depois, você pode ver se há correlações automáticas nos resíduos no modelo. Essa correlação automática forneceria algumas evidências de faixas quentes. No entanto, uma interpretação alternativa é que há algum outro efeito sistemático que você não excluiu.
fonte
Calcule o correlograma para o seu processo. Se o seu processo é gaussiano (pela aparência da sua amostra), você pode estabelecer limites inferior / superior (B) e verificar se as correlações em um determinado atraso são significativas. A autocorrelação positiva no atraso 1 indicaria a existência de "riscos de sorte".
fonte