Estatísticas e Big Data

8
Gráfico de divisão em R

Eu tenho um conjunto de dados de nnn referências e mmmsubamostras em cada referência. Eu corro esses benchmarks e suas subamostras empppmáquinas sujeitas. O 'indivíduo' estudado pelas subamostras é o mesmo para cada máquina de assunto e os benchmarks são os mesmos para cada máquina de...

8
Bootstrapping com um pequeno número de observações

Digamos que eu coletei um pequeno número (N) de observações para uma hipótese que eu gostaria de testar. Eu poderia usar o método de autoinicialização para produzir uma distribuição de amostra para o resultado médio de N observações, mas estou preocupado que esse modelo possa quebrar quando N ficar...

8
Identificando padrões sequenciais

Estou trabalhando com dados de sequência, que são longas listas de chamadas win-api de malware. Estou tentando converter o problema de identificar 'comportamento de malware' em um dos padrões sequenciais. Trato cada chamada da API como um único item Itemset. O número de diferentes itens possíveis...