Estatísticas e Big Data

8
Por que eu gostaria de inicializar ao calcular um teste t de amostra independente? (como justificar, interpretar e relatar um teste t com bootstrap)

Digamos que eu tenho duas condições, e meu tamanho de amostra para as duas condições é extremamente baixo. Digamos que só tenho 14 observações na primeira condição e 11 na outra. Eu quero usar o teste t para testar se as diferenças médias são significativamente diferentes umas das...

8
Converter taxa de riscos em razão de chances

Na metanálise: como convertemos as taxas de risco em alguns estudos em odds ratio? Existem estudos de controle de casos e coortes a serem incluídos e alguns deles relatam taxas de risco. Os dados brutos não são relatados de forma a calcular o odds

8
Termos de erro versus inovações

Notei que às vezes chamamos os termos de erro de "inovações". Não entendo se isso ocorre em situações especiais ou se esses termos podem ser usados ​​um pelo outro. Outra pergunta é "por que chamamos os termos de erro de" inovações "?

8
Revise o artigo sobre filtro de partículas

Encontrei on-line um rascunho de um excelente artigo de revisão de Zhe Chen intitulado "Filtragem Bayesiana: Dos Filtros de Kalman aos Filtros de Partículas e Além". Segundo o Google Scholar, a citação para a versão publicada é "Statistics 182 (1), 1-69, 2003", mas a revista que encontro com esse...

8
Fórmula de Schuette – Nesbitt

Eu estava lendo o artigo sobre a fórmula de Schuette-Nesbitt , que é descrita como "uma generalização do princípio de inclusão-exclusão" , que possui versões combinatória e probabilística. Outro site deu uma prova de eventos dependentes (download em pdf) e encontrou um terceiro que o compara ao...

8
Quais são algumas das razões pelas quais os mínimos quadrados com ponderação iterativa não convergiriam quando usados ​​para regressão logística?

Eu tenho usado a função glm.fit em R para ajustar parâmetros a um modelo de regressão logística. Por padrão, o glm.fit usa mínimos quadrados ponderados iterativamente para ajustar os parâmetros. Quais são algumas das razões pelas quais esse algoritmo falharia ao convergir quando usado para...

8
Visualização e overplotting: alternativa para dispersões

Eu tenho um grande conjunto de dados de países que estão lotados (como você pode ver abaixo), mas preciso dos rótulos e dos outliers - também tenho muitos gráficos, por isso seria tedioso redefinir a janela e adicionar dados falsos para os outliers. Existe uma boa alternativa para um gráfico de...