Perguntas com a marcação «missing-data»

8
Intervalos de confiança ao usar o teorema de Bayes

Estou computando algumas probabilidades condicionais e intervalos de confiança associados a 95%. Para muitos de meus casos, tenho contagens diretas de xsucessos fora dos ntestes (de uma tabela de contingência), para que eu possa usar um intervalo de confiança binomial, como é fornecido por...

8
É sempre bom deixar de lado as observações que faltam?

Eu tenho um conjunto de dados que analisa solicitações de imigração e aceitação de vistos (concessão de vistos). As taxas são calculadas para "aceito" e "rejeitado" dos pedidos de visto. No entanto, o conjunto de dados também possui valores para casos que foram fechados. Normalmente é quando o...

8
Por que um modelo estatístico superajustaria se recebesse um grande conjunto de dados?

Meu projeto atual pode exigir que eu construa um modelo para prever o comportamento de um determinado grupo de pessoas. o conjunto de dados de treinamento contém apenas 6 variáveis ​​(id é apenas para fins de identificação): id, age, income, gender, job category, monthly spend em que monthly...

8
Como executar SVD para atribuir valores ausentes, um exemplo concreto

Eu li os ótimos comentários sobre como lidar com valores ausentes antes de aplicar o SVD, mas gostaria de saber como ele funciona com um exemplo simples: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Dada a matriz acima, se eu remover os valores de NA, acabarei...

8
Taxas ausentes e imputação múltipla

Existe um limite que seja menos aceitável ao usar a imputação múltipla (MI)? Por exemplo, posso usar o MI se os valores ausentes em uma variável forem 20% dos casos, enquanto outras variáveis ​​tiverem valores ausentes, mas não a um nível tão