Estatísticas e Big Data

8
Cálculo da função hipergeométrica em R

Estou tendo uma tremenda dificuldade em avaliar com o pacote em R. No meu caso, os valores de , , são sempre números reais positivos. Mesmo assim, a função hipergeométrica é incrivelmente sensível aos seus valores. Não estou procurando por extrema precisão; Posso usar o Excel para obter uma...

8
Por que o modelo muda ao usar o relevel?

Ao calcular modelos de regressão com R, uso regularmente a função relevel para fazer com que meu modelo me dê resultados para o outro nível. Percebi que, às vezes, mas não com frequência, isso mudou o modelo no sentido de que os níveis de outros fatores que eram significativos antes da relevância...

8
teste nas preferências do usuário

Eu criei um teste de usuário para comparar dois métodos: M1 e M2. Gero 40 casos de teste e mostro o resultado de cada método no caso de teste para 20 indivíduos, lado a lado, os indivíduos não sabem qual resultado veio de qual método. Para cada caso de teste, cada pessoa deve dizer se o resultado...

8
Como a distribuição gama inversa está relacionada a

Dado que a estimativa posterior de de uma probabilidade normal e uma gama inversa anterior a é:σ′2σ′2\sigma'^{2}σ2σ2\sigma^2 σ′2∼IG(α+n2,β+∑ni=1(yi−μ)22)σ′2∼IG(α+n2,β+∑i=1n(yi−μ)22)\sigma'^{2}\sim\textrm{IG}\left(\alpha + \frac{n}{2}, \beta +\frac{\sum_{i=1}^n{(y_i-\mu)^2}}{2}\right) que é...

8
Como gerar uma boa tabela de resumo?

Quero que R exiba os dados que ele fornece da summary()função em uma tabela para que eu possa compartilhar isso facilmente. Atualmente, estou apenas fazendo summary()no console e, em seguida, tirando uma captura de tela, mas eu prefiro que isso seja gerado como uma boa tabela, como todos os meus...

8
Dirichlet processos para aprendizagem supervisionada?

Parece que quando olho aqui os algoritmos da aprendizagem da moda, coisas como redes neurais, árvores potencializadas, máquinas de vetores de suporte, florestas aleatórias e amigos são promovidas por problemas de aprendizagem supervisionados. Os processos de Dirichlet e seus tipos parecem ser...

8
valor-p como distância?

Os valores de p entre vários testes em pares podem ser considerados como uma medida de similaridade / distância e o dimensionamento multidimensional pode ser aplicado sobre uma matriz em pares de valores de p para reduzir a dimensionalidade? Essa é uma pergunta fácil, mas qual seria o maior...

8
Intervalos de confiança ao usar o teorema de Bayes

Estou computando algumas probabilidades condicionais e intervalos de confiança associados a 95%. Para muitos de meus casos, tenho contagens diretas de xsucessos fora dos ntestes (de uma tabela de contingência), para que eu possa usar um intervalo de confiança binomial, como é fornecido por...

8
Compreendendo o problema de Behrens – Fisher

Esta seção de este artigo diz: Ronald Fisher, em 1935, introduziu inferência fiducial para aplicá-la a esse problema. Ele se referiu a um artigo anterior de WV Behrens de 1929. Behrens e Fisher propuseram encontrar a distribuição de probabilidade de onde e são as duas médias de amostra e e...

8
detecção de plágio em teste de múltipla escolha

Suponha que um investigador suspeite que um aluno copie respostas do trabalho de outro aluno durante um exame de múltipla escolha. Mais tarde, ela verifica as respostas e encontra algumas semelhanças - mas, por outro lado, é provável que haja semelhanças, dada a natureza do exame. Como ela deveria...