Estatísticas e Big Data

9
Técnicas de categorização / segmentação

Primeiro, deixe-me dizer que estou um pouco fora da minha profundidade aqui; portanto, se essa pergunta precisar ser reformulada ou encerrada como duplicada, informe-me. Pode ser que eu não tenha o vocabulário adequado para expressar minha pergunta. Estou trabalhando em uma tarefa de processamento...

9
A ordem variável importa na regressão linear

Estou investigando a interação entre duas variáveis ​​( e ). Existe uma grande correlação linear entre essas variáveis ​​com . Pela natureza do problema, não posso dizer nada sobre a causa (se causa ou o contrário). Eu gostaria de estudar os desvios da linha de regressão, a fim de detectar valores...

9
Critérios de cotovelo para determinar o número de aglomerados

É mencionado aqui que um dos métodos para determinar o número ideal de clusters em um conjunto de dados é o "método do cotovelo". Aqui, a porcentagem de variação é calculada como a razão da variação entre os grupos e a variação total. Senti-me difícil ao entender esse cálculo. Alguém pode explicar...

9
Modelo Tobit com R

Alguém sabe onde encontrar boas aplicações e exemplos (além do manual e do livro aplicou econometria com R) usando o modelo de tobit com os pacotes AER? Editar Estou procurando um comando para calcular os efeitos marginais para y (não para a variável latente y *). Parece ser ϕ ( x β/ σ)...

9
Testando a estabilidade em uma série temporal

Existe um método padrão (ou melhor) para testar quando uma determinada série temporal se estabilizou? Alguma motivação I têm um sistema dinâmico estocástico que gera um valor em cada passo de tempo t ∈ N . Este sistema tem algum comportamento transitório até o passo t ∗ e depois se...

9
As contagens zero precisam ser ajustadas para um teste de razão de verossimilhança de modelos poisson / loglinear?

Se houver 0 na tabela de contingência e estivermos ajustando modelos poisson / loglinear aninhados (usando a glmfunção de R ) para um teste de razão de verossimilhança, precisamos ajustar os dados antes de ajustar os modelos glm (por exemplo, adicione 1/2 a todos as contagens)? Obviamente, alguns...

9
Regressão polinomial ortogonal multivariada?

Como forma de motivar a pergunta, considere um problema de regressão em que procuramos estimar usando as variáveis ​​observadas { a , b }YYY{ a , b }{a,b}\{ a, b \} Ao fazer a regressão polinomial multivariada, tento encontrar a paramitização ideal da função f( y) = c1 1a + c2b + c3uma2+ c4a b +...