O que é uma variável supressora na regressão múltipla e quais podem ser as maneiras de exibir visualmente o efeito da supressão (sua mecânica ou sua evidência nos resultados)? Eu gostaria de convidar todos que têm um pensamento para
O que é uma variável supressora na regressão múltipla e quais podem ser as maneiras de exibir visualmente o efeito da supressão (sua mecânica ou sua evidência nos resultados)? Eu gostaria de convidar todos que têm um pensamento para
Tenho dados que mostram os resultados dos exames de admissão de bombeiros. Estou testando a hipótese de que os resultados dos exames e a etnia não são mutuamente independentes. Para testar isso, fiz um teste do qui-quadrado de Pearson em R. Os resultados mostram o que eu esperava, mas deu um aviso...
Gostaria de encontrar preditores para uma variável dependente contínua de um conjunto de 30 variáveis independentes. Estou usando a regressão Lasso conforme implementada no pacote glmnet em R. Aqui está um código fictício: # generate a dummy dataset with 30 predictors (10 useful & 20...
Estou interessado em determinar o número de padrões significativos provenientes de uma Análise de Componentes Principais (PCA) ou de Função Ortogonal Empírica (EOF). Estou particularmente interessado em aplicar esse método aos dados climáticos. O campo de dados é uma matriz MxN, com M sendo a...
Eu sou novo em estatística e atualmente lida com ANOVA. Realizo um teste ANOVA em R usando aov(dependendVar ~ IndependendVar) Eu recebo - entre outros - um valor F e um valor p. Minha hipótese nula ( H0H0H_0 ) é que todas as médias de grupos são iguais. Há muitas informações disponíveis sobre...
Venho brincando com florestas aleatórias para regressão e estou tendo dificuldade em descobrir exatamente o que as duas medidas de importância significam e como elas devem ser interpretadas. A importance()função fornece dois valores para cada variável: %IncMSEe IncNodePurity. Existem...
Alguém sabe como descobrir se os pontos 7, 16 e 29 são pontos influentes ou não? Li em algum lugar que, como a distância de Cook é menor que 1, eles não são. Estou certo?
Tenho alguns dados sobre voos de companhias aéreas (em um quadro de dados chamado flights) e gostaria de ver se o tempo de voo tem algum efeito na probabilidade de chegada significativamente atrasada (ou seja, 10 ou mais minutos). Imaginei que usaria regressão logística, com o tempo de vôo como...
Eu tenho que encontrar um IC de 95% na mediana e outros percentis. Não sei como abordar isso. Eu uso principalmente R como uma ferramenta de
Eu tinha um plano de aprender R em um futuro próximo. Lendo outra pergunta , descobri o Clojure. Agora não sei o que fazer. Eu acho que uma grande vantagem do R para mim é que algumas pessoas em Economia o usam, incluindo um dos meus supervisores (embora o outro tenha dito: fique longe do R!). Uma...
Eu tenho várias covariáveis no meu cálculo para um modelo e nem todas são estatisticamente significativas. Devo remover aqueles que não são? Esta pergunta discute o fenômeno, mas não responde à minha pergunta: Como interpretar o efeito não significativo de uma covariável na ANCOVA? Não há nada...
Eu queria saber quais são as diferenças entre modo, classe e tipo de objetos R? O tipo de um objeto R pode ser obtido pela função typeof (), mode by mode () e classe por class (). Também outras funções e conceitos similares que eu perdi? Obrigado e
Eu estou procurando classificar dados que, em alguns casos, o valor maior tem a classificação 1. Eu sou relativamente novo em R, mas não vejo como posso ajustar essa configuração na função de classificação. x <- c(23,45,12,67,34,89) rank(x) gera: [1] 2 4 1 5 3 6 quando eu quero que...
Eu tenho tentado replicar os resultados da opção Stata robustem R. Eu usei o rlmcomando do pacote MASS e também o comando lmrobdo pacote "robustbase". Nos dois casos, os resultados são bem diferentes da opção "robusta" no Stata. Alguém pode sugerir algo neste contexto? Aqui estão os resultados...
Na minha opinião, a divergência de KL da distribuição da amostra para a distribuição verdadeira é simplesmente a diferença entre entropia cruzada e entropia. Por que usamos a entropia cruzada para ser a função de custo em muitos modelos de aprendizado de máquina, mas usamos a divergência de...
Ao realizarmos regressão linear para encaixar um grupo de pontos de dados ( x 1 , y 1 ) , ( x 2 , Y 2 ) , . . . , ( x n , y n ) , a abordagem clássica minimiza o erro ao quadrado. Há muito tempo fico intrigado com uma pergunta que minimizará o erro ao quadrado resultará no mesmo resultado que...
Tenho certeza de que já deparei com uma função como essa em um pacote R antes, mas depois de pesquisar bastante no Google, não consigo encontrá-la em lugar algum. A função em que estou pensando produziu um resumo gráfico para uma variável dada a ela, produzindo resultados com alguns gráficos (um...
Esta pergunta é uma resposta a uma resposta dada por @Greg Snow em relação a uma pergunta que eu fiz sobre análise de potência com regressão logística e SAS Proc GLMPOWER. Se estou projetando um experimento e analisando os resultados em uma regressão logística fatorial, como posso usar a simulação...
Estou apenas lendo o livro "R em poucas palavras". E parece que eu pulei a parte em que o "." como em "sample.formula" foi explicado. > sample.formula <- as.formula(y~x1+x2) A amostra é um objeto com uma fórmula de campo como em outros idiomas? Se sim, como posso descobrir quais outros...
Estou procurando um artigo que possa ajudar a fornecer diretrizes sobre como escolher os hiperparâmetros de uma arquitetura profunda, como auto-codificadores empilhados ou redes de crenças profundas. Existem muitos hiperparâmetros e estou muito confuso sobre como escolhê-los. O uso da validação...