Podemos usar lm()para prever um valor, mas ainda precisamos da equação da fórmula do resultado em alguns casos. Por exemplo, adicione a equação aos
Podemos usar lm()para prever um valor, mas ainda precisamos da equação da fórmula do resultado em alguns casos. Por exemplo, adicione a equação aos
Existe uma maneira no R (uma função interna) de calcular a matriz de transição para uma cadeia de Markov a partir de um conjunto de observações? Por exemplo, usando um conjunto de dados como o seguinte e calculando a matriz de transição de primeira
Venho realizando uma competição de aprendizado de máquina em que eles usam o RMSLE (erro logarítmico quadrado médio da raiz) para avaliar o desempenho que prevê o preço de venda de uma categoria de equipamento. O problema é que não tenho certeza de como interpretar o sucesso do meu resultado...
Eu sempre uso lm()em R para executar regressão linear de yyy em . Essa função retorna um coeficiente tal quexxxββ\betay=βx.y=βx.y = \beta x. Hoje eu aprendi sobre o total de mínimos quadrados e essa princomp()função (análise de componentes principais, PCA) pode ser usada para realizá-lo. Deve ser...
Eu uso a função auto.arima () no pacote de previsão para ajustar os modelos ARMAX a uma variedade de covariáveis. No entanto, muitas vezes tenho um grande número de variáveis para selecionar e geralmente termino com um modelo final que funciona com um subconjunto delas. Não gosto de técnicas...
Sou novato em estatísticas e preciso de sua ajuda. Eu tenho uma pequena amostra, da seguinte maneira: H4U 0.269 0.357 0.2 0.221 0.275 0.277 0.253 0.127 0.246 Eu executei o teste Shapiro-Wilk usando R: shapiro.test(precisionH4U$H4U) e obtive o seguinte resultado: W = 0.9502,...
Quando você prevê um valor ajustado a partir de um modelo de regressão logística, como os erros padrão são calculados? Quero dizer para os valores ajustados , não para os coeficientes (que envolvem a matriz de informações de Fishers). Eu só descobri como obter os números R(por exemplo, aqui no...
Vou explicar meu problema com um exemplo. Suponha que você queira prever a renda de um indivíduo, com alguns atributos: {Idade, Sexo, País, Região, Cidade}. Você tem um conjunto de dados de treinamento como esse train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2,...
Eu gostaria de usar o GLM e o Elastic Net para selecionar esses recursos relevantes + criar um modelo de regressão linear (ou seja, previsão e entendimento, para que seja melhor ficar com relativamente poucos parâmetros). A saída é contínua. São genes por casos. Eu tenho lido sobre o pacote, mas...
Estou usando o pacote robustbase para executar uma estimativa de glm. No entanto, quando faço isso, recebo o seguinte erro: Error in solve.default(crossprod(X, DiagB * X)/nobs, EEq) : system is computationally singular: reciprocal condition number = 1.66807e-16 O que isso significa / indica? E...
Encadeamento duplicado: Acabei de instalar a versão mais recente do R. Quais pacotes devo obter? Quais são os pacotes R que você não imaginava seu trabalho diário com dados? Por favor, liste as ferramentas gerais e específicas. ATUALIZAÇÃO: Quanto a 24.10.10 ggplot2parece ser o vencedor com 7...
Eu tenho scripts R para ler grandes quantidades de dados csv de arquivos diferentes e depois executar tarefas de aprendizado de máquina como svm para classificação. Existem bibliotecas para usar vários núcleos no servidor para R. ou Qual é a maneira mais adequada de conseguir...
Entendo que essa questão é bastante ampla, mas me pergunto quais devem ser os pontos decisivos na decisão de criar (ou não) um novo pacote para R. Para ser mais específico, acrescentaria que a questão não é sobre os motivos para use R em si mesmo, mais sobre a decisão de compilar vários scripts e...
Eu tenho uma matriz em que a (i, j) me diz quantas vezes eu visualizei a página j. Existem 27 mil indivíduos e 95 mil páginas. Eu gostaria de ter um punhado de "dimensões" ou "aspectos" no espaço das páginas que corresponderiam a conjuntos de páginas que geralmente são vistos juntos. Meu objetivo...
Acabei de me deparar com este artigo , que descreve como calcular a repetibilidade (também conhecida como confiabilidade, também conhecida como correlação intraclasse) de uma medição via modelagem de efeitos mistos. O código R seria: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the...
Ao ajustar um modelo de regressão, o que acontece se as suposições das saídas não forem atendidas, especificamente: O que acontece se os resíduos não forem homocedásticos? Se os resíduos mostrarem um padrão crescente ou decrescente na plotagem Residuais vs. Ajustados. O que acontece se os...
É útil estudar o código de análise de dados de especialistas. Recentemente, estive lendo o github e há várias pessoas compartilhando código de análise de dados por lá. Isso inclui alguns pacotes R (que obviamente estão disponíveis diretamente no CRAN), mas também vários exemplos de pesquisa...
Como exemplo, considere o ChickWeightconjunto de dados em R. A variação obviamente aumenta com o tempo, portanto, se eu usar uma regressão linear simples como: m <- lm(weight ~ Time*Diet, data=ChickWeight) Minhas perguntas: Quais aspectos do modelo serão questionáveis? Os problemas estão...
Olhe para essa foto: Se extrairmos uma amostra da densidade vermelha, espera-se que alguns valores sejam menores que 0,25, ao passo que é impossível gerar essa amostra a partir da distribuição azul. Como conseqüência, a distância Kullback-Leibler da densidade vermelha à densidade azul é infinito....
Espero que todos não se importem com essa pergunta, mas preciso de ajuda para interpretar a saída de um modelo linear de efeitos mistos que tenho tentado aprender na R. Sou novo na análise de dados longitudinal e na regressão linear de efeitos mistos. Eu tenho um modelo que me encaixou com semanas...