Como se pode obter pesos de regressão padronizados (efeito fixo) a partir de uma regressão multinível? E, como um "complemento": Qual é a maneira mais fácil de obter esses pesos padronizados de um merobjeto-(da lmerfunção do lme4pacote em
Como se pode obter pesos de regressão padronizados (efeito fixo) a partir de uma regressão multinível? E, como um "complemento": Qual é a maneira mais fácil de obter esses pesos padronizados de um merobjeto-(da lmerfunção do lme4pacote em
Encontrei muitos posts úteis sobre variáveis independentes padronizadas e variáveis independentes centralizadas no stats.stackexchange.com, mas ainda estou um pouco confuso. Estou lhe pedindo uma avaliação do que entendi. Além disso, se o que se segue não estiver correto, você poderia me...
Eu tenho uma pergunta básica. Digamos que eu tenha duas variáveis aleatórias, e Y . Eu posso padronizá-los subtraindo a média e dividindo pelo desvio padrão, ou seja, X s t a n d a r d i z e d = ( X - E ( X ) )XXXYYY .Xstandardized=(X−E(X))(SD(X))Xstandardized=(X−E(X))(SD(X))X_{standardized} =...
Eu tenho um GLMM do formulário: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Quando uso drop1(model, test="Chi"), obtenho resultados diferentes dos que utilizo Anova(model, type="III")na embalagem do carro ou summary(model). Estes dois...
Se uma Análise Discriminante Linear de várias classes (ou às vezes também leio Análise Discriminante Múltipla) for usada para redução de dimensionalidade (ou transformação após redução de dimensionalidade via PCA), entendo que, em geral, uma "normalização do escore Z" (ou padronização) de os...
Estou ciente de que é prática comum padronizar os recursos para regressão de cordões e laços, no entanto, seria mais prático normalizar os recursos em uma escala (0,1) como alternativa à padronização do escore z para esses métodos de regressão?
Exemplos: Eu tenho uma frase na descrição do trabalho: "Java senior engineer in UK". Eu quero usar um modelo de aprendizado profundo para prever em duas categorias: English e IT jobs. Se eu usar o modelo de classificação tradicional, ele poderá prever apenas 1 rótulo com softmaxfunção na última...
Eu sei que há mais de dois tipos de normalização. Por exemplo, 1- Transformação de dados usando um z-score ou t-score. Isso geralmente é chamado de padronização. 2- Reescalonar dados para ter valores entre 0 e 1. A questão agora se eu precisar normalizar Que tipo de normalização de dados...
Existem várias perguntas que falam dos méritos relativos de vários métodos para avaliar a importância dos preditores de regressão, por exemplo, este . Percebi que, neste comentário, @gung refere-se à prática como uma "idéia equivocada", vinculando-se a essa resposta em apoio a essa afirmação. O...
Bloqueado . Esta pergunta e suas respostas estão bloqueadas porque a questão está fora do tópico, mas tem um significado histórico. No momento, não está aceitando novas respostas ou interações. As funções que eu estou familiarizado incluem a escala da base R, a nova...
Estou tentando padronizar colunas de conjunto de dados para regressão linear. Uma das colunas possui desvio padrão = 0. def standardize(X): return (X - mean(X)) / std(X) Portanto, esse código não funciona. Existem truques para resolver este problema? Eu tentei duas coisas Jogue sempre a...
Eu estou usando regressão logística para prever y dado x1 e x2: z = B0 + B1 * x1 + B2 * x2 y = e^z / (e^z + 1) Como a regressão logística deve lidar com casos em que minhas variáveis têm escalas muito diferentes? As pessoas constroem modelos de regressão logística com coeficientes de ordem...
Eu tenho dois preditores em um modelo de regressão logística binária: um binário e um contínuo. Meu objetivo principal é comparar os coeficientes dos dois preditores dentro do mesmo modelo. Encontrei a sugestão de Andrew Gelman para padronizar variáveis de entrada de regressão contínua: I)...
Antecedentes do problema: Como parte da minha pesquisa, escrevi dois algoritmos que podem selecionar um conjunto de recursos de um conjunto de dados (dados de expressão gênica de pacientes com câncer). Esses recursos são então testados para ver quão bem eles podem classificar uma amostra invisível...
Por que dividir um conjunto de dados por sigma torna a variação da amostra igual a 1? Assumindo uma média zero por simplicidade. Qual é a intuição por trás disso? Dividir pelo intervalo (max-min) faz sentido intuitivo. Mas o desvio padrão
O que eu quero fazer é construir GLMMs para avaliar a seleção de recursos, e eu tenho um conjunto de variáveis (algumas representando distâncias e outras representando% da cobertura do solo). Posso testar a correlação entre variáveis antes de padronizá-las? Não tenho muita certeza do que devo...