Estou procurando pelo algoritmo de regressão linear mais adequado para dados cuja variável independente (x) possui um erro de medição constante e a variável dependente (y) possui um erro dependente do sinal. A imagem acima ilustra minha
Estou procurando pelo algoritmo de regressão linear mais adequado para dados cuja variável independente (x) possui um erro de medição constante e a variável dependente (y) possui um erro dependente do sinal. A imagem acima ilustra minha
Estou trabalhando na validação cruzada da previsão dos meus dados com 200 indivíduos e 1000 variáveis. Estou interessado em regressão de cume porque o número de variáveis (eu quero usar) é maior que o número de amostra. Então, eu quero usar estimadores de encolhimento. A seguir, são compostos...
Estou interessado em estimar uma taxa de risco ajustada, análoga a como se estima uma taxa de chances ajustada usando regressão logística. Alguma literatura (por exemplo, isso ) indica que o uso da regressão de Poisson com erros padrão de Huber-White é uma maneira baseada em modelo para fazer...
Qual é a importância da matriz de chapéu, , na análise de regressão?H=X(X′X)−1X′H=X(X′X)−1X′H=X(X^{\prime}X )^{-1}X^{\prime} É apenas para um cálculo mais
Suponha que você queira estimar um modelo linear: ( nnn observações da resposta p + 1p+1p+1 preditores) E ( yEu) = β0 0+ ∑j = 1pβjxeu jE(yEu)=β0 0+∑j=1pβjxEuj\mathbb{E}(y_i) = \beta_0 + \sum_{j=1}^p \beta_j x_{ij} Uma maneira de fazer isso é através da solução OLS, ou seja, escolha os...
Quero calcular as taxas de incidência para apresentar as taxas de risco, a fim de apresentar medidas de risco relativas e absolutas. Vi em outros estudos que essas taxas de incidência podem ser calculadas usando modelos de Poisson com tempo de acompanhamento no modelo como um deslocamento. Então,...
Quero executar uma regressão com 4 a 5 variáveis explicativas, mas tenho apenas 15 observações. Não sendo possível assumir que essas variáveis são normalmente distribuídas, existe um método de regressão não paramétrico ou outro
Sou iniciante na análise de sobrevivência, embora tenha algum conhecimento em classificação e regressão. Para regressão, temos estatísticas quadradas de MSE e R. Mas como podemos dizer que o modelo de sobrevivência A é superior ao modelo de sobrevivência B, além de algum tipo de gráfico (curva...
Considere um modelo linear yEu= α + βxEu+ ϵEuyi=α+βxi+ϵiy_i= \alpha + \beta x_i + \epsilon_i e as estimativas para o declive e interceptar α e usando mínimos quadrados ordinários. Essa referência para uma estatística matemática faz a afirmação de que e são independentes (na prova de seu...
Na regressão linear, encontrei um resultado agradável que, se encaixarmos no modelo E[Y]=β1X1+β2X2+c,E[Y]=β1X1+β2X2+c,E[Y] = \beta_1 X_1 + \beta_2 X_2 + c, então, se padronizarmos e centralizarmos os dados , e ,X 1 X 2YYYX1X1X_1X2X2X_2 R2=Cor(Y,X1)β1+Cor(Y,X2)β2.R2=Cor(Y,X1)β1+Cor(Y,X2)β2.R^2 =...
No método dos mínimos quadrados, queremos estimar os parâmetros desconhecidos no modelo: Yj= α + βxj+ εj( j = 1 ... n )Yj=α+βxj+εj(j=1 ...n)Y_j = \alpha + \beta x_j + \varepsilon_j \enspace (j=1...n) Depois de fazer isso (para alguns valores observados), obtemos a linha de regressão...
Anos atrás, eu encontrei essa identidade através da experimentação brincando com dados e transformações. Depois de explicar ao meu professor de estatística, ele entrou na aula seguinte com uma prova de uma página, usando notação de vetor e matriz. Infelizmente, perdi o papel que ele me deu. (Isso...
Na análise de regressão multivariada, parece que as pessoas usam diferentes definições de odds ratio ajustada. Você poderia esclarecer para mim o que é um OR ajustado e como ele difere de um OR não ajustado
Um instrutor da minha universidade fez uma pergunta como essa (não para trabalhos de casa, pois a aula terminou e eu não participei). Não consigo descobrir como abordar isso. A questão diz respeito a 2 sacas cada uma contendo uma variedade de diferentes tipos de frutas: A primeira sacola contém...
Meu entendimento é que mesmo a regressão não causa causalidade. Só pode dar associação entre as variáveis y ex variáveis e possivelmente uma direção. Estou correcto? Muitas vezes encontrei frases semelhantes a "x prediz y", mesmo na maioria dos livros didáticos e em várias páginas de cursos...
Uso a decomposefunção Re crio os três componentes da minha série temporal mensal (tendência, sazonal e aleatória). Se plotar o gráfico ou olhar para a tabela, posso ver claramente que a série temporal é afetada pela sazonalidade. No entanto, quando regredo a série temporal para as 11 variáveis...
Eu tenho uma variável dependente que pode variar de 0 a infinito, com 0s sendo realmente observações corretas. Entendo que os modelos de censura e Tobit só se aplicam quando o valor real de é parcialmente desconhecido ou ausente, caso em que os dados são considerados truncados. Mais algumas...
Tento prever uma pontuação de equilíbrio e tentei vários métodos de regressão diferentes. Uma coisa que notei é que os valores previstos parecem ter algum tipo de limite superior. Ou seja, o saldo real está em , mas minhas previsões atingem cerca de . O gráfico a seguir mostra o saldo real versus o...
Suponha que, em uma análise de regressão em R, eu tenha uma variável independente do tipo de fator com 3 níveis no meu conjunto de dados de trem. Mas no conjunto de dados de teste essa mesma variável de fator tem 5 níveis. Portanto, não posso prever os valores de resposta para o conjunto de dados...
Às vezes assumimos que os regressores são fixos, ou seja, não são estocásticos. Eu acho que isso significa que todos os nossos preditores, estimativas de parâmetros etc. são incondicionais, certo? Posso ir tão longe que eles não são mais variáveis aleatórias? Se, por outro lado, aceitarmos que a...