- Erro quadrático médio da raiz
- soma residual de quadrados
- erro padrão residual
- erro quadrático médio
- erro de teste
Eu achava que costumava entender esses termos, mas quanto mais eu faço problemas estatísticos, mais me confundei com o que acho. Gostaria de alguma garantia e um exemplo concreto
Posso encontrar facilmente as equações on-line, mas estou tendo problemas para obter uma explicação desses termos para 'explicar como se eu tivesse 5', para poder cristalizar na minha cabeça as diferenças e como uma leva à outra.
Se alguém puder pegar esse código abaixo e apontar como calcularia cada um desses termos, eu o apreciaria. Código R seria ótimo ..
Usando este exemplo abaixo:
summary(lm(mpg~hp, data=mtcars))
Mostre-me no código R como encontrar:
rmse = ____
rss = ____
residual_standard_error = ______ # i know its there but need understanding
mean_squared_error = _______
test_error = ________
Pontos de bônus por explicar como eu tenho 5 diferenças / semelhanças entre elas. exemplo:
rmse = squareroot(mss)
r
regression
residuals
user3788557
fonte
fonte
Respostas:
Conforme solicitado, ilustro usando uma regressão simples usando os
mtcars
dados:O erro quadrático médio (MSE) é a média do quadrado dos resíduos:
O erro quadrático médio da raiz (RMSE) é a raiz quadrada do MSE:
A soma residual dos quadrados (RSS) é a soma dos resíduos quadrados:
O erro padrão residual (RSE) é a raiz quadrada de (RSS / graus de liberdade):
O mesmo cálculo, simplificado porque já calculamos anteriormente
rss
:O termo erro de teste no contexto de regressão (e outras técnicas de análise preditiva) geralmente se refere ao cálculo de uma estatística de teste nos dados de teste, diferente dos dados de treinamento.
Em outras palavras, você estima um modelo usando uma parte de seus dados (geralmente uma amostra de 80%) e depois calcula o erro usando a amostra de espera. Novamente, eu ilustro usando
mtcars
, desta vez com uma amostra de 80%Estime o modelo e preveja com os dados de espera:
Combine os dados originais e a previsão em um quadro de dados
Agora calcule suas estatísticas de teste da maneira normal. Ilustro MSE e RMSE:
Observe que esta resposta ignora a ponderação das observações.
fonte
O pôster original pedia uma resposta "explique como se eu tivesse 5 anos". Digamos que seu professor convida você e seus colegas para adivinhar a largura da mesa do professor. Cada um dos 20 alunos da turma pode escolher um dispositivo (régua, balança, fita ou critério) e pode medir a tabela 10 vezes. Todos são convidados a usar diferentes locais de partida no dispositivo para evitar a leitura repetida do mesmo número; a leitura inicial deve ser subtraída da leitura final para finalmente obter uma medição de largura (você aprendeu recentemente como fazer esse tipo de matemática).
No total, foram realizadas 200 medidas de largura realizadas pela classe (20 alunos, 10 medidas cada). As observações são entregues ao professor que analisará os números. Subtrair as observações de cada aluno de um valor de referência resultará em outros 200 números, chamados desvios . O professor calcula a média da amostra de cada aluno separadamente, obtendo 20 médias . Subtrair as observações de cada aluno de sua média individual resultará em 200 desvios da média, chamados resíduos . Se o resíduo médio fosse calculado para cada amostra, você notaria que é sempre zero. Se, em vez disso, quadrado cada resíduo, calculá-lo pela média e, finalmente, desfazer o quadrado, obtemos o desvio padrão. (A propósito, chamamos esse último cálculo de raiz quadrada (pense em encontrar a base ou o lado de um determinado quadrado); portanto, toda a operação é chamada de raiz quadrada média , para abreviar; o desvio padrão das observações é igual a raiz quadrada média dos resíduos.)
Mas o professor já sabia a verdadeira largura da tabela, com base em como ela foi projetada, construída e verificada na fábrica. Portanto, outros 200 números, chamados de erros , podem ser calculados como o desvio das observações em relação à largura real. Um erro médio pode ser calculado para cada amostra de aluno. Da mesma forma, 20 desvios padrão do erro , ou erro padrão , podem ser calculados para as observações. Mais 20 erros de raiz quadrada médiaos valores também podem ser calculados. Os três conjuntos de 20 valores estão relacionados como sqrt (me ^ 2 + se ^ 2) = rmse, em ordem de aparência. Com base no rmse, o professor pode julgar qual aluno forneceu a melhor estimativa para a largura da tabela. Além disso, analisando separadamente os 20 erros médios e os 20 valores de erro padrão, o professor pode instruir cada aluno sobre como melhorar suas leituras.
Como verificação, o professor subtraiu cada erro de seu respectivo erro médio, resultando em mais 200 números, que chamaremos de erros residuais (isso geralmente não é feito). Como acima, o erro residual médio é zero, portanto o desvio padrão dos erros residuais ou do erro residual padrão é o mesmo que o erro padrão e, de fato, também é o erro residual da raiz quadrada da média quadrada . (Veja abaixo para detalhes.)
Agora, aqui está algo de interesse para o professor. Podemos comparar a média de cada aluno com o restante da turma (20 significa total). Assim como definimos antes desses valores de ponto:
também podemos definir agora:
Somente se a classe dos alunos for considerada imparcial, ou seja, se mem = 0, então sem = sm = rmsem; isto é, erro padrão da média, desvio padrão da média e erro da raiz quadrada da média, a média pode ser a mesma desde que o erro médio da média seja zero.
Se tivéssemos tirado apenas uma amostra, ou seja, se houvesse apenas um aluno em sala de aula, o desvio padrão das observações poderia ser usado para estimar o desvio padrão da média (sm), como sm ^ 2 ~ s ^ 2 / n, onde n = 10 é o tamanho da amostra (o número de leituras por aluno). Os dois concordam melhor à medida que o tamanho da amostra aumenta (n = 10,11, ...; mais leituras por aluno) e o número de amostras cresce (n '= 20,21, ...; mais alunos na sala de aula). (Uma ressalva: um "erro padrão" não qualificado se refere mais frequentemente ao erro padrão da média, e não ao erro padrão das observações.)
Aqui estão alguns detalhes dos cálculos envolvidos. O valor verdadeiro é denotado t.
Operações de ponto a ponto:
CONJUNTOS INTRA-AMOSTRA:
PONTOS INTRA-AMOSTRA (consulte a tabela 1):
CONJUNTOS INTER-AMOSTRA (CONJUNTO):
PONTOS INTER-AMOSTRA (ENSEMBLE) (consulte a tabela 2):
fonte
Eu também sinto que todos os termos são muito confusos. Eu sinto fortemente que é necessário explicar por que temos essas muitas métricas.
Aqui está minha nota sobre SSE e RMSE:
Primeira métrica: soma dos erros quadráticos (SSE). Outros nomes, Soma dos quadrados residuais (RSS), Soma dos resíduos quadrados (SSR).
Se estamos na comunidade de otimização, o SSE é amplamente usado. É porque é o objetivo da otimização, onde a otimização é
Segunda métrica: erro de raiz quadrada média (RMSE) . Outros nomes, desvio da raiz média dos quadrados.
RMSE é
fonte