Q&a Como Tips

Como calcular raiz quadrada do erro quadrático médio

O desvio médio quadrático ( RMSD ) ou erro quadrático médio ( RMSE ) é uma medida frequentemente usada das diferenças entre os valores (valores de amostra ou população) previstos por um modelo ou um estimador e os valores observados. O RMSD representa a raiz quadrada do segundo momento amostral das diferenças entre os valores previstos e os valores observados ou a média quadrática dessas diferenças. Esses desvios são chamados de resíduos quando os cálculos são realizados sobre a amostra de dados que foi usada para a estimativa e são chamados de erros(ou erros de predição) quando calculado fora da amostra. O RMSD serve para agregar as magnitudes dos erros nas previsões para vários pontos de dados em uma única medida de poder preditivo. RMSD é uma medida de precisão para comparar erros de previsão de diferentes modelos para um determinado conjunto de dados e não entre conjuntos de dados, pois depende da escala. [1]

O RMSD é sempre não negativo e um valor 0 (quase nunca alcançado na prática) indicaria um ajuste perfeito aos dados. Em geral, um RMSD mais baixo é melhor do que um mais alto. No entanto, as comparações entre diferentes tipos de dados seriam inválidas porque a medida depende da escala dos números usados.

RMSD é a raiz quadrada da média dos erros quadrados. O efeito de cada erro no RMSD é proporcional ao tamanho do erro quadrático; portanto, erros maiores têm um efeito desproporcionalmente grande no RMSD. Conseqüentemente, o RMSD é sensível a outliers. [2] [3]

Fórmula

O RMSD de um estimador em relação a um parâmetro estimado é definido como a raiz quadrada do erro quadrático médio : θ ^ {\ displaystyle {\ hat {\ theta}}}

θ {\ displaystyle \ theta}

RMSD ⁡ ( θ ^ ) = MSE ⁡ ( θ ^ ) = E ⁡ ( ( θ ^ - θ ) 2 ) . {\ displaystyle \ operatorname {RMSD} ({\ hat {\ theta}}) = {\ sqrt {\ operatorname {MSE} ({\ hat {\ theta}})}} = {\ sqrt {\ operatorname {E} (({\ hat {\ theta}} - \ theta) ^ {2})}}.}

Para um estimador imparcial , o RMSD é a raiz quadrada da variância, conhecida como desvio padrão .

O RMSD de valores previstos para tempos t de uma variável dependente de regressão com variáveis observadas ao longo de T vezes, é calculado para T previsões diferentes como a raiz quadrada da média dos quadrados dos desvios: y ^ t {\ displaystyle {\ hat {y}} _ {t}} y t , {\displaystyle y_{t},}

RMSD = ∑ t = 1 T ( y ^ t − y t ) 2 T . {\displaystyle \operatorname {RMSD} ={\sqrt {\frac {\sum _{t=1}^{T}({\hat {y}}_{t}-y_{t})^{2}}{T}}}.}

(Para regressões em dados transversais , o subscrito t é substituído por i e T é substituído por n .)

Em algumas disciplinas, o RMSD é usado para comparar diferenças entre duas coisas que podem variar, nenhuma das quais é aceita como o "padrão". Por exemplo, ao medir a diferença média entre duas séries temporais e , a fórmula torna-se x 1 , t {\displaystyle x_{1,t}} x 2 , t {\displaystyle x_{2,t}}

RMSD = ∑ t = 1 T ( x 1 , t − x 2 , t ) 2 T . {\displaystyle \operatorname {RMSD} ={\sqrt {\frac {\sum _{t=1}^{T}(x_{1,t}-x_{2,t})^{2}}{T}}}.}

Normalização

A normalização do RMSD facilita a comparação entre conjuntos de dados ou modelos com escalas diferentes. Embora não haja meios consistentes de normalização na literatura, as escolhas comuns são a média ou o intervalo (definido como o valor máximo menos o valor mínimo) dos dados medidos: [4]

N R M S D = R M S D y max − y min {\displaystyle \mathrm {NRMSD} ={\frac {\mathrm {RMSD} }{y_{\max }-y_{\min }}}} ou . N R M S D = R M S D y ¯ {\displaystyle \mathrm {NRMSD} ={\frac {\mathrm {RMSD} }{\bar {y}}}}

Este valor é comumente referido como erro ou desvio quadrático médio normalizado (NRMSD ou NRMSE) e frequentemente expresso como uma porcentagem, onde valores mais baixos indicam menos variância residual. Em muitos casos, especialmente para amostras menores, o intervalo da amostra provavelmente será afetado pelo tamanho da amostra, o que dificultaria as comparações.

Outro método possível para tornar o RMSD uma medida de comparação mais útil é dividir o RMSD pelo intervalo interquartil . Ao dividir o RMSD com o IQR, o valor normalizado fica menos sensível para valores extremos na variável de destino.

R M S D I Q R = R M S D I Q R {\displaystyle \mathrm {RMSDIQR} ={\frac {\mathrm {RMSD} }{IQR}}} Onde I Q R = Q 3 − Q 1 {\displaystyle IQR=Q_{3}-Q_{1}}

com e onde CDF −1 é a função de quantil . Q 1 = CDF − 1 ( 0.25 ) {\displaystyle Q_{1}={\text{CDF}}^{-1}(0.25)} Q 3 = CDF − 1 ( 0.75 ) , {\displaystyle Q_{3}={\text{CDF}}^{-1}(0.75),}

Ao normalizar pelo valor médio das medições, o termo coeficiente de variação do RMSD, CV (RMSD) pode ser usado para evitar ambigüidade. [5] Isso é análogo ao coeficiente de variação com o RMSD tomando o lugar do desvio padrão .

C V ( R M S D ) = R M S D y ¯ . {\displaystyle \mathrm {CV(RMSD)} ={\frac {\mathrm {RMSD} }{\bar {y}}}.}

Erro médio absoluto

Alguns pesquisadores recomendam o uso do erro médio absoluto (MAE) em vez do desvio quadrático médio. O MAE possui vantagens na interpretabilidade sobre o RMSD. MAE é a média dos valores absolutos dos erros. O MAE é fundamentalmente mais fácil de entender do que a raiz quadrada da média dos erros quadrados. Além disso, cada erro influencia o MAE em proporção direta ao valor absoluto do erro, o que não é o caso do RMSD. [2]

Formulários

Em meteorologia , para ver com que eficácia um modelo matemático prevê o comportamento da atmosfera .
Em bioinformática , o desvio quadrático médio da raiz das posições atômicas é a medida da distância média entre os átomos de proteínas sobrepostas .
Na concepção de fármacos com base estrutura , o RMSD é uma medida da diferença entre uma conformação cristalina do ligando de conformação e um encaixe de predição.
Em economia , o RMSD é usado para determinar se um modelo econômico se encaixa nos indicadores econômicos . Alguns especialistas argumentaram que o RMSD é menos confiável do que o erro relativo absoluto. [6]
Em psicologia experimental , o RMSD é usado para avaliar quão bem os modelos matemáticos ou computacionais de comportamento explicam o comportamento empiricamente observado.
No GIS , o RMSD é uma medida usada para avaliar a precisão da análise espacial e sensoriamento remoto.
Em hidrogeologia , RMSD e NRMSD são usados para avaliar a calibração de um modelo de água subterrânea. [7]
Na ciência da imagem , o RMSD é parte da relação sinal-ruído de pico , uma medida usada para avaliar o desempenho de um método para reconstruir uma imagem em relação à imagem original.
Na neurociência computacional , o RMSD é usado para avaliar o quão bem um sistema aprende um determinado modelo. [8]
Na espectroscopia de ressonância magnética nuclear de proteínas , o RMSD é usado como uma medida para estimar a qualidade do feixe de estruturas obtido.
As inscrições para o Prêmio Netflix foram julgadas usando o RMSD dos valores "verdadeiros" não divulgados do conjunto de dados de teste.
Na simulação do consumo de energia de edifícios, o RMSE e o CV (RMSE) são usados para calibrar modelos para medir o desempenho do edifício. [9]
Na cristalografia de raios-X , RMSD (e RMSZ) é usado para medir o desvio das coordenadas moleculares internas que se desviam dos valores da biblioteca de restrições.

Veja também

Raiz quadrada média
Erro médio absoluto
Desvio médio absoluto
Desvio médio sinalizado
Desvio médio quadrado
Desvios quadrados
Erros e resíduos nas estatísticas

Referências

^ Hyndman, Rob J .; Koehler, Anne B. (2006). "Outra olhada nas medidas de precisão das previsões". International Journal of Forecasting . 22 (4): 679–688. CiteSeerX 10.1.1.154.9771 . doi : 10.1016 / j.ijforecast.2006.03.001 .
^ a b Pôncio, Robert; Thontteh, Olufunmilayo; Chen, Hao (2008). "Componentes de informação para comparação de resolução múltipla entre mapas que compartilham uma variável real". Estatísticas Ecológicas Ambientais . 15 (2): 111–142. doi : 10.1007 / s10651-007-0043-y .
^ Willmott, Cort; Matsuura, Kenji (2006). “Sobre o uso de medidas de erro dimensionadas para avaliar o desempenho de interpoladores espaciais”. International Journal of Geographical Information Science . 20 : 89–102. doi : 10.1080 / 13658810500286976 .
^ "Wiki do Programa de Pesquisa das Entradas Costeiras (CIRP) - Estatísticas" . Retirado em 4 de fevereiro de 2015 .
^ "FAQ: Qual é o coeficiente de variação?" . Página visitada em 19 de fevereiro de 2019 .
^ Armstrong, J. Scott; Collopy, Fred (1992). "Medidas de erro para generalizar sobre métodos de previsão: comparações empíricas" (PDF) . International Journal of Forecasting . 8 (1): 69–80. CiteSeerX 10.1.1.423.508 . doi : 10.1016 / 0169-2070 (92) 90008-w .
^ Anderson, MP; Woessner, WW (1992). Modelagem Aplicada de Água Subterrânea: Simulação de Fluxo e Transporte Advective (2ª ed.). Academic Press.
^ Modelo de rede neural do conjunto
^ ANSI / BPI-2400-S-2012: Prática padrão para qualificação padronizada de previsões de economia de energia para toda a casa por calibração para o histórico de uso de energia

Como calcular raiz quadrada do erro quadrático médio

Fórmula

Normalização

Erro médio absoluto

Formulários

Veja também

Referências

Postagens relacionadas

Como fazer comparador de carga minecraft

Quando a massa não cresce o que fazer

O que é regra de 3

A festa de sao joao é uma festa popular

Para ser pediatra estuda quantos anos

5. qual é a expressão que representa o resul-tado da multiplicação (7-5 sqrt 3 )*(2-8 sqrt 3 )^ -

Os planos de ensino são também considerados ferramentas de avaliação que podem reorientar o trabalho

Licença de maternidade são quantos dias

Como achar a raiz quadra de 79

O que é darwinismo social brainly

Toplist

Top 7 registro de 1 4 de volta 2022

Top 5 explique no caderno qual das palavras entre parênteses funciona como adjetivo e deve ser flexionada 2022

Top 7 sinais de autismo em bebe de 6 meses 2022

Top 7 frutas que fazem bem pra pele 2022

Top 8 qual a função da unicef 2022

Top 9 resultado do bicho de rio de janeiro 2022

Top 8 imagem de fenix para tatuagem 2022

Top 8 jogo do bicho das 14hs de hoje mg 2022

Top 7 as dezenas dos bichos 2022

Última postagem

Tag