Cálculo da inclinação média: média harmônica ou aritmética?

11

Eu tenho que calcular a inclinação percentual média da subida para um conjunto de dados grande, o método básico é detalhado aqui. No entanto, comecei a pensar se a média harmônica pode ser mais apropriada que a média aritmética padrão, já que é tecnicamente uma taxa de mudança. Eu não vi isso aparecer em nenhuma das outras discussões sobre a inclinação média de pontos, áreas, linhas, etc. Deve ser bastante simples de realizar.

editar: O objetivo do cálculo da inclinação média nesse caso é gerar um parâmetro (de muitos) para ser usado na modelagem de limites de iniciação de canal. Eu tenho um conjunto de locais de cabeçalho de canal coletados em campo que coletarei a acumulação de fluxo, vários parâmetros médios de subida, etc., e usarei regressão linear múltipla para tentar descrever os limites de acumulação em termos dos outros parâmetros.

Jay Guarneri
fonte
4
Depende do motivo pelo qual você está computando a inclinação média. Qual é o propósito? Que quantidade física você está tentando medir? Embora muitas formas de média sejam legítimas, tenha cuidado com a média harmônica: ela causa problemas quando qualquer inclinação é zero, o que frequentemente acontece.
whuber

Respostas:

10

A inclinação média parece uma quantidade natural, mas é uma coisa estranha. Por exemplo, a inclinação média de uma planície horizontal plana é zero, mas quando você adiciona um pouquinho de ruído aleatório com média zero a um DEM dessa planície, a inclinação média só pode subir. Outros comportamentos estranhos são a dependência da inclinação média da resolução do DEM, que eu documentei aqui , e sua dependência de como o DEM foi criado. Por exemplo, alguns DEMs criados a partir de mapas de contorno são na verdade um pouco em socalcos - com pequenos saltos bruscos onde as linhas de contorno se encontram - mas, de outra forma, são representações precisas da superfície como um todo. Esses saltos bruscos, se recebem muito ou pouco peso no processo de cálculo da média, podem alterar a inclinação média.

A apresentação da ponderação é relevante porque, na verdade, uma média harmônica (e outras formas) estão ponderando diferencialmente as inclinações. Para entender isso, considere a média harmônica de apenas dois números positivos x e y . Por definição,

Harmonic mean(x,y) = 1 / ((1/x + 1/y)/2) = x (y/(x+y)) + y (x/(x+y)) = a x + b y

onde os pesos são a = y / (x + y) eb = x / (x + y). (Eles merecem ser chamados de "pesos" porque são positivos e somados à unidade. Para a média aritmética, os pesos são a = 1/2 eb = 1/2). Evidentemente, o peso anexado a x , igual a y / (x + y), é grande quando x é pequeno comparado a y . Assim, harmônico significa sobre-ponderar os valores menores .

Pode ajudar a ampliar a questão. A média harmônica é uma de uma família de médias parametrizada por um valor real p . Assim como a média harmônica é obtida calculando-se a média dos recíprocos de x e y (e depois tomando o recíproco de sua média), em geral, podemos calcular a média das enésimas potências de x e y (e então tomar a enésima potência do resultado) ) Os casos p = 1 ep = -1 são as médias aritmética e harmônica, respectivamente. (Podemos definir uma média para p = 0 assumindo limites e, assim, obter a média geométrica como membro dessa família também.) Como pdiminui de 1, os valores menores são cada vez mais pesados; e à medida que p aumenta de 1, os valores maiores são cada vez mais pesados. Daqui resulta que a média só pode aumentar à medida que p aumenta e deve diminuir à medida que p diminui. (Isso é evidente na segunda figura abaixo, na qual todas as três linhas são planas ou aumentam da esquerda para a direita.)

Tendo uma visão prática do assunto, poderíamos estudar o comportamento de vários meios de declives e adicionar esse conhecimento à nossa caixa de ferramentas analíticas: quando esperamos que os declives entrem em um relacionamento de tal maneira que inclinações menores devam receber mais uma influência, podemos escolher uma média com p menor que 1; e, inversamente, podemos aumentar p acima de 1 para enfatizar as maiores inclinações. Para esse fim, vamos considerar várias formas de perfis de drenagem nas proximidades de um ponto.

Para mostrar o que poderia acontecer, considerei três terrenos locais qualitativamente diferentes : um é onde todas as inclinações são iguais (o que faz uma boa referência); outra é onde localmente estamos situados no fundo de uma tigela: ao nosso redor as encostas são zero, mas depois aumentam gradualmente e, eventualmente, ao redor da borda, tornam-se arbitrariamente grandes. O inverso dessa situação ocorre onde as encostas próximas são moderadas, mas depois se nivelam longe de nós. Isso parece cobrir uma gama realista de comportamentos.

Aqui estão gráficos pseudo-3D desses três tipos de formas de drenagem:

Parcelas em 3D

Aqui eu calculei a inclinação média de cada uma - com a mesma codificação de cores - em função de p , deixando p variar de -1 (média harmônica) a 2.

Inclinação significa vs p

É claro que a linha azul é horizontal: não importa qual valor p assuma, a média de uma inclinação constante não pode ser outra coisa senão aquela constante (que foi definida como 1 para referência). As inclinações altas ao redor da borda oposta da tigela vermelha influenciam fortemente as inclinações médias conforme p varia: observe como elas se tornam maiores quando p excede 1. A borda horizontal na terceira superfície (verde-dourada) causa a média harmônica (p = - 1) para ser zero.

Vale ressaltar que as posições relativas das três curvas mudam em p = 0 (a média geométrica): para p maior que 0, a bacia vermelha tem inclinações médias maiores que o azul, enquanto que para p negativo , a bacia vermelha tem média menor inclinações do que o azul. Assim, sua escolha de p pode alterar até a classificação relativa das inclinações médias.

O efeito profundo da média harmônica (p = -1) na forma verde-amarela deve nos dar uma pausa: mostra que, quando há declives suficientemente pequenos na drenagem, a média harmônica pode ser tão pequena que supera qualquer influência de todas as outras pistas.

No espírito de uma análise exploratória de dados, você pode considerar a possibilidade de variar p - talvez variando de 0 a um pouco maior que 1 para evitar pesos extremos - e descobrir qual valor cria a melhor relação entre a inclinação média e a variável que você estão modelando (como limites de inicialização de canal). "Melhor" geralmente é entendido no sentido de "mais linear" ou "criar resíduos [homoscedásticos] constantes" em um modelo de regressão.

whuber
fonte
Obrigado pela análise completa! Vou ter que refletir um pouco sobre isso.
Jay Guarneri
1

Adotei uma abordagem empírica para encontrar uma resposta complementar à excelente resposta teórica da whuber. Decidi calcular a inclinação em graus e a média usando uma média angular . Em seguida, calculei as médias aritméticas e harmônicas da inclinação percentual. Criei um conjunto de pontos de amostra localizados aleatoriamente na área de estudo. Solicitei 2000 pontos com uma distância mínima de 100m, o que resultou em 1326 pontos. Eu amostramos os valores de cada quadriculação média da inclinação em cada ponto e converti a média percentual em graus usando a fórmula Degrees = atan(percent/100). Minha suposição aqui é que a média angular produzirá a inclinação média "correta" em graus, e qualquer porcentagem média que se aproximou mais seria o procedimento correto.

Em seguida, comparei todos os valores diferentes de zero usando um teste de Kruskal-Wallace (as suposições são de que, para a maioria dos valores de inclinação zero, seria zero em todos os três e que valores zero mascarariam as diferenças entre os métodos). Eu encontrei uma diferença significativa entre os três (qui-quadrado = 17,9570, DF = 2, p = 0,0001), então examinei mais os dados usando o Procedimento de Dunn usando alfa = 0,05 (Elliot e Hynan 2011) . O resultado final é que as médias aritmética e harmônica são significativamente diferentes umas das outras, mas as neigher são significativamente diferentes da média angular:

Comparison           Diff        SE        q         q(0.05)    Conclude                      
------------------------------------------------------------------------------                
arith     harm      164.12    38.78     4.23       2.394    Reject                            
arith     angular   75.3      38.8      1.94       2.394    Do not reject                     
angular   harm      88.82     38.68     2.3        2.394    Do not reject                     

Se todas as minhas suposições estavam corretas (elas podem muito bem não estar), isso significa que, embora os meios harmônicos e aritméticos criem valores diferentes um do outro, ambos são "muito próximos" da média angular para serem aceitáveis. Existem duas outras advertências aqui em que posso pensar (por favor, adicione outras se você pensar nelas):

  1. Um tamanho de amostra maior pode encontrar uma diferença significativa entre as médias percentuais e médias angulares. No entanto, o tamanho da minha amostra foi de ~ 1000 pontos apenas para valores diferentes de zero.
  2. Como meus pontos de amostra foram realizados sem considerar as bacias de drenagem, pode haver alguma pseudo-replicação envolvida, pois qualquer inclinação média será relacionada a inclinações médias acima dela.
Jay Guarneri
fonte
1
Isso é interessante (+1), mas cuidado com as limitações. (1) Sim, se você escolher um tamanho de amostra maior, descobrirá que todas as diferenças são significativas. Portanto, não faz sentido realizar um teste de hipótese estatística: você deseja se concentrar na quantidade de diferença entre os procedimentos. (2) Seus resultados dependem inteiramente das propriedades reais dos seus dados. Eles variarão com outros conjuntos de dados. (3) A média angular é útil como referência, mas não é de forma alguma um valor preferido. O qual usar como referência depende inteiramente de como a média será usada em análises ou mapeamentos adicionais.
whuber
0

Dada a suposição de que nenhum parâmetro que define a inclinação é conhecido, qualquer estatístico diria usar a inclinação que minimiza os desvios RMS dos dados. (É claro que os exemplos de whuber não se qualificam, pois ele escolheu formas de relevo geradas matematicamente, mas para formas de relevo reais, a suposição de parâmetros desconhecidos deve ser válida.)

johnsankey
fonte
Esta resposta é apreciada, mas acho que não entende a situação. Mais significativamente, essas inclinações não são usadas para ajustar curvas: o conceito de "desvios RMS dos dados" simplesmente não é aplicável. Segundo, escolhi os tipos qualitativos de forma de relevo para abranger um amplo espectro do que realmente será encontrado; portanto, mantenho que eles fornecem informações úteis sobre o que esperar. Conjuntos de dados reais não contribuem muito para entender o que está acontecendo aqui, porque não existe uma inclinação média "verdadeira". A questão principal é que médias serão úteis ou informativas.
whuber
1
Aliás, acredito que tenho algumas qualificações como estatístico. Isso não torna minha opinião sobre esse assunto melhor ou pior: como com qualquer outra pessoa, preciso fazer o backup da maneira mais clara e objetiva possível e sou bastante suscetível a estar errado e ter que mudar de idéia: ) Eu apenas ofereço este ponto como um contraponto ao seu comentário "qualquer estatístico".
whuber
A questão de qual ajuste é útil, afirmo, depende de para que a inclinação deve ser usada. Para o potencial de desmoronamento do solo, por exemplo, as inclinações mais íngremes seriam mais pesadas em comparação com as encostas suaves, de acordo com um modelo de potencial de desdobramento vs. declive, então a abordagem de ajuste do RMS deve ser válida. Outros modelos de ponderação seriam usados ​​combinando com outros usos. Em suma, modele tudo o que sabemos por ponderação ou outros meios, depois confie no RMS como o modelo para tudo o que não sabemos, é o que estou sugerindo.
johnsankey
Concordo com a premissa desse comentário, John, mas não vejo como se segue sua conclusão. Se as inclinações mais íngremes receberem pesos mais pesados, parece que o RMS é exatamente o que você não quer fazer, porque pesa todos os desvios igualmente, independentemente da inclinação. Além disso, o RMS, como uma função de perda quadrática, não pode ser um substituto universal para o que outras técnicas podem alcançar, incluindo reexpressões não lineares da inclinação e o uso de funções de perda alternativas (como exploradas por métodos de ajuste robustos, por exemplo).
whuber
O RMS inclui pesos
johnsankey 20/03