Eu tenho que calcular a inclinação percentual média da subida para um conjunto de dados grande, o método básico é detalhado aqui. No entanto, comecei a pensar se a média harmônica pode ser mais apropriada que a média aritmética padrão, já que é tecnicamente uma taxa de mudança. Eu não vi isso aparecer em nenhuma das outras discussões sobre a inclinação média de pontos, áreas, linhas, etc. Deve ser bastante simples de realizar.
editar: O objetivo do cálculo da inclinação média nesse caso é gerar um parâmetro (de muitos) para ser usado na modelagem de limites de iniciação de canal. Eu tenho um conjunto de locais de cabeçalho de canal coletados em campo que coletarei a acumulação de fluxo, vários parâmetros médios de subida, etc., e usarei regressão linear múltipla para tentar descrever os limites de acumulação em termos dos outros parâmetros.
fonte
Respostas:
A inclinação média parece uma quantidade natural, mas é uma coisa estranha. Por exemplo, a inclinação média de uma planície horizontal plana é zero, mas quando você adiciona um pouquinho de ruído aleatório com média zero a um DEM dessa planície, a inclinação média só pode subir. Outros comportamentos estranhos são a dependência da inclinação média da resolução do DEM, que eu documentei aqui , e sua dependência de como o DEM foi criado. Por exemplo, alguns DEMs criados a partir de mapas de contorno são na verdade um pouco em socalcos - com pequenos saltos bruscos onde as linhas de contorno se encontram - mas, de outra forma, são representações precisas da superfície como um todo. Esses saltos bruscos, se recebem muito ou pouco peso no processo de cálculo da média, podem alterar a inclinação média.
A apresentação da ponderação é relevante porque, na verdade, uma média harmônica (e outras formas) estão ponderando diferencialmente as inclinações. Para entender isso, considere a média harmônica de apenas dois números positivos x e y . Por definição,
onde os pesos são a = y / (x + y) eb = x / (x + y). (Eles merecem ser chamados de "pesos" porque são positivos e somados à unidade. Para a média aritmética, os pesos são a = 1/2 eb = 1/2). Evidentemente, o peso anexado a x , igual a y / (x + y), é grande quando x é pequeno comparado a y . Assim, harmônico significa sobre-ponderar os valores menores .
Pode ajudar a ampliar a questão. A média harmônica é uma de uma família de médias parametrizada por um valor real p . Assim como a média harmônica é obtida calculando-se a média dos recíprocos de x e y (e depois tomando o recíproco de sua média), em geral, podemos calcular a média das enésimas potências de x e y (e então tomar a enésima potência do resultado) ) Os casos p = 1 ep = -1 são as médias aritmética e harmônica, respectivamente. (Podemos definir uma média para p = 0 assumindo limites e, assim, obter a média geométrica como membro dessa família também.) Como pdiminui de 1, os valores menores são cada vez mais pesados; e à medida que p aumenta de 1, os valores maiores são cada vez mais pesados. Daqui resulta que a média só pode aumentar à medida que p aumenta e deve diminuir à medida que p diminui. (Isso é evidente na segunda figura abaixo, na qual todas as três linhas são planas ou aumentam da esquerda para a direita.)
Tendo uma visão prática do assunto, poderíamos estudar o comportamento de vários meios de declives e adicionar esse conhecimento à nossa caixa de ferramentas analíticas: quando esperamos que os declives entrem em um relacionamento de tal maneira que inclinações menores devam receber mais uma influência, podemos escolher uma média com p menor que 1; e, inversamente, podemos aumentar p acima de 1 para enfatizar as maiores inclinações. Para esse fim, vamos considerar várias formas de perfis de drenagem nas proximidades de um ponto.
Para mostrar o que poderia acontecer, considerei três terrenos locais qualitativamente diferentes : um é onde todas as inclinações são iguais (o que faz uma boa referência); outra é onde localmente estamos situados no fundo de uma tigela: ao nosso redor as encostas são zero, mas depois aumentam gradualmente e, eventualmente, ao redor da borda, tornam-se arbitrariamente grandes. O inverso dessa situação ocorre onde as encostas próximas são moderadas, mas depois se nivelam longe de nós. Isso parece cobrir uma gama realista de comportamentos.
Aqui estão gráficos pseudo-3D desses três tipos de formas de drenagem:
Aqui eu calculei a inclinação média de cada uma - com a mesma codificação de cores - em função de p , deixando p variar de -1 (média harmônica) a 2.
É claro que a linha azul é horizontal: não importa qual valor p assuma, a média de uma inclinação constante não pode ser outra coisa senão aquela constante (que foi definida como 1 para referência). As inclinações altas ao redor da borda oposta da tigela vermelha influenciam fortemente as inclinações médias conforme p varia: observe como elas se tornam maiores quando p excede 1. A borda horizontal na terceira superfície (verde-dourada) causa a média harmônica (p = - 1) para ser zero.
Vale ressaltar que as posições relativas das três curvas mudam em p = 0 (a média geométrica): para p maior que 0, a bacia vermelha tem inclinações médias maiores que o azul, enquanto que para p negativo , a bacia vermelha tem média menor inclinações do que o azul. Assim, sua escolha de p pode alterar até a classificação relativa das inclinações médias.
O efeito profundo da média harmônica (p = -1) na forma verde-amarela deve nos dar uma pausa: mostra que, quando há declives suficientemente pequenos na drenagem, a média harmônica pode ser tão pequena que supera qualquer influência de todas as outras pistas.
No espírito de uma análise exploratória de dados, você pode considerar a possibilidade de variar p - talvez variando de 0 a um pouco maior que 1 para evitar pesos extremos - e descobrir qual valor cria a melhor relação entre a inclinação média e a variável que você estão modelando (como limites de inicialização de canal). "Melhor" geralmente é entendido no sentido de "mais linear" ou "criar resíduos [homoscedásticos] constantes" em um modelo de regressão.
fonte
Adotei uma abordagem empírica para encontrar uma resposta complementar à excelente resposta teórica da whuber. Decidi calcular a inclinação em graus e a média usando uma média angular . Em seguida, calculei as médias aritméticas e harmônicas da inclinação percentual. Criei um conjunto de pontos de amostra localizados aleatoriamente na área de estudo. Solicitei 2000 pontos com uma distância mínima de 100m, o que resultou em 1326 pontos. Eu amostramos os valores de cada quadriculação média da inclinação em cada ponto e converti a média percentual em graus usando a fórmula
Degrees = atan(percent/100)
. Minha suposição aqui é que a média angular produzirá a inclinação média "correta" em graus, e qualquer porcentagem média que se aproximou mais seria o procedimento correto.Em seguida, comparei todos os valores diferentes de zero usando um teste de Kruskal-Wallace (as suposições são de que, para a maioria dos valores de inclinação zero, seria zero em todos os três e que valores zero mascarariam as diferenças entre os métodos). Eu encontrei uma diferença significativa entre os três (qui-quadrado = 17,9570, DF = 2, p = 0,0001), então examinei mais os dados usando o Procedimento de Dunn usando alfa = 0,05 (Elliot e Hynan 2011) . O resultado final é que as médias aritmética e harmônica são significativamente diferentes umas das outras, mas as neigher são significativamente diferentes da média angular:
Se todas as minhas suposições estavam corretas (elas podem muito bem não estar), isso significa que, embora os meios harmônicos e aritméticos criem valores diferentes um do outro, ambos são "muito próximos" da média angular para serem aceitáveis. Existem duas outras advertências aqui em que posso pensar (por favor, adicione outras se você pensar nelas):
fonte
Dada a suposição de que nenhum parâmetro que define a inclinação é conhecido, qualquer estatístico diria usar a inclinação que minimiza os desvios RMS dos dados. (É claro que os exemplos de whuber não se qualificam, pois ele escolheu formas de relevo geradas matematicamente, mas para formas de relevo reais, a suposição de parâmetros desconhecidos deve ser válida.)
fonte