Quando usar a distância euclidiana ponderada e como determinar os pesos a serem usados?

16

Eu tenho um conjunto de dados em que cada dado consiste em n medidas diferentes. Para cada medida, tenho um valor de referência. Gostaria de saber o quão perto cada dado está do valor de referência.

Pensei em usar a distância euclidiana ponderada da seguinte maneira:

dx,b=(i=1nwi(xibi)2))1/2

Onde

xi é o valor da i-ésima medida para os dados específicos

bi é o valor de referência correspondente para essa medida.

wi é o valor do peso entre eu à i-ésima medida, sujeito ao seguinte:

0<wi<1 ei=1n1

No entanto, com base neste documento, descobri que o peso a ser usado é o inverso da variância da i-ésima medida. Não acho que esse tipo de ponderação explique a importância que atribuirei a cada medida.

Portanto:

  1. Existem métodos para criar um conjunto de pesos que reflita a importância relativa de uma medida do observador ou o observador pode atribuir valores arbitrários para os pesos?

  2. É apropriado usar a distância euclidiana ponderada para resolver esse problema?

Sara
fonte

Respostas:

16

Pesos para padronização

W

Pesos por importância

Você é livre para colocar o que quiser como pesos, incluindo medidas de 'importância' (embora você possa padronizar antes da ponderação de importância, se as unidades de medida diferirem).

xbEuWEubEupode ser a posição do status quo em alguma dimensão, da qual as posições de vários atores diferem. Nesta aplicação, certamente preferiríamos medir em vez de afirmar tanto a saliência quanto a posição. De qualquer maneira, pesos grandes farão com que diferenças em questões não salientes tenham menos efeito na distância geral entre os atores se forem calculadas de acordo com sua primeira equação. Observe também que nesta versão não assumimos implicitamente nenhuma covariância relevante entre as posições, o que é uma reivindicação bastante forte.

Focando agora a questão 2: Na aplicação, acabei de descrever a justificativa para as ponderações e distâncias estabelecidas nas suposições da teoria dos jogos sobre estruturas de preferências transitivas e afins. Por fim, essas são as únicas razões pelas quais é 'apropriado' calcular distâncias dessa maneira. Sem eles, temos vários números que obedecem à desigualdade do triângulo.

Pesos como medição implícita

No tema da covariância, pode ser útil pensar no seu problema como um dos que identificam o subespaço relevante dentro do qual as distâncias fazem sentido substancial, supondo que muitas das medidas que você realmente mede coisas semelhantes. Um modelo de medição, por exemplo, análise fatorial, projetaria tudo por meio de combinação ponderada em um espaço comum em que as distâncias pudessem ser calculadas. Mas, novamente, teríamos que conhecer o contexto de sua pesquisa para dizer se isso faria sentido.

conjugado
fonte
obrigado por informações valiosas. mas tenho preocupações sobre como calcular pesos?