Combinando várias métricas para fornecer comparações / classificação de k objetos [Solicitação de pergunta e referência]

13

Coletando métricas sobre objetosknk

Suponha que eu colete métricas sobre objetos. Estou procurando maneiras válidas de comparar os objetos para que eles possam ser "classificados". Eu acho que isso pode ser um terreno bem trilhado (estatísticas esportivas como classificação total de zagueiros etc.), mas não estou familiarizado com essa área.k knkk

Quero responder à pergunta que objeto é melhor ?

Informações sobre as métricas coletadas

Para cada métrica , onde varia de 1 \ leq i \ leq n , a pontuação da métrica m_i varia de [0, r_i] . Observe que algumas dessas métricas terão máximos teóricos como 100 \% por cento, outros r_i serão apenas a pontuação máxima coletada na amostra (por exemplo, velocidade máxima, altura etc.).mi1 i n m i [ 0 , r i ] 100 % r ii1inmi[0,ri]100%ri

Normalizando / padronizando as pontuações métricas

Minha intuição é primeiro normalizar todas essas pontuações entre [0,1] , para que cada pontuação contribua igualmente para a pontuação geral, a ser calculada posteriormente.

Ou seja, para cada métrica mi a pontuação dessa métrica seria mimax(ri) , em que max(ri) é a pontuação máxima para essa métrica na amostra. Minha intuição não me permite ter certeza de que isso é válido, de modo que é minha pergunta 1: esse procedimento de normalização é válido?

Also for each question the implicit question is I am probably completely wrong, what resources and topics should I be studying?

Ponderando as métricas para minha comparação geral

Suponhamos ainda que desejo ponderar algumas métricas sobre outras. Parece-me algumas abordagens, mas vou descrever uma que estou tentando aproximar.

Eu estava pensando que um método possível seria fazer uma comparação pareada para cada métrica e perguntar a cada comparação: se eu visse uma redução de na métrica , quanto de um aumento na métrica compensaria essa redução ? m i m j10%mimj 0Se os pares não tiverem influência real um sobre o outro, eu poderia marcar isso como talvez?0

Terminaria com uma tabela de valores para minhas ponderações, preenchida com comparações pareadas dessa natureza. Pergunta 2: Eu precisaria ser consistente ao comparar v e v ? Ou eles podem ser não simétricos? Ou seja, se eu disser que uma redução de em precisa ser explicada por um aumento de em , posso dizer que uma redução de em precisa ser explicada por um aumento de em ? Isso seria válido?m j m j m i 10 % m i 20 % m j 10 % m j 50 % m imimjmjmi10%mi20%mj10%mj50%mi

Talvez eu pudesse ter uma média de cada coluna e ter isso como minha ponderação para a métrica?

Parece-me que um sistema de ponderação como esse diria quantitativamente coisas como "para eu avaliar o objeto sobre o objeto , quando a métrica de é 10% menor que de , eu preciso ver pelo menos um ganho de na métrica "b b m i a m i 20 % m jabbmiami20%mj .

Pergunta 3: E se eu começasse a incluir considerações mais complexas para que as comparações ou compensações não fossem lineares? Ou comparações mutlivariáveis? Talvez algumas pontuações devam ser negativas etc.?

A questão essencial Realmente, eu gostaria de saber quais tópicos e livros devo ler para poder responder a esse tipo de pergunta?

Obrigado

user2321
fonte

Respostas:

10

Pergunta incrível.

Pergunta 1 :

Abordo esse problema usando desvios padrão ( ) para criar uma escala padronizada em que é o número de desvios padrão da média ( ) e é o desvio padrão.n μ σnσnμσ

Desvio padrão

Vou usar um exemplo de agente de call center fazendo chamadas. Aqui está uma maneira possível de definir a escala usando :n

  • n nm+=n : métricas que você deseja maximizar. O relacionamento direto, conforme aumenta, aumenta a pontuação, pois diminui a pontuação diminui. Exemplo: número de vendas.nn
  • nm = -n: métricas que você deseja minimizar. Relação inversa, de modo que diminui, a pontuação aumenta. Exemplo: número de erros cometidos em uma chamada.n
  • nmμ=|n| : Métricas que você deseja o mais próximo possível da média. À medida que se afasta da média em qualquer direção, a pontuação diminui. Uma pontuação perfeita é 0, na mediana. Exemplo: o número de mensagens de voz / hangups / não chama solicitações que um agente recebeu (deve ser igualmente distribuído).n

Então você tem uma escala que é independente das unidades de medida, tamanho / amplitude, etc. Você pode normalizar facilmente a escala acima de onde é sempre o pior e é sempre o melhor. Portanto, cada métrica normalizada se torna: , e 0 1 ¯ m + ¯ m - ¯ m μ[0,1]01m¯+m¯m¯μ

Portanto, a solução simples ( ) se torna: f s = Σ ¯ m + + Σ ¯ m - + Σ ¯ m μfs

fs=m¯++m¯-+m¯μ

Questão 2

Com a solução acima para adicionar pesos assimétricos ( ) fornece a solução ponderada . Cada um pode ser pesado multiplicando cada uma das métricas pelo peso: fsWfW

fW=j+(W+1m¯+1+W+2m¯+2...W+j+m¯+j+)+j-(W-1m¯-1+W-1m¯-2...W-jm¯-j-)+jμ(Wμ1m¯μ1+Wμ2m¯μ2...Wμjm¯μjμ)

Ou, de forma mais sucinta:

fW=j+Wj+m¯+j++j-Wj-m¯-j-+jμWjμm¯μjμ

Agora você tem uma pontuação que pode levar em consideração pesos individuais, minimizando métricas, maximizando métricas e métricas desejadas próximas à média.

Questão 3

Exemplo

Agora que você tem a sua pontuação pode normalizá-la novamente e multiplicá-la contra um peso, se desejar uma unidade de medida. Seguindo o exemplo de agente do call center: * venda do agente 1: 1, conectada por 30 min * venda do agente 2: 5, conectada por 5 horas * venda do agente 3: 12, conectada por 4 horasfW

Escolher suas métricas é muito, muito importante.

Exemplo ruim: vendas sozinhas

μ=1+5+123=6

Vumar(fW)=5+1+63=4

σ=Vumar(fW)=4=2

Então agora precisamos do número de desvios padrão:

  • uma1=-2.5σ longe da média
  • uma2=-0,5σ longe da média
  • uma3=+3σ longe da média

Portanto, a classificação da pilha do melhor para o pior seria a3, a2, a1. O problema é que o agente 2 é pago / cobrado por muito mais tempo e é realmente o pior. Portanto, você deve ter cuidado ao elaborar as métricas para garantir que elas tenham o efeito desejado. No exemplo acima, seria melhor adotar uma abordagem de vendas / hora como sua métrica e depois multiplicar ao final por quanto tempo o agente faz chamadas.

Melhor Exemplo: Vendas / Hora

Vendas por hora:

  • uma1=112=2
  • uma2=55=1
  • uma3=124=3

μ=2+1+33=2

Vumar(fW)=0 0+1+13=23

σ=230,82

Portanto, neste caso, os agentes têm os seguintes desvios padrão de :nμ

  • uma1=0 0σ
  • uma2-1.2σ
  • uma31.2σ

Portanto, agora eles estão na ordem correta, mas ainda não temos um indicador de quanto de um problema é que o agente está atrasado. É mais um problema, porque esse agente foi conectado por um longo período de tempo. Portanto, adicionar um peso do tempo de login fornece o seguinte:uma2W

  • uma1=0 0
  • uma2-1.25-6.12
  • uma31.244,90

Agora você pode normalizar esses números para comparar com outras métricas da mesma maneira. Como você pode ver, está indo bem, está fazendo o melhor e no cenário está muito atrasado. Estes são os resultados que você esperaria. Esse número agora mostra:a 3 a 1uma1uma3uma1

  1. qualidade (do agente)
  2. severidade (para o negócio)

Essa não é a única maneira de resolver problemas de análise de decisão com vários critérios, mas é uma maneira muito prática. Pelo que entendi, esse método é chamado de "Programação de Objetivos" e é uma maneira bastante direta de chegar a conclusões sobre problemas complexos.

Para mais informações, consulte Charnes, A. e Cooper, WW (1961). Modelos de Gestão e Aplicações Industriais de Programação Linear. Nova York: Wiley.

hazmat
fonte
Você diz "pergunta incrível", mas não vota?
Kjetil b halvorsen
Esta é a minha primeira resposta sobre esta parte da troca de pilha ... Então eu não me deixa 😉
hazmat
Não entendo por que você calcula Variance como (5 + 1 + 6) / 3. Eu esperaria (5 * 5 + 1 * 1 + 6 * 6) / 3 ou (5 * 5 + 1 * 1 + 6 * 6) / 2.
Qbolec