Descrição do Problema
Estou iniciando a construção da rede para um problema que eu acho que poderia ter uma função de perda muito mais criteriosa do que uma simples regressão MSE.
Meu problema lida com a classificação de várias categorias ( veja minha pergunta no SO para o que quero dizer com isso), onde há uma distância ou relação definida entre as categorias que devem ser levadas em consideração.
Outro ponto é que o erro não deve ser efetuado pelo número de categorias de tiro presentes. Ou seja, o erro para 5 categorias de disparo com 0,1 de cada uma deve ser igual a 1 categoria de disparo de 0,1. ( disparando, quero dizer que eles são diferentes de zero ou acima de algum limite)
Pontos chave
- classificação multi-categoria (disparo múltiplo de uma só vez)
- relações entre categorias
- A contagem de categorias de disparo não deve afetar a perda:
Minha tentativa
O erro quadrático médio parece ser um bom lugar para começar:
Isso é simplesmente considerar categoria por categoria, que ainda é valiosa no meu problema, mas perde grande parte da imagem.
Aqui está minha tentativa de retificar a idéia de distância entre categorias. Em seguida, gostaria de levar em consideração o número de categorias disparadas ( chame: v )
Minha pergunta
Eu tenho um histórico muito fraco em estatística; Como resultado, não tenho muitas ferramentas no meu cinto para abordar um problema como este. O tópico abrangente do que estou perguntando parece ser "Ao formar uma função de custo, como combinar várias medidas de custo? Ou que técnicas podemos aplicar para fazer isso?" . Eu também gostaria de ter quaisquer falhas no meu processo de pensamento expostas e melhoradas.
Eu valorizo ser ensinado por que meus erros são erros, em vez de ter alguém que os corrija sem explicação.
Se alguma parte desta pergunta não tiver clareza ou puder ser aprimorada, informe-me.
fonte
Respostas:
Você pode usar a perda de dobradiça, que é um limite superior para a perda de classificação; isto é, penaliza o modelo se o rótulo da categoria de pontuação mais alta for diferente do rótulo da classe de verdade do terreno.
Para mais detalhes sobre a relação entre perda de classificação e perda de dobradiça, você pode ler a Seção 2 deste artigo impressionante de CNJ Yu e T. Joachims.
Em resumo, há uma perda de tarefa , geralmente indicada por , que mede a penalidade para prever a saída da entrada quando a saída esperada (verdade da terra) é . A perda de tarefa para a classificação de várias classes é geralmente definida como . No entanto, desde que dependa apenas dos dois rótulos e , você poderá defini-lo da maneira que desejar. Em particular, pode-se ver como um arbitrárioΔ(yi,y^(xi)) y^(xi) xi yi Δ(yi,y^(xi))=1{yi≠y^(xi)} Δ y y^ Δ K×K matriz em que é o número de categorias e indica a penalidade de classificar uma entrada da categoria como pertencente à categoria .K Δ(a,b) a b
Por exemplo:input data:{(x1,y1),(x2,y2),(x3,y3)},xi∈Rd,yi∈Y={c1,c2,c3,c4}network predictions:y^(x1)=c2,y^(x2)=c1,y^(x3)=c3task loss matrix:⎡⎣⎢⎢⎢⎢Δ(y1,y1)Δ(y2,y1)Δ(y3,y1)Δ(y4,y1)Δ(y1,y2)Δ(y2,y2)Δ(y3,y2)Δ(y4,y2)Δ(y1,y3)Δ(y2,y3)Δ(y3,y3)Δ(y4,y3)Δ(y1,y4)Δ(y2,y4)Δ(y3,y4)Δ(y4,y4)⎤⎦⎥⎥⎥⎥=⎡⎣⎢⎢⎢0123101221013210⎤⎦⎥⎥⎥classification loss assuming y1=c4,y2=c1,y3=c4:Δ(y1,y^(x1))=Δ(c4,c2)=2Δ(y2,y^(x2))=Δ(c1,c1)=0Δ(y3,y^(x3))=Δ(c4,c3)=1
fonte