Existe uma classe de pessoa no ImageNet? Existem classes relacionadas aos seres humanos?

Se eu olhar para uma das muitas fontes para as aulas da Imagenet na Internet, não consigo encontrar uma única classe relacionada aos seres humanos (e não, o harvestman não é alguém que colhe, mas é o que eu conhecia como um pai de pernas longas, uma espécie de aranha :-). Como isso é possível? Eu teria, pelo menos esperava uma personclasse, e até mesmo algo mais específico, como man, woman, toddler, etc. Nada disso. Por quê? Será que Fei-Fei Li e sua equipe fazer uma escolha consciente de não ter imagens pessoas no banco de dados? Estou olhando para o arquivo errado? Para o bem da questão, podemos considerar as ImageNetversões a partir de 2014 em diante.

machine-learning deep-learning dataset convnet image-classification DeltaIV
fonte

Respostas:

Você também pode dar uma olhada aqui nas etiquetas na imagenet. Eu acho que você está certo, não há rótulo para humanos no conjunto de dados, mas há algo a ser observado. Existem imagens no imagenet como cowboy ou alguns chapéus específicos e outras coisas relacionadas ao ser humano, como camisas e camisetas. Você pode dar uma olhada aqui e também aqui. No último link, Yosinski et al. Tentaram mostrar que o popular AlexNet aprendeu a reconhecer rostos humanos, embora não exista um rótulo como rosto humano no conjunto de dados imagenet. Em seu trabalho, eles investigaram que as redes neurais convolucionais podem tentar aprender coisas que são distribuídas entre camadas ou talvez não, e elas podem não ter rótulo especial nos dados de treinamento. Como exemplo, pode-se referir a face de gatos e humanos. Além disso, como você pode ver aqui, talvez o objetivo fosse atribuir aprendizado em conjuntos de dados em larga escala , como citado na última linha da página, como referência.

meios de comunicação
fonte

Gosto da resposta, mas não entendo sua última frase. O que você quer dizer com aprendizado de atributo, como ele difere (se difere) da classificação de imagens e como isso está relacionado à minha pergunta (existem personclasses no ImageNet)?

DeltaIV

@DeltaIV eu quis dizer no último link que eu forneci, há uma referência que, nesse trabalho, eles discutem essa questão. O que eu disse foi como aprender rostos, que não são os rótulos, mas são necessários para entender as camisetas, talvez.

Meios

Ok, os NNs aprendem recursos que parecem rostos porque ajudam a reconhecer (ou discernir entre) rótulos. Sim, eu meio que esperava isso. Obrigado

DeltaIV

@DeltaIV Eu acho que este é talvez o que chamamos de aprendizado

Mídia

Eu acho que o aprendizado para redes neurais tem muito pouco a ver com o processo de aprendizado humano. Veja essas alucinações . Por outro lado, a mesma idéia de que essas imagens otimizadas devem mostrar o que as Redes Neurais aprenderam é profundamente falha e baseada em um mal-entendido sobre o que é uma distribuição de probabilidade de alta dimensão. O assunto é muito delicado: minha pergunta era muito mais elementar.

DeltaIV

Eu encontrei a classe 7846 (name = "n00007846") é para pessoa. Para acessar a descrição da turma, leia http://image-net.org/download-API . Melhor ainda, os seguintes arquivos de texto contêm tudo o que você precisa para entender as classes no conjunto de dados ImageNet (class = ID do WordNet):

http://image-net.org/archive/words.txt mapeia entre o ID do WordNet e as palavras para todas as sincronizações
http://image-net.org/archive/gloss.txt : mapas entre o ID do WordNet e glosses para todas as sincronizações

n00007846 mapeia para pessoa, indivíduo, alguém, alguém, mortal, alma . O brilho correspondente é: um ser humano; "havia muito para uma pessoa fazer" .

user47506
fonte

Você poderia vincular a uma fonte? Isso seria útil para outros usuários.

Elias Strehle

Os modelos da Imagenet parecem ter um desempenho inferior em humanos de várias origens. Nos meus dados, há pessoas em roupas de corrida e elas são identificadas principalmente como bolas de rugby e vôlei.

Leveque

Você pode conferir isso: http://www.image-net.org/about-stats

A pessoa como grandes categorias e subcategorias é listada. Também é fornecido o número total de imagens com pessoas.

Benjamin
fonte