Eu estava em uma conferência de robótica hoje cedo e um dos palestrantes mencionou que os robôs não são capazes de funcionar tão bem no meio da multidão porque não conseguem destacar o áudio como uma pessoa.
Por que as pessoas podem destacar tão bem o áudio? E o que seria necessário para um robô fazer o mesmo?
Estou ciente da redução de ruído ativo (ANR) como nos fones de ouvido da Bose Aviation, mas não é disso que estou falando. Estou pensando na capacidade de absorver tudo, mas processar apenas o que você considera importante.
fonte
Eu acho que há pelo menos três coisas acontecendo:
Eu pensaria que um robô pode superar os humanos nos números 1 e 2. Com um conjunto de microfones, seria de se pensar que você poderia se concentrar efetivamente em um único ponto no espaço e eliminar todas as outras interferências. Isso pode ser mais complicado com reflexões e vários outros distúrbios. O nº 3 é provavelmente algo mais difícil para os computadores.
fonte
stereo hearing
. Pergunte a qualquer humano que perdeu essa capacidade por qualquer motivo. Portanto, um programa ou mesmo um robô com 2 ou mais microfones terá essa capacidade - se o programador souber como lidar com a entrada.