Mostre aos outros como eu me ouço

18

Sooo .. Eu estive pensando sobre essas coisas. Todos sabemos que soamos diferentes do que ouvimos de nossa própria voz. É fácil descobrir como os outros nos ouvem gravando a si mesmos e ouvindo.

Mas e o contrário?

Existe uma maneira de transformar nossa voz de uma maneira que os outros possam nos ouvir quando percebemos nossa própria voz? Acho que é uma pergunta bastante interessante. Infelizmente, não consegui encontrar nada na web depois de algumas pesquisas no Google. Ninguém pensou nisso ou é impossível por algum motivo que não estou vendo?

Qualquer dica sobre isso seria apreciada :).

Dunkingdev
fonte
5
Você pode tornar o problema o mais fácil possível: faça uma gravação de sua fala que, quando ouvida por meio de fones de ouvido, tenha o mesmo som que sua fala quando você fala em uma câmara anecóica. Não tenho certeza de como fazer isso.
Olli Niemitalo
2
Eu só queria propor exatamente isso. No entanto, é realmente necessário excluir a influência da sala? A diretividade da sua voz como fonte sonora é certamente um fator, mas acho que esse método provavelmente funcionará muito bem se a gravação for feita no mesmo local em que ocorre o "procedimento de ajuste".
applesoup

Respostas:

10

Não é impossível, mas também não será um passeio no parque.

O que você estaria tentando fazer é adicionar ao sinal de voz aquelas vibrações que são transmitidas ao ouvido através dos ossos e não são acessíveis a mais ninguém.

Mas isso é mais fácil dizer do que fazer de maneira precisa.

A propagação do som através de um meio depende muito de sua densidade . O som viaja a ~ 1500m / s na água e com menos dissipação do que viaja no ar (~ 340m / s). Os ossos são mais densos que o ar, portanto, o som deve viajar mais rapidamente através dos ossos. Isso significa que o som "your" começa a excitar seus ouvidos primeiro, seguido pelo som que você percebe através do canal de ar "normal". Na realidade, o osso tem uma estrutura interna que pode estar afetando a maneira como diferentes frequências passam por ele, mas na faixa de frequências de que estamos falando, talvez possamos considerá-lo como um sólido equivalente. Isso só pode ser aproximado porque qualquer tentativa de medição teria que ser invasiva, mas também porque a audição é subjetiva.

A audição ou a percepção do som é um enorme contribuinte de dificuldade aqui. O ouvido em si, o ouvido externo (a parte visível), o canal e o mecanismo interno trabalham juntos de maneiras muito complicadas. Este é o assunto da psicoacústica . Um exemplo desse processamento complexo são os tons fantasmas, nos quais o cérebro está preenchendo coisas que deveriam estar lá. O próprio cérebro pode já ter desenvolvido formas de isolar o sinal auto-gerado que ainda é inacessível para nós.

Mas, uma maneira simplista ( simplista! ) De testemunhar as diferenças entre ser o ouvinte do seu próprio som e não é isso:

Grave uma palavra curta e simples (por exemplo, "Espinha de Peixe", uma palavra que tenha ambas as frequências baixas (b, o, n) e altas (F, sh, i, e)) com um pouco de silêncio e faça um loop no equalizador através de seus fones de ouvido. Inicie a reprodução e sincronize a sua voz com a gravação (algo como "Espinha de peixe ... Espinha de peixe ... Espinha de peixe ..."). Agora tente mexer no equalizador até que o que você ouve e o que você pronuncia sejam razoavelmente semelhantes.

Nesse ponto, as configurações no equalizador representariam as diferenças entre o som e o que é percebido por você e, teoricamente, qualquer outra fala passada por esse equalizador simularia como ele chega aos seus ouvidos, como se você o tivesse gerado com ele. uma fonte dentro do seu corpo.

Espero que isto ajude.

A_A
fonte
1
provavelmente é impossível devido às diferenças individuais de percepção e impossibilidade de quantificar essa subjetividade. No entanto, as diferenças poderia ser menor, como no caso de todos os cap 1000uF produzido é realmente um pouco diferente ...
Fat32
1
@ Fat32 Não consegui decidir sobre a impossibilidade, porque tecnicamente seria possível quantificar / medir a contribuição do segundo canal que é estabelecido através dos ossos e, através de suposições razoáveis, apresentar alguma aproximação. Como é a sensação em uma condição médica totalmente diferente para a perspectiva do "paciente". Essa seria uma aproximação melhor do que apenas o EQ. Mas no ponto de percepção, sim, no momento seria impossível sugerir o "filtro" definitivo que transformaria o clipe de som conforme solicitado.
um_um
reafirmado de outra maneira: dado que o mesmo estímulo físico exato é criado nas cócleas de dois indivíduos distintos, eles (provavelmente) ouvirão duas percepções diferentes e o que realmente ouvirão (afaik) é uma experiência pessoal que é fechada a qualquer inquisição externa de qualquer tipo, ainda que matemático ... Dito isto, os humanos podem se comunicar acusticamente é resultado da natureza discreta da linguagem.
precisa
Muito obrigado! Isso tem sido muito informativo e útil e, ao mesmo tempo, xD muito decepcionante. Eu tinha medo de que toda estrutura óssea humana alterasse o som de uma maneira diferente ... mas eu não pensava no ouvido em si como outro distúrbio. Bem, pelo menos o seu PODE existir uma certa função para cada indivíduo que traduz o som de acordo.
Dunkingdev
@KevinFiegenbaum Obrigado por me informar. A percepção é a fonte de muito pensamento. O cérebro acopla-se à realidade através dos sentidos e cria e confirma (ou rejeita) modelos do que provavelmente está acontecendo. Ilusões de ótica são casos em que duas "suposições" (modelos) se encaixam na mesma explicação e o cérebro não pode decidir, então alterna entre elas. Todos os sentidos chegam ao cérebro já codificado e é incrivelmente difícil realmente saber como são vivenciados pelo indivíduo. O melhor que podemos fazer é um palpite razoável. Muito bem sucedida.
A_A 12/12
11

A tentativa mais prática que tenho conhecimento é de Won e Berger (2005) . Eles gravaram simultaneamente vocalizações na boca com um microfone e no crânio com um vibrômetro caseiro. Eles então estimaram as funções de transferência relevantes com codificação preditiva linear e suavização cepstral.

StrongBad
fonte
0

Antes de se decepcionar, deixe-me sugerir que você tente outra abordagem.

A meu ver, você tem duas partes muito diferentes: conhecer a equalização a ser realizada (personalizada para cada pessoa) e aplicá-la a um sinal específico (sua voz).

1ª parte: modelo do aparelho auditivo humano interno

Existem profissionais que estão trabalhando para coletar dados sobre isso, padronizar esse processo e assim por diante. No entanto, há esforços para desenvolver medidas e gráficos além do audiograma clássico (que mede os sinais de ar e osso). Alguns deles são "testes de escuta" (mais subjetivos, mas interessantes também).

Alinhar com esses profissionais. Se você seguir o trabalho deles, precisará apenas dos resultados. Deixe-os fazer o trabalho pesado. Eles conhecem sua parte, o que levou dezenas de anos de investigação. Eles estão avançando no conhecimento que você precisa. O que é: um tipo de audiograma para medir como alguém ouve 'dentro'. Aposto que eles estão representando isso. E você só precisa desse gráfico.

2ª parte: simulação

Eu fiz algo semelhante ao que você tenta fazer. No audiograma de qualquer pessoa, você pode ouvir por conta própria como ele / ela. Isso é feito com o ffmpeg. Você pode conferir aqui: comomeoyes.com

Basicamente, você grava sua voz e um algoritmo a equaliza com seu audiograma personalizado. Dessa forma, você pode inserir o audiograma de uma pessoa com perda auditiva e ouvir por si mesmo como ela ouve.

Entendo que você gostaria de fazer o mesmo, mas com um audiograma diferente, que modela como o sistema auditivo interno iguala o som.

Aposto que esse tipo de audiograma já poderia existir, e audiologistas, médicos, médicos em otorrinolaringologia, pesquisadores e outros podem estar discutindo sobre o tipo de testes acústicos a serem feitos para obter os dados necessários para modelar um gráfico útil a partir das medições.

Boa sorte. Sua tentativa pode ajudar os outros.

Giuseppe
fonte