Perguntas com a marcação «speech-recognition»

17
filtro de ruído de fala humana

Alguém sabe de um filtro para atenuar a não fala? Estou escrevendo um software de reconhecimento de fala e gostaria de filtrar tudo, exceto a fala humana. Isso inclui ruído de fundo, ruído produzido por um microfone ruim ou até música de fundo. Eu já implementei um filtro de primeira ordem que...

10
Como a redução de ruído para reconhecimento de fala difere da redução de ruído que deveria tornar a fala mais "inteligível" para os seres humanos?

Essa é uma pergunta que me interessa há algum tempo, principalmente porque estou trabalhando na redução de ruído para um sistema de reconhecimento de fala existente. A maioria dos trabalhos sobre técnicas de redução de ruído parece focar em como tornar a fala mais inteligível para os seres humanos...

9
Como implementar uma transformação Hough baseada em gradiente

Estou tentando usar a transformação Hough para detecção de borda e gostaria de usar imagens de gradiente como base. O que tem feito até agora, dada a imagem Ide tamanho [M,N]e seus derivados parciais gx, gy, é calcular o ângulo de inclinação em cada pixel como thetas = atan(gy(x,y) ./ gx. Da...

8
O que significa um "vetor" em um modelo oculto de Markov?

Eu sei que um Modelo de Markov Oculto (HMM) é usado no reconhecimento de fala e compreendo até certo ponto. No entanto, o que não sei é como a entrada (fala) é "transformada" em um vetor que mais tarde é usado no HMM. Como você obtém um vetor de uma entrada de som? Esse vetor é legível por um...

8
Como a Siri me reconhece dizendo "Hey Siri"?

Eu estou tentando entender como o meu iPhone pode ouvir continuamente para mim dizendo Hey Siri, Alexa, Hey Cortanaou Okay Googlesem drenar rapidamente a minha bateria para baixo. Imaginei dois tipos de algoritmo. Um que registra uma fatia de tempo, como 10 ms de largura a cada 200 ms e executa...