Eu tenho um monte de digitação que eu preciso fazer e gostaria de usar o ditado de voz. No entanto, ele não parece "digitar" de forma consistente nos aplicativos.
Eu tive sucesso com o recurso em alguns aplicativos nativos, como MS Word, gVIM e macOS Notes. Tenho notado que muitas vezes não será um fluxo consistente de "digitação", ao contrário, às vezes, ele explode várias palavras e, em seguida, retrocede e corrige uma vez que determina uma melhor interpretação com base no contexto pós-fato. Por exemplo, se você disser "3:26 PM", ele começará a estourar "três e vinte e seis", retroceder e substituí-lo por "3:26 PM", porque eventualmente percebeu que estava ditando uma hora do dia.
Em particular, estou tentando usar isso em uma sessão do Citrix Receiver para uma máquina remota. Parece que os ajustes de “backspace e replacement” não chegam à sessão remota e eu veria algo mais como “three twenty six 3:26 PM”.
Eu suspeito que isso não registra os principais eventos de imprensa já que você não está pressionando fisicamente as teclas, mas parece que a Citrix não está olhando para "PRESSÕES-chave" de qualquer maneira, dado que alguma entrada funciona. No entanto, estou curioso como exatamente isso está se relacionando com o software esperando entrada? Talvez as correções não sejam simplesmente operações de backspace, mas mais operações de "remover palavra anterior" que algumas combinações de teclas digitadas fariam?
Alguém tem uma ideia aqui?
fonte
Respostas:
A resposta curta para a sua pergunta é que é complicado ...
Dependendo de como o aplicativo foi desenvolvido, ele pode usar qualquer número de diferentes APIs da Swift, Cocoa, Carbon.
Se o seu aplicativo usa elementos padrão da interface do usuário da Apple, como campos de texto, provavelmente terá uma maneira de colocar o texto diretamente no campo; no entanto, a Apple provavelmente adicionou funcionalidades para suportar outros softwares, simulando pressionamentos de tecla.
Quão bem isso é suportado depende do desenvolvedor do aplicativo.
Como exemplo, um aplicativo como o Citrix provavelmente não usa nenhum elemento de interface do usuário padrão porque não tem caixa de texto para digitar, em vez disso, mostra uma imagem de um computador e grava onde você clica nessa imagem, enviando para outro computador, da mesma forma, tem que gravar suas teclas pressionadas, mas evidentemente não está fazendo isso muito bem.
O Microsoft Word é provavelmente uma base de código muito antiga que cresceu a partir dos dias de Carbono, o que pode explicar porque não está funcionando como esperado, e eu não sei o que gVIM, mas eu acho que você quer dizer MacVim mas como é uma porta de outro projeto pode não ter sido testado para isso corretamente / não está na lista de prioridades.
Por que vale a pena ter tido problemas semelhantes usando softwares como o TextExpander e o Dash, que auto completam frases no Terminal, e usam o software de desktop remoto da própria Apple, como o Citrix, então acho que isso é de se esperar.
fonte