Eu chamo count-words-region
( M-x =) na cadeia US / RU / IPA:
HelloПривheləʊ
A seguinte mensagem é impressa:
Region has 1 line, 4 words, and 14 characters.
Todos os símbolos têm w
sintaxe, mas diferem no script:
(char-syntax ?H) ; ?w
(char-syntax ?П) ; ?w
(char-syntax ?ʊ) ; ?w
(aref char-script-table ?H) ; script: latin
(aref char-script-table ?П) ; script: cyrillic
(aref char-script-table ?ʊ) ; script: phonetic
Isso significa que o limite da palavra é definido não apenas pela sintaxe char, mas também pelo script char ?
Gostaria de desativar esse comportamento nos modos selecionados para poder navegar pelas palavras, mas não pelos scripts. Como isso pode ser alcançado?
ATUALIZAÇÃO Discussões adicionais úteis sobre debbugs .
M-x report-emacs-bug
para ter a documentação atualizada.De fato,
forward-word
ebackward-word
também mostram que há várias palavras aqui. Faz sentido para mim que caracteres de scripts diferentes não possam estar na mesma palavra, mas a documentação deve ser explicitada sobre isso ( aqui ). Eu sugiroM-x report-emacs-bug
sobre isso.Se você deseja mover entre "palavras" ignorando o script, use
skip-syntax-forward
eskip-syntax-backward
(descrito aqui )fonte