Porque \
comece as sequências de escape apenas quando forem sequências de escape válidas.
>>> '\n'
'\n'
>>> r'\n'
'\\n'
>>> print '\n'
>>> print r'\n'
\n
>>> '\s'
'\\s'
>>> r'\s'
'\\s'
>>> print '\s'
\s
>>> print r'\s'
\s
A menos que um prefixo 'r' ou 'R' esteja presente, as sequências de escape em strings são interpretadas de acordo com regras semelhantes às usadas pelo Padrão C. As sequências de escape reconhecidas são:
Escape Sequence Meaning Notes
\newline Ignored
\\ Backslash (\)
\' Single quote (')
\" Double quote (")
\a ASCII Bell (BEL)
\b ASCII Backspace (BS)
\f ASCII Formfeed (FF)
\n ASCII Linefeed (LF)
\N{name} Character named name in the Unicode database (Unicode only)
\r ASCII Carriage Return (CR)
\t ASCII Horizontal Tab (TAB)
\uxxxx Character with 16-bit hex value xxxx (Unicode only)
\Uxxxxxxxx Character with 32-bit hex value xxxxxxxx (Unicode only)
\v ASCII Vertical Tab (VT)
\ooo Character with octal value ooo
\xhh Character with hex value hh
Nunca confie em strings brutas para literais de caminho, pois as strings brutas têm alguns funcionamentos internos bastante peculiares , conhecidos por terem mordido as pessoas na bunda:
Quando um prefixo "r" ou "R" está presente, um caractere após uma barra invertida é incluído na string sem alteração e todas as barras invertidas são deixadas na string. Por exemplo, a string literal r"\n"
consiste em dois caracteres: uma barra invertida e um "n" minúsculo. As aspas de string podem ser escapadas com uma barra invertida, mas a barra invertida permanece na string; por exemplo, r"\""
é um literal de string válido que consiste em dois caracteres: uma barra invertida e uma aspa dupla; r"\"
não é um literal de string válido (mesmo uma string bruta não pode terminar com um número ímpar de barras invertidas). Especificamente, uma string bruta não pode terminar em uma única barra invertida (uma vez que a barra invertida escaparia do seguinte caractere de aspas). Observe também que uma única barra invertida seguida por uma nova linha é interpretada como esses dois caracteres como parte da string,
Para ilustrar melhor este último ponto:
>>> r'\'
SyntaxError: EOL while scanning string literal
>>> r'\''
"\\'"
>>> '\'
SyntaxError: EOL while scanning string literal
>>> '\''
"'"
>>>
>>> r'\\'
'\\\\'
>>> '\\'
'\\'
>>> print r'\\'
\\
>>> print r'\'
SyntaxError: EOL while scanning string literal
>>> print '\\'
\
'\s'
(liker'\s'
) também é representado como'\\s'
, devido a'\s'
não ser uma sequência de escape reconhecida.o 'r' significa que o seguinte é uma "string bruta", ou seja. os caracteres de barra invertida são tratados literalmente em vez de significar um tratamento especial do caractere a seguir.
http://docs.python.org/reference/lexical_analysis.html#literals
o mesmo
'\n'
ocorre com uma única nova linhae
r'\n'
dois caracteres - uma barra invertida e a letra 'n'outra maneira de escrever seria
'\\n'
porque a primeira barra invertida escapa da segundauma maneira equivalente de escrever isso
print (re.sub(r'(\b\w+)(\s+\1\b)+', r'\1', 'hello there there'))
é
print (re.sub('(\\b\\w+)(\\s+\\1\\b)+', '\\1', 'hello there there'))
Devido à maneira como o Python trata os caracteres que não são caracteres de escape válidos, nem todas essas barras invertidas duplas são necessárias - por exemplo,
'\s'=='\\s'
o mesmo não é verdadeiro para'\b'
e'\\b'
. Minha preferência é ser explícito e dobrar todas as barras invertidas.fonte
Nem todas as sequências que envolvem barras invertidas são sequências de escape.
\t
e\f
são, por exemplo, mas\s
não é. Em um literal de string não bruto, qualquer um\
que não faça parte de uma sequência de escape é visto como apenas outro\
:>>> "\s" '\\s' >>> "\t" '\t'
\b
é uma sequência de escape, no entanto, o exemplo 3 falha. (E sim, algumas pessoas consideram esse comportamento um tanto infeliz.)fonte
r
ainda escapa algumas sequências quando aparecem no final da string:r"\"
é inválido, para fazer isso você tem que fazer"\\"
. Se o fizerr"\\"
, obterá uma\\
("\\\\"
string) impressa . Cuidado com isso.Tente isso:
a = '\'' ' a = r'\'' \' a = "\'" ' a = r"\'" \'
fonte
Veja o exemplo abaixo:
print r"123\n123" #outputs>>> 123\n123 print "123\n123" #outputs>>> 123 123
fonte