Tipo de conteúdo válido para documentos XML, HTML e XHTML

123

Quais são os tipos de conteúdo corretos para documentos XML, HTML e XHTML?

Preciso escrever um rastreador simples que apenas busque esses tipos de arquivos.

Atualmente, http://example.net/index.html pode servir, por exemplo, um arquivo JPEG devido a mod_rewrite, por isso preciso verificar o tipo de conteúdo no cabeçalho da resposta e compará-lo com uma lista de tipos de conteúdo permitidos.

De onde posso obter essa lista?

astropânico
fonte
Sobre fragmentos ver stackoverflow.com/q/19303361/287948 e w3.org/TR/xml-fragment
Peter Krauss

Respostas:

206

HTML text/html:, ponto final.

XHTML: application/xhtml+xmlou apenas se seguir as orientações Compatbility HTML, text/html. Veja a Nota sobre os tipos de mídia W3 .

XML: text/xml, application/xml( RFC 2376 ).

Também existem muitos outros tipos de mídia baseados em XML, por exemplo application/rss+xmlou image/svg+xml. É uma aposta segura que qualquer final não reconhecido, mas registrado, +xmlseja baseado em XML. Consulte a lista da IANA para obter os tipos de mídia registrados que terminam em +xml.

(Para x-tipos não registrados , todas as apostas estão desativadas, mas você espera +xmlque seja respeitado.)

bobince
fonte
32
Sobre as diferenças entre text/xmle application/xmlveja aqui stackoverflow.com/questions/4832357/…
sanmai
O mesmo é válido para fragmentos , consulte w3.org/TR/xml-fragment ou esta outra pergunta .
Peter Krauss