Observando a visão geral , uma coisa que se destaca é que o RDFA é aplicável apenas ao XHTML 1.1 no que diz respeito à validação, enquanto há um enorme esforço para finalizar o HTML5 / CSS3 e lançá-lo em produção.
Citando a visão geral:
Até o momento, como o XHTML é extensível enquanto o HTML não é, o RDFa foi especificado apenas para o XHTML 1.1. Os editores da Web podem usar a marcação RDFa no HTML4: o design do RDFa antecipa esse caso de uso, e a maioria dos analisadores RDFa reconhecerá os atributos RDFa em qualquer versão do HTML. Os autores não conhecem um navegador da Web implantado que falhará em apresentar um documento HTML conforme pretendido após adicionar a marcação RDFa ao documento. No entanto, os editores devem estar cientes de que o RDFa não será validado no HTML4 no momento. Os atributos RDFa são validados em XHTML, usando o XHTML1.1 + RDFa DTD.
Podemos assumir que o HTML5 será semelhante, pois o RDFA não será validado, mas provavelmente não quebrará o documento em navegadores conhecidos e populares . Isso me assusta um pouco ao considerar dispositivos móveis.
Eu não acho que isso vai machucá-lo, mas não substitui a garantia de que a semântica do seu documento esteja bem estruturada (por exemplo, usando tags de cabeçalho de maneira apropriada), o que geralmente resulta no texto / títulos adequados aparecendo nos resultados.
A área em que considero mais útil é descrever a relação de um link com seu conceito, como o exemplo de 'licença' fornecido na visão geral. É perfeitamente concebível que alguém queira resultados apenas oferecidos sob uma licença CC-BY-SA, ou talvez outra variante.
Eu não acho que eu gostaria de atribuir um cabeçalho para ser qualquer coisa menos isso, especialmente quando existem metatags para indicar o autor / etc. O típico:
- Ideia principal
- Texto
- Ideia de suporte
- Texto
- Idea Supporting Supporting Idea
- Texto
- ...
... oferece aos mecanismos de pesquisa uma maneira muito fácil de entender o contorno de qualquer documento. Portanto, como mostrado no exemplo, re-mapear 'h3' para indicar o autor pode ser bobo, mas associar uma relação de link como 'autor-do-nome-do-artigo' pode ser interessante, semelhante ao conceito de 'licença' .
Eu não conheço ninguém que realmente o implementou, então não tenho certeza do sucesso em nenhum dos cenários. No entanto, não acho que isso ajude (significativamente) sua classificação mais do que um documento bem estruturado. A novidade, pelo menos para mim, é a capacidade de encontrar coisas muito específicas, como todos os documentos de autoria de "Joe Q Smith", por exemplo.
O que eu não faria é redefinir o peso que qualquer marca deve ter ao determinar a estrutura de um documento.
E não consigo resistir - essa é mais uma razão pela qual as pessoas devem evitar analisar HTML com regex :)