Qual é a diferença entre usar RDFS / OWL versus XML?

10

Fiquei imaginando que vantagens as linguagens de ontologia do RDFS / OWL têm sobre o uso de um sistema de marcação / marcação (como http://www.schema.org/ ) para gerenciar e criar metadados?

Webster Thesaurus
fonte
3
O mecanismo de inferência, é isso. Surpreendentemente, nenhuma das respostas abaixo menciona. Motores como o Jena podem inferir novos dados e fazer uso de propriedades transitivas.
Andrew T Finnell
2
@AndrewFinnell postar uma explicação mais detalhada como uma resposta por favor
Andrew, eu concordo e votaria sua resposta. As respostas atualmente existentes abaixo são desinformadas e de baixa qualidade.
Dibbeke
@AndrewFinnell, eu também gostaria que você publicasse sua própria resposta, também me pergunto se a inferência está além do escopo do OP ou não. (Eu pensava assim, mas então talvez não seja)
ZJR

Respostas:

5

Sua pergunta faz pouco sentido como está. RDFS é uma linguagem de esquema muito básica para expressar restrições de RDF. OWL é um esquema mais avançado para expressar uma ontologia complicada. Eles não têm absolutamente nada em comum com XML, exceto que podem ser expressos em XML.

Stefano Borini
fonte
4

Não foi possível entender mais com a resposta de ZJR. É totalmente desinformado.

  1. Como você analisa Microdata? O que ele analisa também? O RDFa analisa o RDF, um modelo de dados comum que a Web Semântica tem buscado. Os microdados basicamente surgiram porque Hickie não se incomodou em ler as especificações RDF e RDFa. Pode ser mais fácil para um desenvolvedor, mas não é melhor para a web (por exemplo, preguiçoso )
  2. Para uma lista de vocabulários comuns de OWL, veja abaixo:

  3. A próxima versão do RDF é iminente, incluindo novos formatos de serialização, como Turtle e RDFj

  4. O SPARQL 1.1 também é iminente. Federação de consulta, expressão do caminho da propriedade, atualização SPARQL e muito mais.

  5. A BBC é construída sobre RDF. A API de gráfico do Facebook fornece RDF (isso mesmo, você pode deferir um URI de gráfico usando o cabeçalho Aceita texto / tartaruga e recuperar RDF) e muitas outras grandes empresas.

Portanto, em resumo, a Web Semântica, RDF, RDFS, OWL, SPARQL e todos os padrões da Web Semântica estão muito vivos e emocionantes. Se você não acredita em mim, dê uma olhada em todas as atividades em http://www.semanticoverflow.com

William Greenly
fonte
a BBC é baseada em RDF, embora mapeie para microdados, então? Eles reconstruíram o site na década de 2000-2010, numa época em que o W3C prometia maravilhosas ferramentas mágicas para o RDF, essas ferramentas não se materializaram realmente, o RDF é um legado lá. Estrutura organizacional sólida, mas difícil de compartilhar, os microdados cobrem a última milha. (e salve o dia)
ZJR
e depois alguns: um SPARQL útil é iminente desde sempre, o texto das especificações RDF usado para sugar muito tempo e assustou a maioria dos implementadores em potencial por anos. (não sei se eles consertaram isso, eles consertaram isso? imho, tarde demais, de qualquer maneira ) e então, a RDF<some-letter>nomenclatura gera confusões e brigas o tempo todo.
ZJR
11
A BBC é construída sobre RDF usando BigOWLIM, não microdados. Mircodata não é um formato de dados canônico. É uma adição ao HTML. A nova plataforma olímpica é construída inteiramente em RDF, como mencionado em comunicados de imprensa e apresentações em sua Academia.
William Greenly
4

RDF / OWL vs XML é uma alternativa falsa. De fato, uma das serializações populares está usando XML.

Também RDF / OWL vs microformatos é uma alternativa falsa. De fato, existem padrões que permitem o uso do RDF como um microformato, o eRDF e o RDFa oficial do W3C com uma maneira padronizada de incorporá-lo no HTML5 .

Então, verdadeiramente, a questão é qual a vantagem de usar formatos padrão aprovados pelo W3C. Os motivos são:

  • já existem várias ontologias por aí, incluindo as mais usadas como Dublin Core e FOAF .
  • várias lojas triplas compatíveis com RDF / OWL para praticamente qualquer linguagem de programação.
  • várias lojas triplas mencionadas acima apresentam mecanismos de inferência com interface SPARQL .

No geral, não vejo nenhuma razão para que você opte pelo microformato não-padrão e não-W3C.

vartec
fonte
1

RDF e OWL são padrões estabelecidos para codificar dados semânticos e seus esquemas, em um nível muito mais profundo e genérico do que uma marcação ad-hoc.

Por exemplo, com OWL, você pode definir um novo Esquema, que será pelo menos parcialmente compreendido por outras ferramentas (porque é possível misturar diferentes esquemas OWL / RDF). Dessa forma, você pode exportar de um conjunto de dados diferentes "visualizações" dele e fazer com que todos cooperem. Além disso, você pode simplesmente "explorar" os links entre objetos e suas propriedades.

Com microdados, é basicamente um conjunto de coisas aceitas ad-hoc que você pode aplicar, não uma plataforma semântica geral.

p_l
fonte
Ainda estou confuso sobre como o RDF difere do RDFS difere do OWL .... Esses termos podem ser usados ​​de forma intercambiável ...?
Webster Thesaurus
O @WebsterThesaurus RDF é uma linguagem bastante simples para descrever conceitos baseados em triplos de Subject-Verb-Object. RDFS é um esquema de RDF, basicamente um conjunto predefinido de termos para facilitar a definição do significado das relações. OWL é um sistema de descrição ontologia, muito mais poderoso do que RDFS, mas mais difícil de implementar
p_l
1

Gostaria de começar observando que esta resposta não foi escrita por um especialista na área. Embora eu seja um defensor dos sistemas distribuídos semânticos, acho que as aplicações do OWL atualmente são limitadas. Embora descrever precisamente o nicho no qual a OWL possa ser aplicada esteja além do escopo desta resposta, talvez eu possa trazer à tona alguns prós e contras.

OWL é basicamente uma linguagem que permite a expressão de construções semânticas usando classificação, não muito diferente das classes que você conhece do OOP e das restrições entre as classes e suas instâncias. Pode-se vê-lo como uma maneira mais formal e de ordem superior para descrever os relacionamentos que você conhece em um banco de dados relacional.

Para descrever e comunicar esse idioma, ele precisa ser serializado para um determinado formato. Existem vários formatos, dos quais RDF é apenas um.

Existem três níveis diferentes de OWL, permitindo aumentar a expressividade, mas limitando a computabilidade (por exemplo, se você pode encontrar uma possível solução para as perguntas feitas à base de conhecimento descrita por uma definição de OWL). Estes são OWL Lite, DL e Full.

A vantagem mais importante do uso de OWL / RDF é a troca de conhecimento entre diferentes bases de conhecimento (ou hierarquias de classificação) e a criação de inferências úteis sem a necessidade de projetar todas essas bases de antemão para permitir que elas se comuniquem. Isso é feito em parte pela definição de classes de equivalência. O uso de espaços para nome permite que o engenheiro verifique a exclusividade; um paradigma útil.

Outra vantagem é a quantidade cada vez maior de mecanismos de inferência e linguagens de consulta. Em nosso mundo em rede, há uma demanda por troca de conhecimento distribuído.

Talvez uma desvantagem importante seja a relativa alta complexidade de determinar a computabilidade das inferências e suas restrições de espaço e tempo. Por exemplo. em OWL full, você poderá pedir inferências que não podem ser provadas para terminar. Assim, certamente há um limite para o poder da OWL.

O conhecimento da CORUJA é discreto ... não existem meias-verdades ou sistemas de crença. Possuí-los provavelmente tornaria as soluções muito complexas.

Mas a desvantagem mais importante para o meu gosto é que simplesmente não podemos encontrar muitos bons engenheiros no campo. Você precisará de um engenheiro de conhecimento, um ou dois cientistas da computação e uma pequena equipe de desenvolvimento para criar até uma pequena base de conhecimento. Portanto, muitas vezes é muito mais barato e eficaz usar apenas linguagens descritivas, como o esquema XML, e descrever a semântica necessária em um documento legível por humanos.

Dibbeke
fonte
0

RDFS é sobre descrever dados estruturados. Seria muito mais útil incluir métodos ou funções, para que pudéssemos descrever interfaces com ele. Atualmente, você precisa de um vocabulário extra para fazê-lo, por exemplo, WSDL ou Hydra por serviços da web. Eu acho que também há um vocabulário para OOP, eu simplesmente não conheço muitos vocabs.

OWL é algo como XSD, trata-se de validar seus dados; por exemplo, se você espera uma string com no máximo 20 caracteres, usa OWL para descrever essa regra e gerar um validador. Em teoria, você poderia fazer o mesmo com RDFS e XSD, não tenho idéia de por que as pessoas tiveram que inventar o OWL em vez de apenas usar o XSD. Talvez seja porque o XSD não é baseado no RDFS, por exemplo, a sequência XSD não é descendente do RDFS Literal.

Schema.org descreve classes comuns como Person, por exemplo. Eles criam seu próprio RDFS como vocabulário, que inclui Thing em vez de rdfs: Class, domainIncludes em vez de rdfs: domain, rangeIncludes em vez de rdfs: range e assim por diante, em vez de usar RDFS. Seus tipos restritos também são ad-hoc; eles usam Texto e Número sem defini-los ou conectá-los pelo menos a rdfs: primitivas literais ou XSD. Eles não usam XSD ou OWL para definir tipos restritos, tanto quanto eu posso dizer. Não tenho certeza se há alguma restrição em seu vocabulário, mas, se sim, acho que eles o mencionam nas descrições legíveis por humanos, para que você não possa gerar um validador adequado no schema.org, o que você poderia fazer se eles usaria XSD / OWL e RDFS.

Então, acho que a vantagem de usar padrões como RDFS, XSD, OWL é que você pode escrever bibliotecas que podem ser reutilizadas por cada documento.

inf3rno
fonte
-2

Com o objetivo de desenvolver produtos futuros, os arquivos XML RDFS / OWL devem ser considerados praticamente inoperantes.

Eles exigem muito trabalho para expressar conceitos que uma solução criada com base em formatos de texto personalizados expressaria melhor , mantendo os dados mais legíveis e editáveis ​​para humanos e máquinas. Eles não agregam valor real e apenas tornam a vida um pouco mais miserável para todos que os tropeçam. (e precisa lidar com a nomenclatura do namespace)

Existem soluções gigantescas de manipulação de documentos baseadas nelas, e elas foram recentemente desenvolvidas, implantadas e estão em serviço atual. Eles ameaçam ficar por muito tempo. Muitos programadores no futuro sofrerão sem dúvida com muitos WTFs induzidos por RDF e OWL.

Os sistemas de microdados (a versão otimizada para microformatos para validadores ), como os descritos em schema.org , apresentam muitas vantagens para desenvolvedores, editores e leitores; humanos e mecânicos.

Os conceitos de RDF (aqueles que valem a pena salvar) podem ser mapeados (e estão realmente sendo explicitamente mapeados) sobre representações de microdados sem problemas.

Os itens de microdados permitem que autores e sistemas de manipulação de documentos aprimorem a comunicação de uma maneira bastante fácil (tão fácil quanto CSS ou DOM) de manipular e personalizar para o leitor.

ZJR
fonte
Espere, eu não entendo ... então, como o Microdata é diferente do XML / HTML? O plano descrito em schema.org diz especificamente que eles usam tags em suas páginas da Web ... não é isso que XML e HTML também fazem?
Webster Thesaurus
E se o Microdata é muito melhor, por que o W3C está pressionando pelo RDFS / OWL e não pelo Microdata?
Webster Thesaurus
Eu acho que essa resposta é bastante enganadora, como RDF! = XML. A codificação XML do RDF é apenas uma dentre muitas e foi projetada com o objetivo de ser misturada aos aplicativos XML existentes. Além disso, voltar aos sistemas personalizados (sim, incluindo microdados) significa voltar a "escrever um analisador personalizado para foder tudo" em vez de poder usar vocabulário genérico. Com o RDF / OWL, posso misturar aplicativos diferentes, cada um trabalhando em um subconjunto de dados envolvidos, além de escrever código flexível com reflexão automática - bom exemplo é o Xanasys LinkExplorer.
p_l
11
Resposta opinativa não informativa. Mostre referências para fazer backup dessas reivindicações.
Dibbeke
@Dibbeke Meu palpite original era que o OP estava procurando por metadados pragmáticos. O RDF nesse caso é um exagero. A parte opinada é relativa à minha crença na RDF sempre sendo um exagero .
ZJR