DBpedia vytváří z Wikipedii databázi znalostí.

Jak toho využít

editovat

Fasetové vyhledávání

editovat

Zatím nevím, jak to správně přeložit. faseted search nebo faseted browsing, občas se to překládá také jako hierarchické vyhledávání. Fasety jsou v tomto případě vyhledávací kriteria.

Tak vyzkoušíme:

  1. města, která byla založena před rokem 1000:
  2. Němečtí vědci, kteří měli americké občanství:

Nic českého jsem tam zatím nenašel, asi to ještě nikdo nenasoukal do databáze.


Suroviny

editovat

Cokoliv existuje v anglické wikipedii, tak má zde odpovídající URI. Třeba:

Ale když se podíváme na

což je na wikipedii redirect, tak na DBpedii tomu odpovídá

což je o dost chudší resource

No ještě si povšimneme třeba rozdílů v Properties, kterými je označeno, že jde o rodiště:

  • is dbpedia-owl:birthPlace of
  • is dbpprop:birthPlace of
  • is dbpprop:birthplace of

Takže třeba Otto Jelinek tam má uvedeny všechny tři možnosti, většina ostatních ale jen dbpedia-owl:birthPlace. Tak v tom je asi taky ještě trochu nejednotnost.

Dotazování

editovat

Každá databáze má nějaký způsob dotazování, dotazovací jazyk – známe třeba SQL. Zde je použit dotazovací jazyk SPARQL. Interface k němu najdeme na:

Pokud tento jazyk dosud neovládáme, abychom dokázali vytvořil alespoň formálně správný dotaz, zkusíme se podívat na nějaké příklady a pak podle nich vytvořit analogický dotaz. Třeba lidé, kteří se narodili v Praze v 18. století a dříve:

PREFIX dbo: <http://dbpedia.org/ontology/>

SELECT ?name ?birth ?death ?person WHERE {
     ?person dbpedia2:birthPlace <http://dbpedia.org/resource/Prague> .
     ?person dbo:birthDate ?birth .
     ?person foaf:name ?name .
     ?person dbo:deathDate ?death
     FILTER (?birth < "1800-01-01"^^xsd:date) .
}
ORDER BY ?name

Vložíme to na:

A dostaneme jedinou odpověď:

  • name: "Jan Blažej Santini Aichel"@en
  • birth: "1677-02-03"^^xsd:date
  • death: "1723-12-07"^^xsd:date
  • person :Jan_Santini_Aichel

kde se dozvíme, že se jednalo o barokního architekta.

Linkovaná data

editovat

Linked Data je motoda publikování RDF dat na webu a provázání dat mezi různými zdroji.

Chce to na to mít nějaký sémantický browser. Některé běhají na straně serveru, takže není zapotřebí nic instalovat. Třeba:

  • DISCO – nemůžu se spojit
editovat

DBpedia Userscript

editovat

(autor: Anja Jentzsch)

  1. Nainstalovat si Greasemonkey do Firefoxu
  2. Kliknout na DBpedia UserScript – javascript
  3. prohlídnout si ho
  4. povolit instalaci

Je to skript, který funguje jen na anglické wikipedii