Schlagwort-Archive: GitHub

Linked Open Data – Vortragsfolien

Ich habe die Vortragsfolien meiner „Linked Open Data“-Präsentation auf der SIGINT 2012 inzwischen online gestellt:

Wie immer alles Creative-Commons-lizenziert!

Nochmals vielen Dank für das rege Interesse und das positive Feedback. Ich bin immer froh, wenn viele Rückfragen gestellt werden und eine Interaktion mit dem Publikum entsteht. Ich freue mich auch weiterhin über Fragen und Feedback per Mail oder in den Kommentaren.

Der Vortrag wurde aufgezeichnet und wird wohl innerhalb der nächsten Wochen online gestellt (Hoffentlich vollständig, denn es gab leider ein technisches Problem während der Aufzeichnung). Ich werde nochmal darauf hinweisen, wenn es soweit ist.

Der Semantic-Web -Vortrag von Carina Haupt war übrigens (wenn auch leider zeitlich vorher platziert) eine prima Ergänzung zu meinem Einstieg ins Thema. Schaut euch auch dessen Aufzeichnung an, wenn ihr nicht vor Ort sein konntet!

Für die FrOSCon 7 habe ich den Vortrag gerade ebenfalls eingereicht, würde dort den Fokus aber stärker auf Entwickler-Bedürfnisse setzen, wenn er angenommen wird.

[important]Da ich den Eindruck habe, dass das konkrete Interesse am Thema wächst und auch viele Rückfragen zur praktischen Umsetzung kamen, plane ich für die nächste SIGINT einen Workshop zum Thema einzureichen. Was haltet ihr davon?[/important]

Linked Data Thesaurus

Linked Data Thesaurus ist ein kleines Projekt von mir, das die Daten von openthesaurus.de als Linked Data verfügbar macht. OpenThesaurus ist ein freies deutsches Synonymwörterbuch, welches seine Daten auch über eine offene API zur Verfügung stellt. Allerdings liefert diese API lediglich unverlinkte XML-Dokumente aus. Der Linked Data Thesaurus ergänzt den Dienst, indem die Daten zusätzlich in Form von RDF bereitgestellt werden. Ein Begriff bekommt beim Linked Data Thesaurus eine URI der folgenden Form:

http://thesaurus.datenwissen.de/Begriff#term

Synonyme zum Begriff „Daten“ sind somit unter folgender URI abrufbar:

http://thesaurus.datenwissen.de/Daten#term

Es handelt sich dabei um eine Nicht-Informationsressource. Der Fragmentbezeichner #term wird wie üblich beim Abruf per Browser abgetrennt und die Informationsressource http://thesaurus.datenwissen.de/Daten wird vom Server zurückgeliefert. Abhängig vom HTTP-Accept-Header liefert Linked Data Thesaurus entweder ein RDF/XML- (application/rdf+xml) oder Turtle-Dokument (text/turtle) aus. Im Firefox kann der Accept Header mit dem Plugin Modify Headers geändert werden. Andernfalls werden die originalen XML-Daten der OpenThesaurus-API zurückgeliefert! Im Folgenden erkläre ich den Aufbau der Daten anhand des Turtle-Formats und dem Begriff „Daten“. Der Begriff selbst ist vom Typ Label aus der SKOS-XL Ontologie. Das eigentliche Textliteral wird inklusive Sprachangabe über das Attribut skosxl:literalForm angefügt:

<Daten#term>
  a <http://www.w3.org/2008/05/skos-xl#Label>;
  <http://www.w3.org/2008/05/skos-xl#literalForm> "Daten"@de.

OpenThesaurus gruppiert Synonyme in sogenannten SynSets. Dabei handelt es sich um Gruppen von Begriffen mit der gleichen Bedeutung. Ein Begriff mit mehreren Bedeutungen kommt somit in unterschiedlichen SynSets vor, mit jeweils unterschiedlichen Synonymen die den jeweiligen Bedeutungen entsprechen. Zum Beispiel ist das Wort Schild zum einen in einem SynSet mit „Schutzwaffe“ und in einem anderen mit „Zeichen“.

Ein SynSet wird durch den Linked Data Thesaurus als skos:Concept abgebildet. Der abgefragte Begriff wird über das Attribut skosxl:prefLabel angefügt und alle Synonyme über skosxl:altLabel. Hier eines der SynSets in denen der Begriff „Daten“ vorkommt:

<#synset1>
  a <http://www.w3.org/2004/02/skos/core#Concept>;
  <http://www.w3.org/2008/05/skos-xl#altLabel>
    <Informationen#term>,
    <Angaben#term>,
    <Aussagen#term>,
    <Datensammlung#term>,
    <Unterlagen#term>;
  <http://www.w3.org/2008/05/skos-xl#prefLabel>
    <Daten#term>.

Ich freue mich über Feedback zum Linked Data Thesaurus und über die Art und Weise wie die Daten strukturiert sind. Es ist sicherlich noch nicht der Weisheit letzter Schluss, aber ein Anfang. Der OpenThesaurus stellt noch ein paar mehr Daten bereit, die ich gerne noch einbinden möchte und auch eine Verlinkung mit Lexvo.org habe ich bereits im Hinterkopf.

Wer mitarbeiten möchte kann sich gerne an mich wenden, oder einfach den Quellcode von GitHub beziehen und loslegen.