Schlagwort-Archive: Unstrukturierte Daten

Bestellübersicht im Solid Pod: Unstrukturierte Infos mithilfe von ChatGPT konvertieren

Wie behaltet ihr den Überblick über eure Online-Bestellungen? Es kann schwierig sein, sich an alle Details zu erinnern, insbesondere wenn man in vielen verschiedenen Shops einkauft. Solid kann euch helfen, alle Bestellungen zentral in eurem Pod zu speichern und zu organisieren.

Aber habt ihr jemals versucht, unstrukturierte Daten wie E-Mail-Bestellbestätigungen im Pod zu speichern? Wenn ja, wisst ihr sicherlich, wie mühsam und fehleranfällig das sein kann, da viele Shops nur HTML- oder reine Text-Bestätigungen liefern. Das Erstellen von RDF von Hand ist aufwändig und fehleranfällig und daher keine praktikable Lösung. In diesem Blogpost möchte ich euch zeigen, wie ihr mit ChatGPT unstrukturierte Daten aus E-Mail-Bestellbestätigungen und anderen Textquellen im Solid Pod speichern könnt.

ChatGPT, ein von OpenAI trainiertes Sprachmodell, kann unstrukturierten Text in strukturierte Daten umwandeln und damit auch das Erstellen von RDF ermöglichen. Dies ist in allen Fällen hilfreich, in denen man keine strukturierten Daten hat, aber ein interoperables Format für Solid benötigt.

Ich habe genau das nun ausprobiert, um eine E-Mail-Bestellbestätigung in RDF umzuwandeln, und war beeindruckt! Zwar musste ich noch ein paar Fehler manuell korrigieren, aber im Vergleich zur manuellen Übertragung aller Daten war das immer noch eine große Zeitersparnis.

Hier ist ein Beispielprompt, den ich ChatGPT gegeben habe:

Konvertiere folgende Bestelldetails nach RDF:

Ihre Bestellung Nummer 3456789 vom 08.12.2022

Carenesse Aleppo Soap, 60% Olive Oil 40% Laurel Oil, Approx. 200 g, original olive oil soap, natural product, vegan handmade shower soap, natural soap
Verkauf durch: Carenesse - natürlich schön
Rücksendung bis zum 31.01.2023 möglich.
EUR 11,69
Zustand: Neu - Carenesse Qualität, garantiert echt nur mit Carenesse-Etikett/Label, nur bei Carenesse

Und hier ist das beeindruckende Ergebnis, das ich von ChatGPT schlussendlich erhalten habe:

@prefix rdf:    <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix xsd:    <http://www.w3.org/2001/XMLSchema#> .
@prefix schema: <http://schema.org/> .

<#this>
    a schema:Order ;
    schema:orderNumber "3456789" ;
    schema:orderDate "2022-12-08T00:00:00Z"^^xsd:dateTime ;
    schema:acceptedOffer [
        a schema:Offer ;
        schema:itemOffered [
            a schema:Product ;
            schema:name "Carenesse Aleppo Soap" ;
            schema:description "60% Olive Oil 40% Laurel Oil, Approx. 200 g, original olive oil soap, natural product, vegan handmade shower soap, natural soap" ;
            schema:seller [
                a schema:Organization ;
                schema:name "Carenesse - natürlich schön"
            ] ;
        ] ;
        schema:price [
            a schema:PriceSpecification ;
            schema:price "11.69" ;
            schema:priceCurrency "EUR"
        ] ;
        schema:itemCondition "http://schema.org/NewCondition" ;
        schema:description "Rücksendung bis zum 31.01.2023 möglich."
    ] .

Man beachte, dass ChatGPT hier verschiedene Elemente der Bestellung wie Bestellnummer, Artikel, Preis und Verkäufer erkannt und strukturiert hat. Es war faszinierend, fast schon magisch, zu sehen, wie ChatGPT aus meinen unstrukturierten Bestelldetails RDF erzeugt hat.

Wenn ihr also auch Schwierigkeiten habt, strukturierte Daten aus z.B. E-Mail-Bestellbestätigungen zu gewinnen und in eurem Solid-Pod zu speichern, kann ChatGPT eine interessante Option sein. Allerdings sollte man dabei beachten: ChatGPT ist ein Cloud-Dienst, was bedeutet, dass ihr eure Daten an einen externen Anbieter übertragen müsst. Dies passt nicht ganz zum Ziel von Solid, volle Kontrolle über die eigenen Daten zu behalten. Mit Bedacht eingesetzt kann es aber sehr hilfreich sein und hat enormes Potential.