Datenqualität in der Eifel, Stand Juli 2022
Die Erhöhung der Datenqualität ist eine Maßnahme im Rahmen der Tourismusstrategie Eifel – Handlungsfeld Digitalisierung sowie im Starterprojekt “Touristisches Datenmanagement – offen, vernetzt, digital” der Tourismusstrategie NRW und in der Digitalstrategie von Rheinland-Pfalz.
Ziel ist es, mehr Reichweite für qualitativ hochwertigen, relevanten, für alle verfügbaren Content (=Inhalte) zu erreichen.
Mit der Erhöhung der Datenqualität arbeiten somit alle in der Eifel daran, auch eine sehr gute Datengrundlage für die Ausspielkriterien der Länder zu liefern.
Im Fokus der Reports zur Datenqualität durch die Eifel Tourismus GmbH stehen die Infrastruktur-Einträge (wie Ausflugsziele, Gastronomie) in feratel deskline.
Zur Messung der Datenqualität sind die wichtigsten Kennzahlen:
ContentScore in feratel deskline der einzelnen Infrastruktur-Datensätze eifelweit
Betrachtet man eifelweit alle 2.556 Infrastruktur-Datensätze in deskline, so erfüllen 72% einen ContentScore von 100%.
Somit ist dieser Anteil gegenüber Quartal 1 um 5% gestiegen. (2021: Q4: 44%, Q3: 71% Q2: 68%, Q1: 55%).
Zwischen 95 und 99% ContentScore liegen 17% aller Daten.
Somit liegen 89% aller Datensätze über einem ContentScore von 95% und noch 11% aller Daten unter einem ContentScore von 95%.
Entwicklung ContentScore aller Infrastruktur-Datensätze in feratel deskline:
Nach einem Einbruch der Datenqualität im November 2021 (aufgrund der gestiegenen Mindestkriterien der Bildgrößen) ist der Anteil der Datensätze mit einem ContentScore über 95% auf einem sehr guten Weg und liegt mit 89% auf dem höchsten Wert seit Beginn der Maßnahmen zur Erhöhung der Datenqualität.
Ziel ist es, auch die verbleibenden 11% der Datensätze auf einem ContentScore von mindestens 95% zu bringen.
ContentScore der einzelnen Datensätze in den Regionen
Die Regionen der Eifel haben sich dazu verpflichtet, alle Ihre Datensätze auf einen ContentScore von mindestens 95% zu bringen.
Aktuell weisen bei vier Regionen alle Infrastruktur-Datensätze einem ContentScore von mindestens 95% auf.
Bei weiteren fünf Regionen haben über 95% der Infrastruktur-Einträge einen ContentScore von 95% oder höher. Es sind hier nur sehr wenige, zum Teil nur ein bis zwei Datensätze, die unter
einem ContentScore von 95% liegen.
CC-Lizenzen
Damit Daten über die Landesdatenhubs und den DZT Knowledge Graph ausgespielt und weitergegeben werden können, müssen sowohl Datensätze als auch die dazugehörigen Fotos mit
einen offenen CC-Lizenz gekennzeichnet sein. Offene CC-Lizenzen sind: CC0, CC-BY und CC-BY-SA (siehe auch Beitrag zu Lizenzen).
31% aller Infrastruktur-Einträge in deskline haben eine offene CC-Lizenz.
Bei den POIs haben 32% aller Datensätze eine offene CC-Lizenz, bei der Gastronomie sind es 24%. Damit dieser Anteil deutlich gesteigert werden kann, müssen die Datensätze in deskline
entsprechend mit der Lizenz CC-BY-SA (inkl. Angabe Autor und Copyright) gekennzeichnet werden.
Erfreulich ist, dass 99% aller Datensätze bei POIs und Gastronomie mindestens ein Bild besitzen. 56% der POIs und 37% der Gastronomie-Datensätze verfügen über ein Bild, das mit einer offenen
Lizenz gekennzeichnet ist. Ziel bleibt, diesen Anteil weiter zu steigern, damit jeder offene Datensatz über mindestens ein offenes Bild verfügt. Die POI-Datensätze sind hier prioritär zu behandeln.
Zusammenfassung
Die Datenqualität in der Eifel entwickelt sich im Hinblick auf die ContentScores sehr positiv – Vielen Dank!
In Einzelfällen ist noch „Luft nach oben“, hier muss noch intensiv an den Daten gearbeitet werden.
Der Anteil der offenen Datensätze ist schon gestiegen, hier besteht jedoch noch Potential. Alle Datensätze mit einem ContentScore von mindestens 95% sind nochmals im Hinblick auf die Lizenzierung zu prüfen und zu kennzeichnen.
….
*ContentScore = Messeinheit für die Datenqualität in feratel deskline. Der ContentScore berechnet sich aus verschiedenen Faktoren zur Vollständigkeite der Angaben wie Adresse, Öffnungszeiten, Geo-Koordinaten, Beschreibungstext, Anzahl und Qualität Fotos etc.
⇒ Weitere Informationen rund um das Thema Datenmanagment, Infomaterialien und Erklärvideos gibt es auf der Projektwebseite zum Touristischen Datenmanagement NRW.
Das EFRE Projekt „Touristisches Datenmanagement – offen, vernetzt, digital“ wird gefördert durch:
Der Text scheint nur für Insider lesbar,
schade,
hätte mich auch gerne mit dem Thema befasst, verstehe aber NICHTS.
Vorschlag: wenigstens einen Link angeben zu einer das Thema erklärenden Einführung
Gruß F.G.Fetten
Sehr geehrter Herr Fetten,
vielen Dank für Ihren Kommentar. Gerne ergänzen wir einige hilfreiche Links:
Die Datenqualität des Gastgeber-Eintrages prüfen und erhöhen:
https://tourismus.eifel.info/2022/06/02/tipp-fuer-gastgeber-ueberpruefen-und-optimieren-sie-die-daten-ihrer-unterkunft/
Allgemeine Infos zum Thema Datenmanagement:
https://tourismusverband.nrw/themen/datenmanagement#infothek
Freundliche Grüße
Ina Waigand, Eifel Tourismus GmbH