Geographische Daten und Datenformate

In der vorhergehenden Lektion haben wir gelernt, dass Informationen aus interpretierten Daten bestehen und das Daten wiederum Messwerte, Signale oder Umfrageergebnisse sein können. Fügen wir diesen Daten nun noch einen Raumbezug hinzu (direkt oder indirekt), so können wir bereits von geographischen Daten oder Geodaten sprechen ('Geo' = Erde, 'Graph' = Zeichnen/Beschreiben). Der Raumbezug (oder die Georeferenz) also macht den entscheidenden Unterschied unserer Geodaten zu „herkömmlichen Daten“ aus:

„Unter Geodaten versteht man digitale Daten, welchen auf der Erdoberfläche bestimmte räumliche Lagen zugewiesen werden können (Geoinformationen, Geobezug)“ (GISWIKI http://giswiki.org/wiki/Geodaten)

Geodaten = Daten + Raumbezug + Metadaten

Der Raumbezug

Als Raumbezug verstehen wir die Verortung in einem räumlichen Referenzsystem welches i.d.R. die Erdoberfläche oder der erdnahe Weltraum sein können. Dabei bezieht sich die Verortung auf ein geometrisches Formprimitiv wie Punkt, Linie oder Fläche. Wir unterscheiden den direkten Raumbezug und den indirekten Raumbezug.

Indirekter Raumbezug

Ein indirekter Raumbezug liegt dann vor, wenn die Verortung uneindeutig oder beweglich ist. So stellt eine Adresse einen indirekten Raumbezug dar, da sich die räumliche Verortung verschieben kann. Auch Gemeinden sind nicht eindeutig und beweglich verortet (z.B. verschiebt sich das geographische Zentrum einer Gemeinde durch Ausdehnung oder Eingemeindung).

Direkter Raumbezug

Ein direkter Raumbezug wird üblicherweise durch Koordinatenpaare (Koordinatentupel) beschrieben. Diese sind eindeutig und unbeweglich. Ein Punkt besitzt logischer Weise genau ein Koordinatenpaar, eine Linie mindestens zwei und eine Fläche mindestens drei Koordinatenpaare (sonst wäre es eine Linie ;-)).

Es müssen nicht immer Koordinaten sein! Jeder Ort der Erde lässt sich auch mit 3 Worten beschreiben! Glauben Sie nicht? Versuchen Sie es: Knaben.Pfeife.Tagebuchhttps://what3words.com/de/

Die Metadaten

Metadaten oder Metainformationen sind ein wichtiger Bestandteil von Geodaten und beschreiben die Eigenschaften und Merkmale der Geodaten, wie zum Beispiel ihre zeitliche und räumliche Ausdehnung, das verwendete Koordinatenreferenzsystem, die Maßeinheiten, die Art der Speicherung, die Zeichenkodierung und andere technische Aspekte. Metadaten können auch zusätzliche Informationen wie Urheberrechte, Lizenzen, Kontaktinformationen oder Farbvorschläge enthalten. Metadaten sind entscheidend, um die Qualität, die Verwendbarkeit und die Verfügbarkeit von Geodaten zu verbessern und ermöglichen es, Geodaten in verschiedenen Anwendungen effektiv zu nutzen.

Geobasisdaten und Geofachdaten

Geodaten spielen in vielen Anwendungen eine zentrale Rolle, insbesondere in den Bereichen Geoinformation, Geodäsie und Kartographie. Dabei gibt es eine Unterscheidung zwischen Geobasisdaten und Geofachdaten, die beide unterschiedliche Funktionen und Anwendungen haben. Während Geobasisdaten eine Grundlage für verschiedene Anwendungen darstellen und in der Regel keinen direkten Anwendungsbezug haben, beziehen sich Geofachdaten speziell auf bestimmte Anwendungen oder Fachgebiete und enthalten daher spezifische Informationen und Merkmale.

Geobasisdaten

Bei Geobasisdaten handelt es sich laut der Arbeitsgemeinschaft der Vermessungsverwaltungen (AdV) um Daten des amtlichen Vermessungswesens, die einen Raumbezug herstellen und die Landschaft sowie Gebäude und Grundstücke nachweisen und beschreiben, ohne einen Anwendungsbezug herzustellen. Die Geobasisdaten stellen damit, wie der Name schon sagt - die Grundlage oder eben die Basis (den „Hintergrund“) dar, worauf die jeweiligen Fachdaten verortet werden können. 

Abkürzung Bezeichnung
DOP Digitales Orthophoto
DLM Digitales Landschaftsmodell
DGM (DEM) Digitales Geländemodell (Digital Elevation Model)

Geofachdaten

Geofachdaten enthalten spezifische Informationen zu bestimmten Fachthemen oder Anwendungen, die auf den Geobasisdaten verortet werden können. Die Kombination aus Basis- und Fachdaten ermöglicht es, komplexe geografische Zusammenhänge darzustellen und zu visualisieren, so dass man sich besser orientieren und Fachthemen besser verstehen kann. Geofachdaten enthalten spezifische Informationen zu bestimmten Fachthemen oder Anwendungen, die auf den Geobasisdaten verortet werden können.

Abkürzung Bezeichnung
BORIS Bodenrichtwert Informationssystem
CLC CORINE Land Cover
Natura2000 Natura2000 Schutzgebiete

ALKIS (Amtliches Liegenschaftskataster Informationsystem) und ATKIS (Amtliches Topographisch-Kartographisches Informationssystem) können sowohl als Basisdaten als auch als Fachdaten betrachtet werden.

Raster- und Vektor-Geodaten

Betrachten wir die Speicherung von Geodaten, so unterscheiden wir Raster-Geodaten und Vektor-Geodaten.

Aufbau von Raster-Geodaten1)
Aufbau von Vektor-Geodaten2)

Raster entstehen z.B. aus einem Scan, einem Satellitenfoto, einer Radar- oder Lasermessung. Die einzelnen Pixelwerte repräsentieren Messergebnisse. Diese können die an einem Fotosensor oder Scanner gemessenen Reflexionseigenschaften des aufgenommenen Objekts sein oder die Ergebnisse der in einem Gebietsraster verteilten Messstationen zur Lärm- oder CO²-Messung. Es handelt sich in diesen Fällen um Primärdaten. Weiterverarbeitet, z.B. durch eine Reklassifikation, durch Abdigitalisieren oder Vektorisieren erzeugen wir daraus Sekundärdaten - häufig in Form von Geovektoren

Stammen die Daten „berührungsfrei“ von Satelliten, Flugzeugen oder Drohnen, so sprechen wir auch von Fernerkundungsdaten. (Satellitenbild, Höhenmodell, Multispektralaufnahme)

Geovektoren entstehen in den häufigsten Fällen aus der Weiterverarbeitung, Klassifikation, Analyse oder Modellierung etc. von Rasterdaten. Es handelt sich dann um Sekundärdaten. Sie besitzen neben Ihrer Verortung in einem Bezugssystem, anders als bei Rasterdaten, eindeutige Geometrien. Sie können im einfachsten Sinne diskrete Punkte sein aber auch Strecken oder Polygone .

Während Punkte keine Ausdehnung besitzen und deshalb nur ein einzelnes Koordinatenpaar haben, bestehen Linien aus mindestens 2 Koordinatenpaaren und Polygone aus mindestens 3 wobei hier eine Koordinate den Anfang sowie das Ende einer geschlossenen Linie markiert (Polygone sind eigentlich „Ringe mit Füllung“). All diesen Geometrien sind Informationen hinterlegt oder auch Fachinformationen oder Attributwerte. Alle Fachinformationen/Attributwerte finden wir zusammengefasst in der Attributtabelle wieder. Für jede Geometrie, finden wir genau eine Zeile in der Attributspalte wieder. Nehmen wir die drei Geometriebeispiele aus Abb. 3, so erwarten wir für die drei Punkte auch 3 Attributzeilen und für die Linie und das Polygon jeweils nur eine Zeile in der Attributtabelle. Ein Geovektor besteht also immer aus: 

  • einer räumlichen Ausdehnung und Lage (Koordinaten, Ausmaße, Länge)
  • einer Geometrie (Punkt/Linie/Fläche); 
  • Sachinformationen/Attributwerte (z.B. Naturschutzgebiet, Bahnlinie oder Mülleimer)

Bei Geoinformationssystemem kommen sowohl Raster- und Vektordaten als auch Datenbanken und einfache Text- oder Tabellen-Dateien zum Einsatz. Eine Übersicht der wichtigsten Geo-Dateiformate mit Entwickler und Kompatibilität finden Sie auf Wikipedia: GIS-Datenformat Im Folgenden sind die wichtigsten Speicher-Formate in Kürze erläutert:

Raster-Geodaten

Beispiele für Rasterdaten

Raster-Geodaten basieren auf einem (oder mehreren gestapelten) Rastern aus gleichmäßig angeordneten Pixeln, wobei jeder Pixel einen bestimmten Wert oder eine bestimmte Messung darstellt. Im Unterschied zu einem herkömmlichen Rasterbild (z.B. ein Digitalfoto) besitzt das Georaster zudem einen Raumbezug und eine geographische Ausdehnung.

Vergrößern wir eine Rastergrafik, so sehen wir die Pixel aus welchen sie besteht. Bei digitalen Fotos würde man dann sagen: „das Bild ist verpixelt“. Aber tatsächlich sind alle Fotos verpixelt. Die Auflösung, also die Dichte bzw. Größe der Pixel, entscheidet darüber, ob wir es natürlich wahr nehmen oder eben verpixelt sehen.

Bei einem Georaster haben die Pixel eine tatsächliche räumliche Ausdehnung. z.B. ein Landsat3)-Bild (man sagt auch Szene) hat eine räumliche Pixelauflösung von ca. 30×30 Meter, kommerzielle sehr hochaufgelöste Satelliten erreichen Bildauflösungen vom bis zu 0,5×0,5 Meter! Eine Orthofoto erzeugt durch Beflug4) kann bis zu 1×1 Zentimeter aufgelöst sein!

Das sogenannte Multibandraster oder „Multispektralraster“ besteht aus mehreren in verschiedenen Spektral-Bänder aufgenommenen Rasterbildern, welche „übereinander“ gelegt sind. Bei farbigen Satellitenbildern wären das die Spektral-Bänder Rot, Grün und Blau, sowie häufig auch Infrarot. Satelliten nehmen in der Regel noch viel mehr Spektral-Bänder wie nahes, mittleres und fernes Infrarot oder thermale Wellenlängen auf. Hyperspektrale Rasterdaten können aus Hunderten oder sogar Tausenden Bändern bestehen!

Weitere Informationen zu Rasterdaten im QGIS Handbuch

Beispiele für Raster-Geodaten

Abkürzung Bezeichnung Typ Bedeutung
DOP Digitales Orthophoto Multiband-Raster Georeferenziertes und mit Hilfe von Geländemodellen perspektivisch korrigiertes Luftbild
DGM (DEM) Digitales Geländemodell Singleband-Raster Georeferenziertes Abbild der Reliefoberfläche
DOM (DSM) Digitales Oberflächenmodell Singleband-Raster Georeferenziertes Abbild der tatsächlichen Oberfläche

mehr Rasterbeispiele (DEM!) hinzufügen (zugewiesen an map)


Typische und häufige Raster-Speicherformate

Eines der häufigsten GeoRaster-Formate ist das GeoTIFF (*.tiff oder *.tif). Der Unterschied zum herkömmlichen TIFF-Raster ist nicht aus dessen Erweiterung ersichtlich - beide heißen gleich - doch ein GeoTiff besitzt eingebette Informationen zum Raumbezug (Koordinatenbezugssystem). Dabei ist keine weitere Datei notwendig 5).

Ein weiteres populäres Raster-Format ist das ASC-Grid (*.asc), ein textbasiertes Dateiformat, das von Esri, dem Entwickler von ArcGIS, entwickelt wurde. Es ist einfach zu lesen und zu bearbeiten und wird häufig für den Austausch von Rasterdaten zwischen verschiedenen GIS-Anwendungen verwendet.

Außerdem finden wir immer häufiger das relativ neue JPEG2000 oder JP2, ein für Geodaten besser geeignetes JPEG, welche komprimiert gespeichert werden und einen Raumbezug ohne World-Datei haben kann. Sie sind relativ klein, aber ungeeignet zum Speichern diskreter Werte (z.B. wie sie in Rohdaten vorkommen; Digitale Geländemodelle, Lärmkarten etc.).

Bei Geländemodellen, Höhenmodellen und auch Punktwolken werden häufig einfache Text-Formate wie das XYZ-Format verwendet.

Auch das GeoPackage ist in der Lage Raster-Daten verlustfrei zu speichern. Noch finden sich GeoPackages relativ selten, trotz ihrer vielen Vorteile.

Eine vollständige Liste aller GeoRaster-Formate findet man hier: GDAL Raster Format List

Ein Raster-Datensatz zum Ausprobieren und Üben finden Sie hier: Harz-Raster-DEM. Es handelt sich dabei um zwei SRTM-Szenen (Digitales Höhenmodell).

Vektor-Geodaten

Die drei Vektor-Grundformen: Punkte, Linien und Flächen

Eine Vektorgrafik besteht aus Punkten, Kreisen, Linien oder Polygonen. Die Lage eines Vektor-Punktes (Node oder Stützpunkt) wird durch Koordinaten beschrieben. Bei GeoVektoren sind dies geographische Koordinaten. Verbindet man diese diskreten Punkte miteinander, so erhält man Linien oder - wenn die Linie dort aufhört, wo sie begonnen hat und damit eine Fläche einschließt - Polygone. Die Strecken zwischen den Stützpunkten können als Segment bezeichnet werden. Da die Segmente immer Strecken zwischen zwei Punkten sind und Punkte theoretisch unendlich klein sind, sind Vektordaten „frei skalierbar“ - sie verpixeln nie!

Jede Geometrie besitzt genau eine Zeile in der Attributtabelle (Auswahl: Gelb in der Karte, Blau in Attributtabelle)

Von ganz besonderer Bedeutung ist die Verknüpfungen zu Attributdaten (auch Sachdaten genannt) in der Attributtabelle bzw. Sachdatentabelle. Jede Vektorgeometrie besitzt demnach eine Zeile in der Attribut-/Sachdatentabelle und eine theoretisch beliebige Anzahl von Attributen. Neben der freien Skalierbarkeit von Vektordaten ist das die wichtigste Eigenschaft und bedeutendster Unterschied zu Rasterdaten!

Betrachtet man den nebenstehenden Screenshot, erkennt man den Zusammenhang zwischen Geometrie (Gebäudeumriss) und Zeile der Attributtabelle. Jede Geometrie hat exakt einen Eintrag in der Attributtabelle.

Eine Ausnahme machen hier die sog. Multi-Geometrien6). Diese können aus mehreren Geometrieteilen bestehen welche sich eine Zeile der Attributtballe „teilen“ → Beispiel: Zwei Gebäudeteile (Garage + Wohnhaus) haben die gleichen Attributeigenschaften da es sich thematisch auch um ein Gebäudekomplex handelt - also auch nur eine Attributzeile

Ob es sich um einen Single oder Poly-Typ handelt, wird beim Erzeugen der Daten entschieden. Die Entscheidung dazu muss wohl überdacht werden!

Weitere Informationen zu Vektordaten im QGIS Handbuch

Typische und häufige Vektor-Speicherformate

Derzeit findet das von ESRI™ aus den 90ern stammende Shapefile noch am häufigsten Verwendung. Allein der Begriff Shapedatei oder einfach nur Shape hat sich in der GIS-Branche als Art Standard etabliert. Dabei gibt es viele anderer GeoVektor-Formate, die durchaus Vorteile und Vorzüge haben (SpatiaLite, GeoPackage…). Dennoch: Das Shapefile ist nach wie vor das Top Austausch-Format und wird es noch einige Zeit bleiben.

Das Shapefile ist aber nicht nur eine Datei, sondern besteht aus mindestens drei voneinander abhängigen Dateien:

Erweiterung Funktion Erforderlich?
*.shp Speicherung der Geometriedaten Ja
*.dbf Sachdatentabelle (Attributtabelle) Ja
*.shx Indexdatei zur Verknüpfung der Geometrien mit den Attributwerten (Sachdaten) Ja
*.prj Projektion der Daten (nicht vorausgesetzt aber wichtig!) JaIn
*.cpg Zeichensatz der Attributtabelle (z.B. UTF-8 für Sonderzeichen und Umlaute) JaIn
*.atx Attributindex Nein
*.sbx & *.sbn Räumlicher Index Nein
*.qix GDAL-Index Nein
*.aih & *.ain Index für Tabellenverknüpfungen Nein
*.shp.xml Metadaten zum Shapefile Nein
*.qml QGIS-Stildatei (damit lassen sich QGIS-Stilinformationen mit austauschen) Nein

Shapefiles haben diverse Einschränkungen: Die maximale Größe eines Shapefile beträgt 2GB; die Länge der Feldnamen (Attributnamen) ist auf 10 Zeichen begrenzt, es können maximal 255 Felder (Attribute) gesetzt werden, Fließkommazahlen werden als Text gespeichert und können Rundungsfehler enthalten…

Alternativen zum Shapefile sind SpatiaLite, GeoJSON, KML/KMZ oder ganz besonders das GeoPackage. Alle haben ihre Vor- und Nachteile. Arbeitet man viel mit QGIS, rate ich zu SpatiaLite oder GeoPackage - Ein-Datei-SQLite-Datenbanken. Möchte man mit Raster und Vektoren in einer Datei arbeiten, empfiehlt sich GeoPackage.

Eine Zusammenfassung aller OGR-GeoVektor Formate findet man über die OGR Vector Format List

Vergleich häufiger Vektor-Geodatenformate

Merkmal GeoPackage SpatiaLite ESRI® FileGDB ESRI® ShapeFile GeoJSON KML DWG/DXF
Datenstruktur Vektor, Raster Nur Vektor Vektor, Raster Nur Vektor Nur Vektor Nur Vektor Nur Vektor
Dateigröße Komprimiert Komprimiert Komprimiert Größer Komprimiert Komprimiert
Plattformunabhängig Ja Ja nur Windows Ja Ja Ja JaIn
Open Source Ja Ja Nein Ja Ja Ja Nein
Erweiterbarkeit Hoch Hoch Hoch Gering Mittel Mittel
Unterstützte Geometrien Alle Punkt, Linie, Polygon Alle Punkt, Linie, Polygon Punkt, Linie, Polygon Punkt, Linie, Polygon Punkt, Linie, Polygon, Kurven
Speicherung mehrerer Layer Ja Ja Ja Nein Nein Nein Ja
Rasterdaten Ja Nein Ja Nein Nein Ja Nein
Performance Hoch Hoch Hoch Mittel Mittel Mittel
Indexerzeugung Ja Ja Ja Nein Nein Nein Nein
Stilspeicherung Ja Ja Ja Nein Nein Ja Ja
Zeichensatz und KBS inkludiert Ja Ja Ja Nein Ja (nur WGS84) Ja (nur WGS84) JaIn
Art der Speicherung Datei (SQLite DB) Datei (SQLite DB) Verzeichnis Dateipaket Datei Datei Dateipaket

(Kommagetrennte) Texte und Tabellen

Sofern Text- oder Tabellendateien geographische Koordinaten besitzen, können diese auch als Geodaten bezeichnet und entsprechend in einem GIS angewendet werden. Die Einfachheit der Text- oder Tabellen-Dateien ist dabei deren Vorteil:

Beispiel: Der folgende Inhalt einer *.txt oder *.csv Datei kann in QGIS geöffnet werden:

name;x;y 
Punkt1;464391.784;5662142.072 
Punkt2;464391.784;5671642.072 
Punkt3;478241.784;5662142.072 
Punkt4;478241.784;5671642.072

Da Text-Dateien unterschiedlich aufgebaut sein können und beispielsweise unterschiedliche Trenn- oder Dezimalzeichen verwendete werden können, sollte der Import von Texten über die Datenquellenverwaltung → Getrennte Texte erfolgen. Hier hat man die Möglichkeit QGIS mitzuteilen, wie die zu importierende Datei aufgebaut und zu interpretieren ist. Mehr dazu in der Lektion Import zeichengetrennter Texte und Tabellen

Hin und wieder stößt man auf *.xyz-Dateien. Hierbei handelt es sich ebenfalls um einfache getrennte Texte ohne Header oder Metabeschreibung. Häufig werden darin Punktwolken (ungridded ASCII) oder DGMs (gridded ASCII) 7) abgespeichert. QGIS kann in letzterem Fall das *.xyz direkt als DGM einladen 8).

GeoDatenbanken

GeoDatenbanken oder räumliche Datenbanken sind objektrelationale Datenbanken in welchen Geoobjekte mit Geometrie und Raumlage relational gespeichert werden. 

Geodatenbanken ermöglichen eine effiziente und schnelle Verwaltung von Geodaten, eine einfache und reccourcenschonende Speicherung sowie gute Backupfunktionen. Mit Hilfe einer spezifischen Syntaxsprache können komplexe Filter gesetzt, Berechnungen durchgeführt und Abfragen erstellt werden. Datenbanken sind die erste Wahl bei umfangreicheren GIS-Projekten.

Bekannte räumliche Datenbanken sind PostgreSQL-PostGIS und SQLite-SpatiaLite. Auch Oracle und Mircrosoft Access Datenbanken können zu räumlichen Datenbanken erweitert werden.


Zusammenfassung

  • Geodaten sind Daten mit Raumbezug
  • Der Raumbezug kann direkt oder indirekt sein
  • Geodaten können Raster oder Vektoren sein
  • Rasterdaten sind i.d.R. Primärdaten
  • Sekundärdaten sind abgeleitete Daten (z.B. Digitalisieurng eines Orthofotos)
  • Geodaten besitzen neben dem Raumbezug auch Metainformationen
  • Metainformationen beschreiben die Geodaten näher
  • Vektordaten bestehen aus Geometrien und dazugehörigen Attributen
  • Wir unterscheiden in Deutschland Geobasis und Geofachddaten
1) , 2)
Pászto V., Redecker A., Macků K., Jürgens C., Moos N. (2020) Data Sources. In: Pászto V., Jürgens C., Tominc P., Burian J. (eds) Spationomy. Springer, Cham. https://doi.org/10.1007/978-3-030-26626-4_1
3)
Serie ziviler Erdbeobachtungssatelliten der NASA zur Fernerkundung der kontinentalen Erdoberfläche sowie der Küstenregionen.
4)
mit Flugzeugen, Hubschraubern oder UAV's
5)
viele geographischen Raster-Formate benötigen zusätzlich eine sogenannte World-Datei welche den Raumbezug wieder gibt
6)
Multipunkt, Multilinie, Multipolygon
7)
z.B. LiDAR-Modelle aus Laserscan-Daten
Diese Website verwendet Cookies. Durch die Nutzung der Website stimmen Sie dem Speichern von Cookies auf Ihrem Computer zu. Außerdem bestätigen Sie, dass Sie unsere Datenschutzbestimmungen gelesen und verstanden haben. Wenn Sie nicht einverstanden sind, verlassen Sie die Website.Weitere Information

Fragen, Hinweise und Fehler kommen hier hin:

Rebmann KH, 2024/11/28 09:49

Die Tabelle „Vergleich häufiger Vektor-Geodatenformate“ hat in der Zelle „Rasterdaten/KML“ einen falschen Eintrag („nein“). Richtig ist „ja“, KMZ/KML können Rasterdaten in Form von Kacheln georeferenziert darstellen.

Martin Höpke, 2024/11/28 17:22

Du hast vollkommen Recht! Habe ich soeben korrigiert! Danke!!

Geben Sie Ihren Kommentar ein. Wiki-Syntax ist zugelassen:
N U I B V