Geographische Datenformate

Raster - Vektor (Polygon)

Bei Geoinformationssystemem kommen sowohl Raster- und Vektordaten als auch Datenbanken und einfache Text- oder Tabellen-Dateien zum Einsatz. Eine Übersicht der wichtigsten Geo-Dateiformate mit Entwickler und Kompatibilität finden Sie auf Wikipedia: GIS-Datenformat Im Folgenden sind die wichtigsten Speicher-Formate in Kürze erläutert:

Geo Raster

Beispiele für Rasterdaten

Ein GeoRaster besteht aus Zeilen und Spalten wordurch sich Zellen bzw. Pixeln ergeben. Jede dieser Zellen/Pixel besitzt genau einen Wert. Im Unterschied zu einem herkömmlichen Rasterbild (z.B. ein Digitalfoto) besitzt das Georaster zudem einen Raumbezug und eine geographische Ausdehnung.

Vergrößern wir eine Rastergrafik, so sehen wir die Pixel aus welche sie besteht. Bei digitalen Fotos würde man dann sagen: „das Bild ist verpixelt“. Aber tatsächlich sind alle Fotos verpixelt. Die Auflösung, also die Dichte bzw. Größe der Pixel entscheidet darüber, ob wir es natürlich wahr nehmen oder eben verpixelt sehen.

Typische und häufige Raster-Speicherformate

Eines der häufigsten GeoRaster-Formate ist das GeoTIFF (*.tiff oder *.tif). Der Unterschied zum herkömmlichen TIFF-Raster ist nicht aus dessen Erweiterung ersichtlich - beide heißen gleich - doch ein GeoTiff besitzt eingebette Informationen zum Raumbezug (Koordinatenbezugssystem). Dabei ist keine weitere Datei notwendig 1).

Außerdem finden wir immer häufiger das relativ neue JPEG2000 oder JP2, ein für Geodaten besser geeignetes JPEG, welche komprimiert gespeichert werden und einen Raumbezug ohne World-Datei haben kann. Sie sind relativ klein, aber ungeeignet zum Speichern diskreter Werte (z.B. wie sie in Rohdaten vorkommen; Digitale Geländemodelle, Lärmkarten etc.).

Eine vollständige Liste aller GeoRaster-Formate findet man hier: GDAL Raster Format List

Ein Raster-Datensatz zum Ausprobieren und Üben finden Sie hier: Harz-Raster-DEM. Es handelt sich dabei um zwei SRTM-Szenen (Digitales Höhenmodell).

Weitere Informationen zu Rasterdaten im QGIS Handbuch

Geo Vektor

Punkt, Linien und Flächen-Vektoren
Jede Geometrie besitzt genau eine Zeile in der Attributtabelle

Eine Vektorgrafik besteht aus Punkten, Kreisen, Linien oder Polygonen. Die Lage eines Vektor-Punktes (Node oder Stützpunkt) wird durch Koordinaten beschrieben. Bei GeoVektoren sind dies geographische Koordinaten. Verbindet man diese diskreten Punkte miteinander, so erhält man Linien oder - wenn die Linie dort aufhört, wo sie begonnen hat und damit eine Fläche einschließt - Polygone. Die Strecken zwischen den Stützpunkten können als Segment bezeichnet werden. Da die Segmente immer Strecken zwischen zwei Punkten sind und Punkte theoretisch unendlich klein sind, sind Vektordaten „frei skalierbar“ - sie verpixeln nie!

Von ganz besonderer Bedeutung bei Vektordaten sind die Verknüpfungen zu Attributdaten in der Attributtabelle. Jede Vektorgeometrie besitzt demnach eine Zeile in der Attributtabelle und eine theoretisch beliebige Anzahl von Attributwerten.

Weitere Informationen zu Vektordaten im QGIS Handbuch

(Kommagetrennte) Texte und Tabellen

Sofern Text- oder Tabellendateien geographische Koordinaten besitzen, können diese auch als Geodaten bezeichnet und entsprechend in einem GIS angewendet werden. Die Einfachheit der Text- oder Tabellen-Dateien ist dabei deren Vorteil:

Beispiel: Der folgende Inhalt einer *.txt oder *.csv Datei kann in QGIS geöffnet werden

name;x;y 
Punkt1;464391.784;5662142.072 
Punkt2;464391.784;5671642.072 
Punkt3;478241.784;5662142.072 
Punkt4;478241.784;5671642.072

Hin und wieder stößt man auf *.xyz-Dateien. Hierbei handelt es sich ebenfalls um einfache getrennte Texte ohne Header oder Metabeschreibung. Häufig werden darin Punktwolken (ungridded ASCII) oder DGMs (gridded ASCII) 2) abgespeichert. QGIS kann in letzterem Fall das *.xyz direkt als DGM einladen 3).

Typische und häufige Vektor-Speicherformate

Derzeit findet das Shapefile noch am häufigsten Verwendung. Allein der von ESRI stammende Begriff Shapefile hat sich in der GIS-Branche als Art Standard etabliert. Dabei gibt es viele anderer GeoVektor-Formate, die durchaus Vorteile und Vorzüge haben (SpatiaLite, GeoPackage…). Dennoch: Das Shapefile ist nach wie vor das Top Austausch-Format und wird es noch einige Zeit bleiben.

Das Shapefile ist aber nicht nur eine Datei, sondern besteht aus mindestens drei voneinander abhängigen Dateien:

Erweiterung Funktion Erforderlich?
*.shp Speicherung der Geometriedaten Ja
*.dbf Sachdatentabelle (Attributtabelle) Ja
*.shx Indexdatei zur Verknüpfung der Geometrien mit den Attributwerten (Sachdaten) Ja
*.prj Projektion der Daten (nicht vorausgesetzt aber wichtig!) JaIn
*.atx Attributindex Nein
*.sbx & *.sbn Räumlicher Index Nein
*.qix GDAL-Index Nein
*.aih & *.ain Index für Tabellenverknüpfungen Nein
*.shp.xml Metadaten zum Shapefile Nein
*.cpg Zeichensatz der Attributtabelle (z.B. UTF-8) Nein

Shapefiles haben diverse Einschränkungen: Die maximale Größe eines Shapefile beträgt 2GB; die Länge der Feldnamen (Attributnamen) ist auf 10 Zeichen begrenzt, es können maximal 255 Felder (Attribute) gesetzt werden, Fließkommazahlen werden als Text gespeichert und können Rundungsfehler enthalten…

Alternativen zum Shapefile sind SpatiaLite, GeoJSON oder ganz besonders das GeoPackage. Alle haben ihre Vor- und Nachteile. Arbeitet man viel mit QGIS, rate ich zu SpatiaLite oder GeoPackage - Ein-Datei-SQLite-Datenbanken. Möchte man mit Raster und Vektoren in einer Datei arbeiten, empfiehlt sich GeoPackage.

Eine Zusammenfassung aller OGR-GeoVektor Formate findet man über die OGR Vector Format List

GeoDatenbanken

GeoDatenbanken oder räumliche Datenbanken sind objektrelationale Datenbanken in welchen Geoobjekte mit Geometrie und Raumlage relational gespeichert werden. 

Geodatenbanken ermöglichen eine effiziente und schnelle Verwaltung von Geodaten, eine einfache und reccourcenschonende Speicherung sowie gute Backupfunktionen. Mit Hilfe einer spezifischen Syntaxsprache können komplexe Filter gesetzt, Berechnungen durchgeführt und Abfragen erstellt werden. Datenbanken sind die erste Wahl bei umfangreicheren GIS-Projekten.

Bekannte räumliche Datenbanken sind PostgreSQL-PostGIS und SQLite-SpatiaLite. Auch Oracle und Mircrosoft Access Datenbanken können zu räumlichen Datenbanken erweitert werden.


Aktualisiert: 2021/01/24 00:59

1)
viele geographischen Raster-Formate benötigen zusätzlich eine sogenannte World-Datei welche den Raumbezug wieder gibt
2)
z.B. LiDAR-Modelle aus Laserscan-Daten

Fragen, Hinweise und Fehler kommen hier hin:

Geben Sie Ihren Kommentar ein. Wiki-Syntax ist zugelassen: