Rasterdatenerfassung

 

Die Erfassung von Rasterdaten kann sowohl einer Primär- als auch einer Sekundärdatenerfassung dienen. Um Primärdatenerfassung handelt es sich z.B. bei Techniken der Satellitenbildaufnahme und der voll digitalen Aufnahme von Luftbildern. Anmerkung: Diese Bereiche werden in Lektionen angesprochen, die nicht Teil dieses Schnuppermoduls sind.

Scannen als Technik zur Sekundärdatenerfassung, also zu digitalen Konversion von vorliegenden Dokumenten, wird sowohl auf analoge fotografische wie auch auf planlich / kartographische Vorlagen angewandt. Als weitere Alternative steht die Raster-Konversion von bestehenden digitalen Vektordaten zur Verfügung, womit wir uns weiter unten beschäftigen. Die Rastererfassung als Technik der Sekundärerfassung ist also nur eine von mehreren möglichen Vorgangsweisen, einen Bestand an Rasterdaten aufzubauen - mit ihr wollen wir uns in diesem Abschnitt auseinandersetzen.

   
   

Alternativen der Rastererfassung: Ausgehend von digital vorliegenden Bild-Rastern mit kontinuierlichen Werteverläufen müssen wir diese zur Zuordnung von Sachinformation klassifizieren. Bereits im Zuge der kartographischen Bearbeitung kategorisierte Information kann direkt in thematische Rasterinformation umgesetzt werden, ebenso notwendigerweise kategorisiert vorliegende Vektordaten durch deren ‘Aufrasterung’.

   

Scannen

Derartige Abtaster haben wir bereits als Instrument der Fernerkundung im Zuge der Primärdatenerfassung kennengelernt, wo sie in Verbindung mit Kamera-Optiken zur Aufzeichnung an der Erdoberfläche reflektierter Spektralbereiche elektromagnetischer Strahlung eingesetzt werden.

Dokumentenscanner - wie wir zur klaren Trennung die auf unserem Schreibtische stehenden Geräte bezeichnen wollen - sind ‘aktive Systeme’, beleuchten also die Vorlage mit einer Lichtquelle und registrieren dann meist unmittelbar, also ohne mit einer Kamera vergleichbare Optiken (meist nur Spiegel) die Stärke der Reflexion von der Vorlagenoberfläche.

Scannertechnologie

Als ‘Scanner’ bezeichnet man im vorliegenden Kontext optoelektronische Abtastgeräte, die zum Einlesen von Karten- bzw. Planvorlagen dienen. Scanner sind in der Regel als Peripheriegeräte an Rechner angeschlossen, werden von diesen ge- steuert, und erzeugen eine Bilddatei als Ergebnis. Scanner für das Einlesen von Plänen bilden diese in Form einer Matrix kleiner Rasterzellen (Pixeln) ab.

Im Wesentlichen sind zwei Bauarten von Scannern gebräuchlich:

  • Flachbettscanner
  • Durchlauf- (Rollen-) Scanner

Die früher ebenfalls gebrauchlichen Trommelscanner sind trotz ihrer an sich guten Scanqualität kaum noch im Einsatz.

   

 

 

Das Konstruktionsprinzip wirkt sich vorwiegend auf die geometrische Qualität (Abbildungstreue) des resultierenden Rasterbildes aus. Flachbettscanner sind aus dieser Sicht generell zu bevorzugen, allerdings für große Formate sehr teuer und daher in erster Linie im Desktop-Bereich (bis DIN-A3) im Einsatz. Während beim Flachbettscanner die Vorlage fixiert ist und sich die abtastende Optik bewegt, ist der Durchlaufscanner ‘umgekehrt’ konstruiert. Mittels einer Friktionsführung wird die Vorlage an der Optik vorbeitransportiert. Positionsfehler in der Transportrichtung können dabei durch (minimalen) ‘Schlupf’ auftreten. Durchlaufscanner für große Papierformate werden oft als Multifunktionsgeräte mit Großformatdruckern kombiniert.

Die Registrierungskomponente von Scannern sind lichtempfindliche (Foto-) Zellen, die meist als CCDs (charge coupled devices) ausgeführt sind. Die Signale dieser kleinen Bauteile werden umso stärker, je intensiver das einfallende Licht ist. Vor der Aufzeichnung werden diese Signale in diskrete digitale Werte quantifiziert, meist als 8 bit Zahlen. Die einzelnen CCDs sind meist linear angeordnet, also als ‘Zeile’ ausgeführt, in selteneren Fällen als zweidimensionales Feld (CCD array). Ein derartige Zeile dieser lichtempfindlichen Zellen wird nun beim Flachbettscanner am Original vorbeigeführt, beim Durchlauf- oder Rollenscanner ist sie fixiert und die Vorlage wird transportiert. In beiden Fällen ist das Ergebnis des Abtastvorgangs eine numerisch vorliegende Matrix von Helligkeitswerten an den einzelnen Bildpunkten des Dokuments.

Geometrische Auflösung: Wie generell bei grafischen Rasterdaten (im Gegensatz zu georeferenzierten) üblich, wird die Auflösung in DPI (dots per inch) angegeben. Übliche Größenordnungen der geometrischen Auflösung liegen heute zwischen 600 dpi und 9600 dpi. Von der Auflösung ist allerdings die Genauigkeit eines Gerätes zu unterscheiden.

Radiometrische Auflösung: Die mögliche Differenzierung der je Pixel ausgewiesenen Helligkeitswerte wird zumeist in bit (Tiefe) je Pixel angegeben. Diese reicht grundsätzlich von binärer Abtastung bis zu 24 bit Farbscans, d.h. 8 bit (=256 Graustufen) pro Grundfarbe (Rot, Grün, Blau). Die Exaktheit bzw. Wiederholbarkeit der Scan-Abtastung wird von zahlreichen Faktoren beeinflußt und ist meist durch spezielle Kalibrierung durch Scannersoftware zu gewährleisten.

Erfassungsablauf

Hat man auf Basis der zu erfassenden Vorlage, dem verfügbaren Gerät und dem angestrebten Ergebnis die Spezifikationen für das Scan-Produkt erstellt, stehen meist einige Wege zu diesem Produkt hin offen. Dies gilt insbesondere für die geometrische, mehr noch für die radiometrische Auflösung. So benötigt man häufig eine niedrigere radiometrische Auflösung als das verfügbare Gerät zu leisten imstande ist. Damit stellt sich die Frage, an welcher Stelle im Gesamtablauf etwa ein binäres Bild (das sich z.B. für nachfolgende Vektorisierung besonders eignet) aus einem Grauwertbild generiert werden soll. Um größtmögliche Flexibilität zu gewährleisten, ist es sinnvoll eine derartige Informationsreduktion so spät wie möglich vorzunehmen. Ähnliches gilt für die Auflösung: Scannen mit hoher Auflösung und nach- folgender Reduktion erlaubt mehr Kontrolle über diesen Vorgang, erfordert jedoch einen zusätzlichen, Arbeitsgang.

Worin wirkt sich aber nun diese ‘Kontrolle’ aus, wofür wird sie benötigt? Denken wir zuerst an die häufige Zielsetzung der Erzeugung eines binären Bildes aus einer schwarz-weißen Strichvorlage. Für einen Grauwert-empfindlichen Scanner ist diese Aufgabe nicht so einfach, wie sie auf den ersten Blick erscheinen mag. Pixel am Rand von Objekten werden je nach gesetztem Schwellwert einmal als weiß, einmal als schwarz ausgewiesen. Bei einem hell angesetztem schwarz-weiß Schwellwert werden daher Linien dicker und es besteht die Gefahr, dass nahe aneinander verlaufende Linien sich berühren. Bei zu dunklen Schwellwert besteht demgegenüber die Gefahr, daß Linien ‘ausreißen’, also Lücken aufweisen.

Binärisierung von scanvorlagen

Die Einstellung des Binarisierungs-Schwellwertes ist daher von entscheidender Bedeutung für nachfolgende Arbeitsschritte wie Vektorisierung und Zeichenerkennung.

   
Übung

Im Gegensatz zu georeferenzierten Daten wird bei graphischen Daten die Auflösung in DPI (dots per inch: 1inch = ca. 2.54 cm) bzw. Linien pro cm angegeben. Eine kleine Rechenübung soll Sicherheit im Umgang mit diesen Einheiten vermitteln.

   
R2V oder V2R
 
 

Raster «—» Vektor Konversion

Der Fragenkreis der Raster - Vektor Konversion ist aus mehreren Perspektiven von Interesse. Einerseits stehen wir häufig vor der Situation - insbesondere zur Vorbereitung von analytischen Prozeduren - eine Umsetzung zwischen Datenmodellen und damit auch -strukturen vorzunehmen. Vor allem spielt diese Umsetzung jedoch bei der Automatisierung der Erfassungsarbeit eine entscheidende Rolle:

Lange Zeit galt die Datenerfassung als Flaschenhals und überproportionaler Kostenfaktor in GIS. Das aufwendige manuelle vektorielle Digitalisieren ließ die Frage nach möglicher Automatisation dieses Arbeitsvorganges schon sehr früh aktuell werden. Im wesentlichen sind, ausgehend von einer analogen Vorlage, dabei zwei Problemkreise anzusprechen:

  • Wie kann aus einem meist sehr komplexen und informationsreichen (dichten) Kartenbild die gegenständlich relevante Information extrahiert werden? Dabei leistet das menschliche Auge „Bildverarbeitung“ höchster Qualität, das automatische Verfolgen aller Straßen, das Umgrenzen von Siedlungen in einer gängigen topographischen Karte ist durch rein computerbasierte Verarbeitung kaum möglich.
  • Auf welchem Weg soll - nach Lösung des obigen Problems - ein analog vorliegendes Dokument auf einem beliebigen Zeichnungsträger in digitale, in weiterer Folge adäquat strukturierte Information umgesetzt werden?

Zur Lösung des ersten Problems ist es nötig, ein komplexes Kartenbild auf die wesentlichen Inhalte zu reduzieren, günstigstenfalls jede erforderliche Informationsschicht (Thematik) separat beizustellen. Dazu bieten sich drei Lösungswege an:

  • Umzeichnen / „Hochzeichnen“ der relevanten Inhalte auf ein separates Blatt bzw. Folie.
  • Rückgriff auf thematisch separiert vorliegendes Originalmaterial aus dem Herstellungsvorgang (z.B. Druckfilme).
  • Rechnerische Extraktion von Themen auf Grund farblicher bzw. struktureller Merkmale des Kartenbildes (alle blauen Bildpunkte werden dem Thema „Gewässer“ zugeordnet, alle grünen dem Thema „Vegetation“ etc.).

Während die erste Alternative mit dem Nachteil manueller Bearbeitung und damit hohen Aufwandes behaftet ist, kommen die beiden folgenden Ansätze nur bei Zutreffen bestimmter Voraussetzungen und Berücksichtigung einiger Einschränkungen in Frage:

  • Die Gleichsetzung von graphischer Gestaltung (z.B. Farbton) und thematischer Dimension trifft nur manchmal zu, aus der Differenzierung graphischer Charakteristika kann kaum jemals der vollständige Informationsgehalt einer Karte extrahiert werden.
  • Die kartographische Gestaltung setzt Prioritäten, die zu „Lücken“ in untergeordneten Themen führen (ein Gewässer ist unter einer Brücke „unterbrochen“, eine schwarze Grenzlinie führt zu einer „Schneise“ im Wald).

Die Entscheidung für die Vorbereitung von Originalmaterial für automatisationsgestützte digitale Konversion kann daher nur anwendungs- bzw. problemorientiert fallen, in manchen Fällen wird kaum ein Weg an arbeitsaufwendiger Hochzeichnung von Teilinhalten aus komplexen kartographischen Dokumenten vorbeiführen.

Um aus den „Rohdaten“ der Erfassung zu einem in GIS einsetzbaren, georeferenzierten Datenbestand zu gelangen, sind folgende Arbeitsschritte erforderlich:

  • Verarbeitung der Helligkeits- / Farbwerte der Scanner-Ausgabe zu thematisch relevanten Daten durch Schwellwertbildung, Klassifikation etc.
  • Überführung vom Geräte-Koordinatensystem des Scanners in das benötigte Bezugssystem (Landeskoordinatensystem).
  • Objektbildung und -identifikation aus dem Rasterbild, häufig mit einem Wechsel von Raster- zu Vektorrepräsentation verbunden.

In weiterer Folge werden wir uns vorwiegend mit dem letzteren Fragenkreis befassen, allerdings aus der weiteren Perspektive der bidirektionalen Umsetzung. Da nicht nur im Zuge der digitalen Ersterfassung (ausgehend von analogen Dokumenten), sondern auch bei der Einbringung in andere Systemstrukturen eine Änderung des Datenmodells erfolgen kann, darf auch der umgekehrte Vorgang der Vektor -> Raster - Umsetzung nicht vernachlässigt werden. Eine gemeinsame Diskussion im gegenständlichen Kapitel ist umso mehr von Bedeutung, weil es sich um im Allgemeinen nicht umkehrbare Konversionen handelt: Während die Abbildung vektorieller Raumdaten in ein Raster nur von wenigen Parametern abhängt und meist eindeutig spezifizierbar ist, wird der umgekehrte Prozeß der Raster-Vektor - Umsetzung von mehreren Parametern bestimmt und kann kaum jemals durch objektivierbare Kriterien eindeutig nachvollziehbar gestaltet werden.

zum Seitenanfang
   
   

Vektor —» Raster Konversion

Für die Umsetzung räumlicher Objektdaten (Punkte, Linien, Flächen; wir sprechen hier nicht von Oberflächen) von vektorieller in Raster-Repräsentation sind folgende Arbeitsschritte durchzuführen bzw. Entscheidungen zu treffen:

  • Definition des Raster - Bezugssystems (Orientierung, Ursprung / Ausmaße und Zellengröße).
  • Zuordnungsregel von Objekten zu Zellen und Regeln für Sonderfälle:
    • Welcher Zelle werden Punkte zugerechnet, die genau auf einer Zellengrenze zu liegen kommen? („Rechts / Oben“ Regel o.ä.).
    • Werden Zellen einer Linie zugerechnet, die die Zelle nur exakt am Eckpunkt berührt? (Meist nicht).
    • Welcher Zelle wird eine Linie zugerechnet, die exakt an der Zellengrenze verläuft? („Rechts / Oben“ Regel o.ä.).
    • Wie wird die Zugehörigkeit einer Zelle zu einer Fläche entschieden? Je nach Zielsetzung bzw. Thematik kommen in Frage:
      1. Alle Zellen, die von einer Fläche berührt werden. Was ist mit Randpunkten, genügt ein Rand- / Eckpunkt?
      2. Alle Zellen, die vollständig von einer Fläche bedeckt werden.
      3. Alle Zellen, die vorwiegend von einer Fläche bedeckt werden. (Was ist bei genau 50%?)
      4. Alle Zellen, deren Mittelpunkt von einer Fläche bedeckt wird. (Was ist, wenn der Mittelpunkt genau an der Umgrenzung der Fläche liegt?).

Vektor-Raster-KonversionVektor-Raster-Konversion

 

zum Seitenanfang

Bis jetzt haben wir uns bei der Zuordnung von Zellen zu Vektorobjekten ausschließlich an der Objektgeometrie orientiert, das Ergebnis war eine binäre Raster - Repräsentation. Damit sind jegliche Informationen, die sich auf die eindeutige Identität von Objekten bzw. deren Attribute beziehen, verloren, ebenso bei mehreren, eine Zelle berührenden Objekten die Information über deren Anzahl.

Die Raster-Konversion vektorieller Objekte bedarf daher mehrerer, sich z.T. gegenseitig ausschließender Festlegungen, die problemgerecht getroffen werden müssen und in weiterer Folge Bestandteil der Dokumentation des Rasterbestandes sein müssen!

Im Gegensatz zur oben eingesetzten Reduktion der vektoriellen Ausgangsinformation auf binäre Raster-wird man sich in der überwiegenden Zahl der Fälle einer Wert-Differenzierung im Ergebnisraster bedienen, wobei die Zellenwerte unterschiedlicher Herkunft sein können. Sie können sich ergeben aus:

  • Der Identifikation (eindeutigen Kennzahl) der Vektor-Objekte,
  • einem beliebigen Attribut-Wert der Vektor-Objekte, oder
  • der Anzahl der die Zelle betreffenden Vektor-Objekte.
Problembereich „Reversible Konversion“

Falls mehr als nur eine dieser Informationen in der Raster-Repräsentation benötigt wird, liegt die leistungsfähigste Vorgangsweise in der Zuweisung von Objekt-Kennzahlen zu Rasterzellen. Solcherart bleibt sowohl die Identität von Objekten eindeutig erhalten (z.B.: parallel laufende Linien bleiben als solche erhalten), und weiters ist die Bezugnahme auf beliebig viele Objektattribute durch Referenzieren der Attributtabellen jederzeit möglich.

Allerdings ist auch durch diese Vorgangsweise keine vollständige und reversible Abbildung einer Vektor- auf eine Raster-Repräsentation möglich. Je nach gewählter Auflösung wird es immer wieder vorkommen, dass mehrere Objekte einer Rasterzelle zugeordnet werden. Da das Rastermodell in seiner allgemeinen Form Eindeutigkeit des Zellwertes verlangt, kann damit immer nur ein Objekt identifiziert werden, der Bezug auf weitere, innerhalb der Rasterauflösung in derselben Zelle liegende Objekte, geht verloren!

Einige Beispiele - ohne Anspruch auf Vollständigkeit - von potenziellen Problemsituationen und gängigen Ansätzen zu deren Handhabung:

  • Punkte in RasterzelleMehrere Punkte fallen in eine Rasterzelle: es kann entweder eine der Kennzahlen (Priorität siehe unten) oder die Anzahl kodiert werden.
  • Linien kreuzen sich: nur „willkürliche“ Regeln können die Priorität entscheiden, jedenfalls geht die Konnektivität einer der Linien verloren.
    Kreuzende Linien
  • Flächen grenzen in Zellen bei ambivalenten Regeln aneinander (50%-Anteil, Mittelpunkt etc.)

Neben der generell höheren Komplexität von Regeln bei mehr als einer Klasse (nicht-binär) - z.B. auch 40% Flächenanteil an einer Zelle können der höchste Anteil sein, soll zwischen „Konkurrenz“ zwischen Klassen und gegenüber „Hintergrund“ unterschieden werden etc. - stellt sich in diesen Fällen vor allem die Frage nach der Priorität zwischen Klassen. Diese kann auf mehrfache Weise entschieden werden:

  • Höhere Werte haben gegenüber niedrigeren Vorrang.
  • Explizite Prioritätsangabe (etwa in Form einer Lookup-Tabelle).
  • Das jeweils sequentiell nachfolgende Objekt überschreibt Rasterzellen vorhergehender Objekte; oder umgekehrt: bereits belegte Zellen dürfen nicht mehr überschrieben werden.
zum Seitenanfang
   
 

Raster —» Vektor Konversion

Der „umgekehrte“ Fall der Konversion aus Raster- in Vektor-Repräsentation kommt typischerweise in zwei Fällen vor:

  • Umsetzung thematischer Rasterdaten in eine Vektordarstellung.
  • (Teil)automatische Vektorisierung eines gescannten Rasterbildes.

Bezüglich der praktischen Anwendung unterscheiden sich diese beiden Fälle der Raster-Vektor Konversion beträchtlich. Gehen wir kurz einige diese Unterschiede durch:

  • Thematische Raster sind (wenn sie sinnvoll vektorisiert werden können) räumlich diskret und weisen damit klare Abgrenzungen auf. Bildraster müssen in einem zusätzlichen Vorverarbeitungsschritt erst klassifiziert werden (häufig in nur binäre Kategorien), die Parametrisierung dieses Vorganges (z.B. Schwellwertsetzung) beeinflusst das Ergebnis des Endproduktes enorm!
  • Thematische Raster können in der Regel unmittelbar vektorisiert werden, je nach Original und Abtastvorgang sind Bildraster noch von „Rauschen“ (Verschmutzungen, Fehlerpixel) zu befreien, etwa durch Herausfiltern von Einzelpixeln.
  • Thematische Raster beinhalten nur unmittelbare Rauminformation. Bildraster (aus gescannten Vorlagen) können zusätzlich noch Beschriftungen, Signaturen und andere graphische Elemente beinhalten, die entweder vor der Vektorisierung zu entfernen oder jedenfalls gesondert zu behandeln sind (Muster- und Schrifterkennung etc.)
zum Seitenanfang

Vektorisierung von Binärbildern

Voraussetzung für sinnvolles Vektorisieren eines Bildes (digitales Luftbild, gescannte Karte) ist eine adäquate Klassifikation in diskrete Kategorien. Im vorliegenden Kapitel werden wir uns mit dem einfachsten Fall einer Klassifikation in nur zwei (binäre) Kategorien auseinandersetzen.

Dabei ist in Abhängigkeit von der Thematik der Vorlage das Ziel der Vektorisierung - Punkte, Linien oder Flächen (= Polygone) - vorzugeben, andernfalls ist kein sinnvoller Beginn der Vektorisierung möglich. Wenn wir etwa in der nachfolgenden Abbildung nicht wissen, ob es sich um Linien oder Flächen handeln „soll“, könnten zwei verschiedene Vektorisierungen folgendermaßen aussehen:

Mittellinien vs. Umriss-VektorisierungMittellinien vs. Umriss-Vektorisierung

Bereits im Ansatz einer Vektorisierung müssen wir demnach zwischen „Mittellinien-Vektorisierung“ (Punkte und Linien) sowie „Umriss- Vektorisierung“ (Flächen) unterscheiden. In weiterer Folge wollen wir uns an diesen geläufigen Kategorien räumlicher Objekte orientieren:

Punktgenerierung

Der einfachste - weil weitgehend eindeutige - Fall liegt vor, wenn einzelne Punkte an den Mittelpunkten von Pixeln zu generieren sind. Derartige, wirklich einzelne Punkte in Rasterdateien liegen jedoch allenfalls bei Analyseergebnissen, nicht jedoch als Scan-Resultat vor. In diesem - letzteren - Fall sind Punkte als

  • Cluster von Pixeln; oder aber als
  • Punktsignaturen

vorhanden; ggf. auch als Bestandteile übergeordneter Objekte (z.B. punktierte Linien). Während die Reduktion gescannter Punkte (= annähernd „runde“ Pixelhaufen) auf einen Zentralpunkt noch relativ leicht zu lösen ist, ist der Bezugspunkt von Punktsignaturen nicht generell zu identifizieren und fällt zusammen mit der Problematik der Signaturdifferenzierung in den Bereich der Zeichenerkennung (s. u.).

Wie kann nun ein vektorieller Bezugspunkt, möglichst in der „Mitte“ dieser gescannten Punkte festgestellt werden? Eine der möglichen Vorgangsweisen verwendet einen „Schrumpfungs“-Algorithmus, der als Filter mit gleitendem Fenster implementiert werden kann.

Linienvektorisierung

Liegen Rasterlinien als jeweils an einer Kante oder einer Ecke aneinandergrenzende Pixel vor, so ist das Vektorisierungsproblem vergleichsweise gut lösbar. Punkte mit einem Nachbarn im obigen Sinn sind Endpunkte, solche mit zwei Nachbarn Vertices entlang einer Linie und solche mit drei Nachbarn sind Verzweigungsknoten:

LinienvektorisierungLinienvektorisierung

Dass auch bei derart idealisierten Vorgaben und „klarer“ Definition von Nachbarschafts- Beziehungen das Problem der Linienvektorisierung nicht völlig eindeutig zu bearbeiten ist, zeigt der Vergleich der beiden Varianten an dem Verzweigungsknoten in obiger Abbildung. Um wie viel schwieriger muss dann das Finden einer adäquaten Lösung im wesentlich problematischeren Fall gescannter Linien sein, die zumeist mehrere Pixel breit sind!

Um das (größere) Problem „ausgerissener“, also unterbrochener Linien zu vermeiden, nehmen wir eine mehrere Pixel breite gescannte Linie in Kauf, die wir in der Folge möglichst effizient und plausibel auf eine „Mittellinie“ reduzieren müssen. Dazu gibt es grundsätzlich mehrere Lösungsansätze:

  • Berechnen einer gleitenden Trend- bzw. Regressionslinie aus Pixelmittelpunkten.
  • Berechnen einer Mittelachse zwischen Begrenzungslinien der „Linie“.
  • „Schrumpfen“ (Skelettisierung, „shrinking“) durch randliches Reduzieren der „Linienfläche“ bis nur mehr eine nach obiger Vorgabe eindeutige Pixelabfolge zu eigentlichen Vektorisierung übrigbleibt.

Diese letztere Vorgangsweise ist die am häufigsten angewandte, weil sie gut mit anderen Techniken (s.u.) kombiniert werden kann.

Skelettieren einer gescannten Linie

Wie gehen wir jedoch mit unterbrochenen Linien vor, die aus mangelhafter Vorlagenqualität, zu grober Scan-Auflösung oder durch Erfassung von Linien mit strichlierten oder punktierten Signaturelementen stammen können?

Die herkömmliche Vorgangsweise zur Bearbeitung von Lücken ist verwandt mit der obigen und wird als „blow and shrink“ (Erweitern, dann Verdünnen) von Linien bezeichnet. In einem ersten Schritt wird um vorhandene Pixel herum ein „buffer“ mit etwas mehr als der halben zu schließenden maximalen Lückenlänge angelegt, dann eine Skelettierung im oben skizzierten Sinn vorgenommen:

„Blow-and-shrink“ Strategie

Die hier skizzierten Vorgangsweisen und Problemlösungsstrategien entsprechen dem ursprünglichen Ansatz einer Lösung des Vektorisierungsproblems als vollautomatische Implementation. Heute wird für professionelle Produktionssysteme aufbauend auf derartigen Algorithmen eine interaktionszentrierte Vorgangsweise verfolgt, die sich weniger auf globale als lokale (Filter- u.a.) Manipulationen stützt. Damit kann eine lokale Anpassung des Einsatzes unterschiedlicher Strategien und deren Parametrisierung erfolgen.

zum Seitenanfang
Umriss-Vektorisierung (Flächen)

Wie bereits erwähnt, ist die Vorgangsweise bei der Vektorisierung der Konturen von Flächen eine völlig andere: es muss nicht eine explizit vorhandene, meist mehrere Pixel breite „Linienfläche“ auf ein wirklich eindimensionales, lineares Objekt reduziert werden, sondern eine im Raster nur implizit vorhandene Grenzlinie zwischen unterschiedlichen Zellenwerten identifiziert und verfolgt werden.

UmrissvektorisierungDie Lage der Grenzlinie von Flächen an der Diskontinuität zwischen Rasterzellen ist also eindeutig, deren Verlauf und damit die Zusammenfassung von homogenen Flächen ist es nicht in jedem Fall:

Insbesondere entlang langer, schmaler Korridore, wo Pixel nur diagonal aneinander angeordnet sind, ist die Zusammenfassung zu ebensolchen Flächen-Objekten nicht möglich, es muss an diesen Stellen jedes Pixel zu einer eigenen Fläche gemacht werden, da keine eindeutigen Entscheidungen bzgl. Flächenzuordnung möglich sind.

zum Seitenanfang

   
   

Muster-, Zeichen- und Schrifterkennung

Wie bereits als Charakteristikum gescannter kartographischer oder planlicher Vorlagen gegenüber thematischen Rastern als Ausgangsmaterial für Vektorisierung festgehalten, sind erstere häufig mit zusätzlicher textlicher Information bzw. mit zeichenhaften Signaturen versehen.

Zu unterscheiden ist bei der Bearbeitung zwischen der Elimination dieser kartographischen Komponenten als „Störfaktoren“ (z.B. Kreise an Vertices einer Linie), oder aber der „Erkennung“ von Zeichen, Mustern und Schriften, verbunden mit der Extraktion von deren Bedeutung.

Unter Zeichen verstehen wir hier meist punktbezogene Signaturen (die aber auch selbst wieder Bestandteile von Linien- und Flächensignaturen sein können), die ggf. erkannt werden können und dann zweierlei Informationen beinhalten: die Form des Zeichens beinhaltet eine bestimmte thematische Aussage („das ist eine Kirche“, „das ist ein Vermessungspunkt“), die Position des Zeichens bzw. dessen vereinbarten Bezugspunktes („Kreismitte“, „links unten“) die dazugehörige Georeferenz.

Muster sind zumeist flächenbezogene, geometrische oder „sprechende“ (assoziative) Signaturen, die mit einer expliziten (linearen) Umgrenzung versehen sein können oder aber auch randlich offen sind. Diese Muster beinhalten eine thematische Aussage über eine Qualität der damit versehenen Fläche („Feuchtgebiet“, „steiler Hang“, „Flächenwidmung Wohngebiet“ etc.)

Schriftelemente auf Karten und Plänen können sowohl Punkt-, Linien- wie auch Flächenbezug aufweisen. Die Schrifterkennung ist bereits weit fortgeschritten, problematisch ist jedoch die Erkennung gedehnter bzw. gekrümmter Schriftzüge (Linien- und Flächen-/Gebietsbeschriftungen). Der Text ist dann als Attributausprägung dem jeweiligen räumlichen Bezugsobjekt zuzuweisen.

Während wir uns hier nicht mit Details der Muster- und Schrifterkennung auseinandersetzen können, sind doch einige allgemeine Aussagen zu deren Einsatz im Kontext automatisationsgestützter Erfassung von Dokumenten anzumerken:

  • Die automatisierte Identifikation von Zeichen und Mustern ist prinzipiell möglich, bei komplexen Vorlagen jedoch oft problematisch.
  • Die auf Karten häufig „störenden“ Faktoren (wie nicht-freigestellte Linien, je nach Gestaltungsmöglichkeiten wechselnder Bezugspunkt sowie Dehnung/Krümmung) sind noch nicht operationell gelöst.
  • Praktische Anwendungen ohne umfassende Vorbereitungsarbeiten oder intensive interaktive Begleitung sind derzeit nicht abzusehen.
zum Seitenanfang
   
   

Voll- vs. halbautomatische Vektorisierung

Mit diesem letzten Punkt haben wir auch die Brücke geschlagen zur bereits angesprochenen Alternative vollautomatischer Vektor - Konversion und der sog. „halbautomatischen“ Vektorisierung. Während ein Trend hin zu letzterer auf den ersten Blick als Rückschritt erscheinen mag, ist dem eigentlich nicht so. Vor allem bei heterogenen, manuell produzierten Ausgangsdokumenten muss bei vollautomatischer Vektorisierung in der Regel ein vergleichsweise hoher Nachbearbeitungsaufwand in Kauf genommen werden.

Die herkömmliche Abfolge vollautomatischer Erfassung

  • Dokumentenvorbereitung und Einscannen
  • Automatisierte Vektorisierung
  • Nachbearbeitung
  • Datenbasisintegration

steht also einer Integration der Funktionalitäten

  • Linienverfolgung
  • Kontur- (Umriss-) Verfolgung
  • Zeichenerkennung
  • Texterkennung etc.

in erweiterte Editierfunktionalitäten von GIS-Softwareprodukten gegenüber. Ein Beispiel dafür ist die ArcScan-Extension für ArcGIS, die Sie in der folgenden Übung kennen lernen können.

   
Aufgabe

Übung: Raster-Snapping mit ArcScan

   
   

Derartige Werkzeuge lassen zwar meist auch eine vollautomatische Vektorisierung dazu geeigneter Dokumente zu, jedoch wird der volle Bereich der Bildschirmdigitalisierung über die unterstützte Verfolgung einzelner Linien bis hin zur vollständigen Rasterbereinigung (speckle-Filter) und Vektorisierung unterstützt.

Die Vorteile halbautomatischer Techniken liegen zwar auch in einer Beschleunigung des Arbeitsablaufes (im Vergleich zur komplett manuellen Digitalisierung gescannter Vorlagen), vor allem aber in der qualitativen Verbesserung von Endprodukt und Arbeitsumständen:

  • Linien werden in konsistenter Qualität verfolgt.
  • Genauigkeit / Auflösung (Punktedichte) liegen in nachvollziehbarer und dokumentierbarer Qualität vor.
  • Insbesondere die „ermüdenden“ Komponenten des Erfassungsvorganges werden automatisiert.
  • Konsistenzbedingungen und Konnektivität werden direkt gewährleistet.
  • Interaktive Abstimmung auf Eigenheiten des vorliegenden Dokuments ist bei sofortiger Rückkopplung möglich.
  • Die Kontrolle und Überarbeitung von „Problembereichen“ ist sofort möglich.
  • Im Vergleich zur vollständig automatisierten Vektorisierung ist im halbautomatischen Fall die Zusammenfassung mehrerer Vorgänge in einen einzigen, interaktiv kontrollierten und gestalteten Konversions-Schritt gegeben und auch meist auf Grund der erhöhten Flexibilität und Konsistenz vorteilhaft.

   
Aufgabe

Aufgabe: Raster-Vektor Konversion

   
zum Seitenanfang
Zum SeitenanfangNach oben
Druckansicht Seite drucken
Download  Materialien-Download
EMail Uprof-Team
Service