6. Klassifizierung

Unüberwachte Klassifikation

"Die unüberwachte Klassifikation nutzt ausschließlich die statistische Verteilung der Pixel innerhalb der Merkmalsräume zur Unterscheidung von Klassen."

Was ist ein Merkmalsraum?

Ein Merkmalsraum und seine Dimensionen werden durch die Anzahl der aufgenommenen Kanäle (Spektralbereiche) definiert. Der Satellit LANDSAT 7 hat z. B. sechs Kanäle und damit hat jeder von diesem Satelliten aufgenommene Pixel (Bildpunkt) sechs Grauwerte. Die Pixel haben somit einen Merkmalsvektor im Merkmalsraum mit sechs Dimensionen. Darstellbar sind jedoch maximal drei Dimensionen, meist werden zwei Kanäle oder Spektralbereich in einer Graphik dargestellt (siehe unten). Jedes Pixel hat durch seinen Merkmalsvektor (seine Attributwerte) einen eindeutigen Platz in diesem "Raum".

Zoom Sign
Merkmalsraum
Merkmalsraum der Kanäle 3 und 4 einer LANDSAT-Szene.


Anhäufungen von Pixeln, sogenannte Cluster, innerhalb des Merkmalsraumes stehen für bestimmte Klassen. Je näher zwei Pixel im Merkmalsraum beieinander liegen, umso ähnlicher sind sie einander und mit umso größerer Wahrscheinlichkeit werden sie derselben Klasse angehören.

Für die Klassifikation bzw. Gruppierung der Pixel bieten sich grundsätzlich zwei Vorgehensweisen an:

  • Vom einzelnen Pixel aus werden schrittweise die jeweils ähnlichsten Pixel zusammengefasst, damit am Ende alle Pixel in einzelnen Klassen zusammengefasst werden.
  • Von der Gesamtmenge aus wird diese an Stellen größter Unähnlichkeit geteilt, bis man bei der gewünschten Anzahl an Klassen angelangt ist. Dieses Verfahren wird auch Clusterung (Clustering) genannt.

Ein guter bzw. zuverlässiger Klassifikator erkennt signifikante Unterschiede in den Merkmalsvektoren, welche dann den jeweiligen Klassen zugeordnet werden können. Dabei werden diese Unterschiede und Gemeinsamkeiten meist in mehr als den drei (darstellbaren) Dimensionen erfasst.

Häufig wird die unüberwachte Klassifizierung zur Vorbereitung, als erster Schritt hin zu einer überwachten Klassifizierung eingesetzt. Hier kann überprüft werden, ob die Daten sich überhaupt in die gewünschte Anzahl an Klassen unterteilen lassen oder ob weit mehr Klassen bestehen.