SemEO

Semantic enrichment of optical EO data to enhance spatio-temporal querying capabilities

Programm / Ausschreibung IKT der Zukunft, IKT der Zukunft, IKT der Zukunft - 4. Ausschreibung (2015) Status abgeschlossen
Projektstart 01.10.2016 Projektende 31.10.2017
Zeitraum 2016 - 2017 Projektlaufzeit 12 Monate
Keywords 1_Weltraummissionen

Projektbeschreibung

Bezugnehmend auf das "Prioritäre Anwendungsfeld IKT für Weltraummissionen" ist das übergeordnete Ziel von SemEO die Erforschung notwendiger konzeptioneller Strategien und des technischen Rahmens um die automatische semantische Anreicherung von optischen Fernerkundungsdaten ("Big Earth Data") und deren Handling bzw. die Datenabfrage zu verbessern. Wir zielen darauf ab, menschlichen NutzerInnen die Abfrage von Fernerkundungsdaten auf einem höheren semantischen Level als bisher zu ermöglichen (d.h. basierend auf zumindest einfachen Landbedeckungseinheiten unter Verwendung von speziellen Ontologien). Um dieses Ziel zu erreichen werden: (1) Fernerkundungsdaten semantisch angereichert bis zur Landbedeckungsklassen die idealerweise den FAO LCCS Phase 1 Klassen entsprechen. Dabei werden voll automatische Vorklassifikationen mit Objektableitungen und Textur-Analysen in einem convergence of evidence) Ansatz kombiniert; (2) raum-zeitliche Modellierungsansätze und Abfragetechniken in semantisch angereicherten Fernerkundungs-(Bild)-Datenbanken auf der Basis von speziellen Ontologien untersucht, um die Komplexität der Abfragen für die menschlichen NutzerInnen-Interaktion zu reduzieren; (3) spezielle Datenbanktypen ("array databases") einem Review unterzogen und deren Verwendbarkeit und Skalierbarkeit unter Verwendung von speziellen Datenmodellen ("data cubes") als mögliche Lösung für hoch performante raum-zeitliche Abfragen in großen Datenbanken überprüft. Die Verschiebung von zielgerichteter, thematisch begrenzter und deswegen oft redundanter Prozessierung hin zu einer generischen semantischen Anreicherung von Fernerkundungsdaten am ground segment bzw. in den Bilddatenbanken ist ein komplett neuer und innovativer Ansatz Big Earth Data intelligenter zu handhaben. Bis heute gibt es keine operationellen SCBIR Systeme für Fernerkundungsdaten, die auf einer vollautomatischen semantischen Anreicherung bis zu (menschlich verständlichen) Landbedeckungsklassen aufbauen. Erst die automatische semantische Anreicherung auf diesem Niveau kann komplexe und kontextsensitive Abfragen und Auswertungen von Zeitreihen für Big Data Anwendungen performant unterstützen. Aktuelle Fernerkundungs-Bildabfragen basieren auf einfachen Textmetadaten (Aufnahmezeitpunkt, geographische Ausdehnung) ohne jede Möglichkeit semantische-inhaltliche Abfragen oder raum-zeitliche Bildanalysen durchzuführen (z.B. eine Wolkenbedeckungskarte, Veränderungsanalyse o.ä.). Der Big Data Vorgabe folgende, "nur die geeigneten Daten zum Nutzer zu bringen", versucht SemEO die angedeuteten Forschungslücken zu adressieren und Österreichs Kompetenzen in diesem Bereich stärken. Dabei würden alle Anwendungsdomänen im Fernerkundungsbereich von einer solchen generischen automatischen Vorprozessierung/semantischen Anreicherung auf einem einfachen Landbedeckungslevel und der gezielten semantisch-inhaltlichen Bildabfrage durch die Zeit profitieren. Auf einem technischen Level wird SemEO die Expertise in automatisierter Bildprozessierung mit einem starken Fokus auf dem Bedarf resultierend durch die Copernicus Sentinel-Missionen (hier: vor allem Sentinel-2) stark erweitern.

Abstract

In response to the call topic "application field IKT for space missions as a priority" with the sub-topics "semantic enrichment of data for human user interaction", "large data coverage and handling" as well as "algorithm optimization" the overall goal of SemEO (Semantic enrichment of optical EO data to enhance spatio-temporal querying capabilities) is to investigate conceptual strategies and technical framework conditions to enhance the automatic semantic enrichment of optical EO (Earth Observation) data ("Big Earth Data") and the improved data handling /data querying. We aim to reach a status allowing human users the querying of EO data on a higher semantic level (i.e. based on at least basic land cover units and encoded ontologies), by (1) semantically enrich optical EO data to a level of basic land cover (ideally FAO LCCS phase 1) classes combining fully automatic pre-classification with object delineation and texture extraction based on a convergence of evidence approach; (2) investigate spatio-temporal modelling and querying techniques in semantically enriched EO databases using encoded ontologies ("world model") to decrease the complexity of queries for human user interaction and (3) review and test the usability and scalability of array databases and specific implemented data models (data cubes) as a solution for the implementation of spatio-temporal queries with high performance in big databases. Moving from only target oriented and therefore often redundant processing algorithms to a generic semantic enrichment at the ground segments /image databases is a novel and highly innovative approach to handle big Earth data more intelligently. To date, there exist no operational Semantic Content-Based Image Retrieval (SCBIR) systems for EO-data, based on a fully automated semantic enrichment of satellite imagery up to (human understandable) basic land cover classes, which facilitates complex and context-sensitive queries and exploitation of long time series of remotely sensed data with an acceptable performance for big data applications. The current state-of-the-art in EO image retrieval is based on simple metadata text information (acquisition time, target geographic area) without any semantic content-based querying of images or spatio-temporal image-content extraction to generate either quantitative or qualitative information products, e.g., cloud cover map. Following the premise "bringing the right data to the user", SemEO will address this important research gap in the EO domain and increases Austrian competence in the field. All EO-application domains would profit from the automatic pre-processing /semantic enhancement matching a basic land cover level and the targeted image selection through time. On a technical level, SemEO will greatly increase expertise in automated image processing with the clear focus on the demands growing from the expected large amounts of available Sentinel 2 optical data. It will leverage the capabilities of Z_GIS for larger projects in the upcoming SPACE calls of Horizon 2020 (2016/”Big data”) to be prepared for the massive Sentinel 2/3 data to be exploited more intelligently and respective ESA tenders. This also relates to community building and networking, on (1) national level and (2) European level. On the Austrian level, SemEO is fully in line with strategic documents in the context of (1) conquering data and (2) the guiding principles for big data handling in Austria.