Zum Inhalt

AlTrOPiC

AI-based Anomaly Diagnosis and Traffic Prediction for Service Orchestration and Placement in Clouds

Programm / Ausschreibung IKT der Zukunft, IKT der Zukunft, IKT der Zukunft 2. China Ausschreibung 2020 Status abgeschlossen
Projektstart 01.01.2021 Projektende 31.12.2023
Zeitraum 2021 - 2023 Projektlaufzeit 36 Monate
Keywords AI; Cloud; Management; Diagnosis; Training;

Projektbeschreibung

Die Netzwerkfunktions-Virtualisierung (NFV) zusammen mit dem Software-
definierten Netzwerk (SDN) verspricht flexiblere und effizientere Methoden der
Dienstbereitstellung für die Cloud. In dieser Entwicklung wird das Cloud-
Management die wahre Herausforderung sein. Die Cloud wird sich mehr auf
intelligentes Management stützen, was wiederum das Innovationstempo
beschleunigen und die Kosten senken wird (z.B. Einsparungen bei den
Investitionsausgaben (CaPex) und den Betriebsausgaben (OpEx)). Technologien der
künstlichen Intelligenz (KI) werden als nützliche Werkzeuge und potenzielle
Lösungen angesehen, um Netzwerke selbstbewusst und selbstverwaltet zu machen,
indem Intelligenz in die Cloud-Netze integriert wird. Insbesondere ermöglicht die
künstliche Intelligenz es Netzwerken, aus Erfahrungen zu lernen, um sie robuster
gegenüber Schwachstellen und Ausfällen zu machen und ihre Leistung zu
verbessern, indem sie das Netzwerkmanagement und den Betrieb unabhängig von
menschlicher Beteiligung machen.
In diesem Projekt konzentrieren wir uns auf den Einsatz von KI-basierten Methoden,
um die automatisierte Bereitstellung von Diensten und Verarbeitungsressourcen im
Netzwerk entsprechend der Nutzung der beteiligten Ressourcen zu ermöglichen. Die
Ziele und Innovationen dieses Projekts sind vierfacher Art. Erstens untersuchen wir
automatische Methoden zur Erkennung von Abhängigkeiten und Konflikten zwischen
NFs und Switches, um Dienste zusammenzustellen und zu verifizieren, bevor sie auf
der physischen Infrastruktur durchgesetzt werden. Zweitens schlagen wir ein LSTM-
basiertes VM-Stromverbrauchsmodell und den VM-Dynamikplatzierungsalgorithmus
vor, die in der Lage sind, in verschiedenen Anwendungsszenarien eine hohe
Genauigkeit beizubehalten. Außerdem schlagen wir eine logmustergesteuerte
Anomalie-Diagnosemethode vor und verwenden LSTM-Modelle, um jede einzelne
Komponente zu trainieren und die zeitliche Korrelation von Logmustern zu erlernen.
Wir entwerfen auch einen Mechanismus, der unser Diagnosemodell online
aktualisieren kann, ohne die Leistung zu beeinträchtigen. Letztendlich wird ein
neuronales Netzmodell zur Modellierung von Diensten mit unterschiedlichen
Verkehrsmustern verwendet, was sich zur Erfassung der Langstreckenabhängigkeit
als nützlich erweist, um die Vorhersagegenauigkeit zu verbessern.
Wir planen die Implementierung der Prototypen und die Präsentation von
Konferenz-/Journalpapieren für jedes technische Arbeitspaket. Alle
Forschungsarbeiten und Prototypen werden in unseren realistischen Wolken-
Testbeds ausgewertet. Die Ergebnisse dieses Projekts werden zu besser
bereitgestellten Diensten in Wolkennetzen führen, die wiederum ein wichtiger
Baustein für künftige Anwendungen in vielen Bereichen sind.

Abstract

Network function Virtualization (NFV) together with Software-defined Networking (SDN) promises to provide more flexible and efficient service provision methods for the cloud. In this evolution, cloud management will be the true challenge. The cloud will rely more on intelligent management, which will, in turn, accelerate the pace of innovation and will reduce costs (e.g., capital expenditure (CaPex) and operational expenditure (OpEx) savings). Artificial Intelligence (AI) technologies are regarded as useful tools and potential solutions to make networks self-aware and self-managed by incorporating intelligence in the Cloud networks. Particularly, AI allows networks to learn from experience to make them more robust against vulnerabilities and failures and improve performance by making network management and operation independent of human involvement.
In this project, we focus on using AI-based methods to enable automated provisioning of services and processing resources in the network, according to the usage of the resources involved. The goals and innovations of this project are fourfold. Firstly, we study automatic methods to detect the dependencies and conflicts between NFs and switches, so as to compose and verify services before they are enforced on the physical infrastructure. Secondly, we propose a LSTM-based VM power consumption model and the VM dynamic placement algorithm, which are able to maintain high accuracy in different application scenarios. Plus, we propose a log pattern-driven anomaly diagnosis method and use LSTM models to train each individual component to learn the time correlation of log patterns. We also design a mechanism that can update our diagnosis model online without impacting the performance. In the end, a neural network model is used to model services with different traffic patterns, which is useful for capturing the long range dependency so as to improve the prediction accuracy.
We plan to implement the prototypes and present conference/journal papers for each technical work package. All research and prototypes will be evaluated in our realistic cloud testbeds. The results of this project will lead to better provisioned services in cloud networks, which in turn are an important building block in future applications for many domains.