Traffic-Klassifizierung mittels Maschinellem Lernen
Um unser Modul Application Control zukunftsfit zu machen, arbeiten wir derzeit mit einem Team des Instituts für Web Technologies & Applications der Fachhochschule Kufstein zusammen. Im Rahmen eines vom Land geförderten Projekts soll via Maschinellem Lernen (ML) eine Klassifikation von Datenverkehr vorgenommen werden.
Ausgangslage
Die Application Control als Deep Packet Inspection (DPI) ermöglicht sowohl den Datenverkehr einzusehen (Monitoring) als auch zu filtern. Man kann dafür sorgen, dass bestimmte Anwendungen bzw. Protokolle ganz, mit begrenztem Durchsatz oder gar nicht passieren dürfen. So wird dieses IACBOX-Modul zum wertvollen Tool für den WLAN-Betreiber: Er kann zum Beispiel seinen Gästen, Mitarbeitern oder Besuchern ermöglichen, E-Mails zu checken, nicht aber Filme oder Serien zu streamen. Das kann angebracht sein wenn es darum geht, verfügbare Bandbreite effizient zu nutzen, oder wenn es Benutzergruppen mit speziellen Anforderungen gibt. Denn es macht nicht immer Sinn, ein Kind und einen Erwachsenen oder einen Billig-Bucher und einen Luxus-Gast gleich zu behandeln.
Deep Packet Inspection funktioniert grundsätzlich, wenn man entweder die Daten einer Verbindung einsehen kann oder wenn der Verbindungsaufbau eindeutig ist. Hier wird nun deutlich, was uns in erster Linie dazu motiviert hat, uns mit einem solchen Projekt zu befassen. Denn eine eigentlich zu begrüßende Entwicklung in der Datenübertragung stellt mittlerweile das größte Hindernis für DPI und damit unserer Application Control dar – die zunehmend verschlüsselten Verbindungen.
Was für den Datenschutz und die allgemeine Sicherheit im Netz einen eindeutigen Gewinn darstellt, wird für einen Netzbetreiber auch dann zum Hindernis, wenn er durchaus legitime Gründe für die Anwendung einer DPI hat. Durch gezielte Beschränkung kann die Qualität des Netzes hochgehalten, durch Differenzierung des WLAN-Angebots zu unterschiedlichen Preisen die Finanzierung sichergestellt, und auch der Schutz – etwa von Kindern oder Schülern – vor unerwünschten oder illegalen Inhalten gewährleistet werden.
Die Application Control erkennt verschlüsselte Verbindungen nur teilweise und versieht sie mit dem Prädikat „unbekannt“ – sie können somit weder geblockt, noch in der Bandbreite beschränkt werden. Verschlüsselte Verbindungen (hauptsächlich HTTPS) werden in Zukunft zunehmen, und so braucht die Application Control Unterstützung.
Wie sieht diese Unterstützung aus?
Eine neue Technik zur Klassifizierung von Datenpaketen ist gefragt. Hier kommt das Team der FH Kufstein Tirol ins Spiel. Das Projektteam des Instituts für Web Technologies & Applications unter der Leitung von Lektor Lukas Huber, MSc, werden noch bis Februar 2020 mit Hilfe von Maschinellem Lernen ein mögliches Verfahren erarbeiten. Ziel der ersten Projektphase ist es, WhatsApp- von Facebook-Verbindungen zu unterscheiden. Dabei werden Metadaten der Verbindung wie Paketgröße, Paketanzahl oder Paket-Timing herausgefiltert und das Modell damit trainiert. Es handelt sich um einen selbstlernenden Algorithmus, bei dem man Daten zuführt und das Ziel nennt.
Selbstlernende Algorithmen (Machine Learning): … Man füttert die Maschine mit Daten und einem Ziel und gibt ihr Rückmeldung, wenn sie auf der richtigen Spur ist – und überlässt es dann ihr, den besten Weg zu diesem Ziel selbst zu finden.
Hanna Frey, Hello World
Apropos Künstliche Intelligenz: Es ist über 20 Jahre her, dass IBM‘s Schachcomputer Deep Blue den amtierenden Weltmeister Garri Kasparow schlug. Damals war diese Meldung für tagelange Schlagzeilen quer durch die Mainstream-Medienlandschaft gut. Heute ist es eine zwar immer noch interessante, aber hauptsächlich unter tech-affinem Publikum beachtete Meldung in fachlichen Rubriken, wenn eine KI wie ALphaZero von Google innerhalb von vier Stunden ohne Vorkenntnisse zum Großmeister wird und das derzeit beste Schachprogramm Stockfish in 100 aufeinanderfolgenden Spielen besiegt oder ein Patt erreicht.
Doch Schach ist nur ein Trainingsfeld: KI wird alltagstauglich und kommt bereits in zahlreichen umrissenen Teilgebieten zum Einsatz. Projekte wie unseres zeigen deutlich, wie Methoden und Techniken der künstlichen Intelligenz in immer mehr Technologien unseres täglichen Lebens Einzug halten.
Die erste Phase des IACBOX ML-Projekts dient ausschließlich der Grundlagenforschung, bei der ausgelotet wird, welche Metadaten sich für das Training eignen. Im nächsten Schritt wird das Modell dann für die Praxis weiterentwickelt, bis wir es in unser Produkt einfließen lassen können. Maschinelles Lernen wird künftig bei der Klassifizierung von Datenverkehr eine wichtige Rolle spielen, und dieses Forschungsprojekt mit der Fachhochschule Kufstein wird die IACBOX diesem Ziel einen Schritt näherbringen.
Sie sind UnternehmerIn und suchen eine Lösung für diese Anforderungen? Oder sind Sie DienstleisterIn und beraten Unternehmen bei kabellosen oder kabelgebundenen Netzwerklösungen?
Starten wir gemeinsam ein Projekt