CIO Kurator 

Umfassende Cybersecurity durch Künstliche Intelligenz und maschinelles Lernen

Laut Gartner werden die weltweiten Ausgaben für Security im Jahr 2018 auf insgesamt 96,3 Milliarden US-Dollar steigen – dies bedeutet einen Anstieg von acht Prozent gegenüber 2017. Ein gesteigertes Bewusstsein für Risiken, Security-Vorschriften und Entwicklungen in der digitalen Unternehmensstrategie sorgen dafür, dass Unternehmen künftig mehr für Security investieren. Cyberattacken wie WannaCry, NotPetya und der erst kürzliche Equifax Breach haben dabei einen direkten Einfluss auf die Security-Ausgaben.

Die meisten Unternehmen verfügen also heute bereits über Cybersecurity-Systeme – insbesondere Fortune 500-Unternehmen und Regierungen haben hoch entwickelte, fortgeschrittene Systeme installiert. Das Problem und die Schwierigkeit ist jedoch, dass viele von ihnen noch keine ausreichende Cybersecurity-Strategie entwickelt haben und mit den Fortschritten der Hacker und Cyber-Kriminellen nicht Schritt halten können. Man sollte immer und jederzeit auf der Hut sein: Die wichtigste Komponente in der Cybersecurity zeichnet sich durch vorausschauendes Handeln aus.

Angesichts der allzeit präsenten Bedrohung durch Cyber-Angriffe reicht es nicht mehr aus, lediglich traditionelle Sicherheitssysteme wie SIEM, Netzwerk- und Endpoint Security-Tools oder Präventionssysteme zu nutzen. Diese Legacy-Lösungen basieren auf schon bekannten und bereits identifizierten Angriffen. Die aktuellen Security-Tools sind zwar nahezu perfekt, was das Identifizieren und Verhindern von bereits bekannten Angriffen betrifft, aber den Anforderungen fortschrittlicher Cybersecurity entsprechen sie leider nicht ganz:

Vor neuen, unbekannten Angriffen, Zero-Day-Attacken und Low- und Slow-Attacken bieten diese Lösungen keinen Schutz. Deshalb ist ein flexiblerer Mechanismus erforderlich, der Datensätze auf ganzheitliche Weise untersucht und ansonsten unbekannte Bedrohungen aufdeckt. Mithilfe von modernen Big-Data-Analysen – auf der Basis von maschinellem Lernen, Data Science und Künstlicher Intelligenz –  wird dies möglich. Machine Learning, das auf adaptive Baseline-Verhaltensmodelle zurückgreifen kann, ist bei der Erkennung neuer, unbekannter Angriffe äußerst effektiv: Die Verbindung aus bereits bekannten und unbekannten Datensätzen auf der Basis von Predictive Analytics und Machine Intelligence wird die Security-Landschaft entscheidend verändern.

Vor neuen, unbekannten Angriffen bieten herkömmliche Cybersecurity-Lösungen keinen Schutz.

Mit Cybersecurity Data Lakes die Möglichkeiten von Maschinenlernen voll nutzen

Um die Möglichkeiten von Machine Learning und Data Science zu nutzen, ist die Schaffung eines “Cybersecurity Data Lakes” erforderlich. Dieser erweitert die bestehende Lösung um eine generelle Sicherheitsanalyse sowie zusätzliche Datensätze und erkennt Anomalien im System.

Karan Sachdeva, Sales Leader Big Data Analytics APAC bei IBM schreibt dazu in einem Blogpost:

“Building machine learning and AI models requires lot of data which currently no system would be capturing in organization. The cyber security data lake will facilitate tasks ranging from profile persistence, log ingestion and IoT data captures. The next advance layer enabled by Apache Spark will support building machine learning models, develop algorithm for Forensics and Pattern Detection, provide discovery analytics, and automate alerting.

With these advance cyber security data lakes, enterprises can move away from a break/fix reactive mode to proactive models built from larger data sets for countering unknown attacks.”

Erkennung von Cyber-Bedrohungen durch Apache Spark

Ein weiteres Problem traditioneller Tools wie SIEMs ist neben der fehlenden Skalierbarkeit die Offenheit der Systeme: Diese Tools wurden nicht dafür programmiert, dass andere Produkte oder fortschrittliche Machine Learning-Modelle ihre gesammelten Daten auch wiederverwerten können.

Abhilfe schafft ein Open-Source-Programm: Mit diesem können die traditionellen, und zumeist teuren Cybersecurity-Analyse-Stacks aufgeschlüsselt werden. Die Daten-Beschränkung wird somit aufgehoben und neue, komplexe Angriffe können rechtzeitig erkannt werden. Apache Spark bietet hierfür einen starken Rahmen: Damit lässt sich Machine Learning von Grund auf neu erstellen oder es können bestehende Modelle von Github genutzt werden. Zudem verfügt Apache Spark über eine starke Bibliothek wie beispielsweise GraphX. GraphX ​​ erstellt Muster, durch die Anomalien erkannt werden. Auf Basis detaillierter Analysen können unbekannte Cyberbedrohungen rechtzeitig identifiziert und schließlich eliminiert werden.

Dieser Beitrag ist zuerst auf IBM Big Data Hub erschienen. Weitere Informationen zu Cybersecurity von IBM finden Sie hier.