Themen für Abschlussarbeiten

Thema 1: Low Shot / Zero Shot Classification Techniques

Low Shot / Zero Shot Classification Techniques (flexible und ressourceneffiziente Modelle) (Klassifizierung von Samples mit wenigen oder keinen Datenbeispielen)

Qualitativ hochwertige Daten bilden die Grundlage für effiziente Machine Learning Algorithmen. Jedoch stehen solche Daten nicht immer in der benötigten Menge zur Verfügung. Zudem kann die Beschaffung der entsprechenden Datenbestände ein sehr zeit- und ressourceneffizienter Prozess sein. Um dennoch flexible und ressourceneffiziente Machine Learning-Modelle zu entwickeln, existieren Lernverfahren, die es ermöglichen, mit nur wenigen Datenbeispielen (z.B. Bilder, Videos, Textbausteine) vielversprechende Ergebnisse zu erzielen. Solche Lernverfahren werden auch als Low-Shot Verfahren bezeichnet und zeichnen sich durch einen datensparenden Trainingsprozess aus.

Im Rahmen einer Masterarbeit soll untersucht werden, inwieweit Low-Shot-Lernverfahren (Few-Shot, Zero-Shot und/ oder In-Context-Learning) für Klassifikationsaufgaben in sicherheitsrelevanten Kontexten genutzt werden können. Dazu soll der aktuelle Stand der Forschung in diesem Bereich untersucht und beschrieben, sowie verschiedene Low-Shot Klassifikationstechniken gegenübergestellt und ein Prototyp entwickelt werden, der als Demonstrator für Klassifikationsaufgaben genutzt werden kann.

Grundlage des angewandten Teils der Masterarbeit ist ein Datensatz, welcher Bilddaten unterschiedlicher Klassen militärischer Fahrzeuge umfasst und für eine exemplarische Implementierung der erarbeiteten Verfahren genutzt werden kann.

Thema 2: Explainable AI im Kontext von Image Classification

Explainable AI im Kontext von Image Classification

Verfahren der Künstlichen Intelligenz, insbesondere des Deep Learning, unterlaufen stetigen Entwicklungen und führen zu immer komplexeren Architekturen und Lernverfahren. In sicherheitskritischen Bereichen steht jedoch vermehrt die Nachvollziehbarkeit KI-basierter Verfahren im Fokus, die einen erheblichen Einfluss auf nachgelagerte Entscheidungsprozesse haben kann. Um die Ausgaben komplexer Deep Learning Verfahren transparenter und nachvollziehbarer gestalten zu können, existieren Verfahren der Erklärbarkeit und Interpretierbarkeit, die die zugrundeliegenden Entscheidungsmuster eines Algorithmus untersuchen und relevante Klassifikationsmerkmale sichtbar machen.

Im Rahmen einer Masterarbeit sollen verschiedene Methoden der Explainable AI (XAI) identifiziert, untersucht und im Hinblick auf ihre Relevanz im Sicherheitssektor miteinander verglichen werden. Die resultierenden Ergebnisse sollen anschließend in einen funktionsfähigen Prototyp überführt werden, der als Erklärbarkeitskomponente in einen Klassifikationsprozess integriert werden kann.

Grundlage des angewandten Teils der Masterarbeit ist ein Datensatz, welcher Bilddaten unterschiedlicher Klassen militärischer Fahrzeuge umfasst und für eine exemplarische Implementierung der erarbeiteten Verfahren genutzt werden kann.

Thema 3: Label efficient approaches for classification tasks

Label efficient approaches for classification tasks (z.B. Semi-Supervised Learning vs Self-Supervised Learning)

Eine hohe Datenverfügbarkeit spielt bei der Entwicklung von Machine Learning Modellen eine entscheidende Rolle. Je besser diese Daten beschrieben und aufbereitet sind, desto wahrscheinlicher ist es, effiziente und akkurate Modelle zu erhalten. Insbesondere das Labeling von Daten, also die Zuordnung von Daten zu einer Klasse, ist ein zeit- und ressourcenintensiver Prozess, der insbesondere in überwachten Lernumgebungen zum Einsatz kommt. Um solche Lernverfahren zu optimieren, existieren label-effiziente Methoden, die den Labeling-Prozess minimieren und dennoch die Entwicklung von Machine Learning Modellen mit hoher Genauigkeit ermöglichen. Beispiele für diese label-effizienten Verfahren sind Semi-Supervised Learning (z.B. Pseudo-Labeling) oder das Self-Supervised Learning (z.B. SimCLR).

Im Rahmen einer Masterarbeit soll untersucht werden, inwieweit sich solche label-effizienten Lernverfahren zur Anwendung auf ein spezifisches Image Classification Problem eignen. Dazu sollen SOTA-Technologien identifiziert, verglichen und in einen funktionsfähigen Prototypen für die Bildklassifikation überführt werden.

Grundlage des angewandten Teils der Masterarbeit ist ein Datensatz, welcher Bilddaten unterschiedlicher Klassen militärischer Fahrzeuge umfasst und für eine exemplarische Implementierung der erarbeiteten Verfahren genutzt werden kann.

Thema 4: GenAI Ansätze für die generative Erzeugung von Bildmaterial

GenAI Ansätze für die generative Erzeugung von Bildmaterial

Generative Artificial Intelligence (GenAI) umfasst eine Menge an generativen Techniken, die für die Erzeugung von Daten (z.B. Text, Bild, Video) genutzt werden können. Prominente Vertreter von GenAI sind ChatGPT (Large Language Models) und Stable Diffusion (Bilderzeugung).

Im Kontext von Computer Vision Tasks (z.B. Klassifikation, Objekterkennung) steht oft die Verfügbarkeit von umfangreichem Bildmaterial im Fokus. Dabei existieren jedoch Szenarien, in denen dieses Material nicht in dem notwendigen Umfang zur Verfügung steht (z.B. aufgrund schwer zugänglichen Terrains). Mittels generativer Technologien ist es möglich reale Daten, um synthetisch generierte Daten zu erweitern, die den Umfang und die Variabilität eines Datensatzes erhöhen sollen, um Klassifikations- und Detektionsalgorithmen trainieren zu können.

Im Rahmen einer Masterarbeit sollen generative Ansätze zur Bilderzeugung untersucht werden. Ziel ist es, anhand eines praxisnahen Anwendungsszenarios, GenAI-Techniken zu identifizieren und anzuwenden, die zur Optimierung von Computer Vision Aufgaben, insbesondere in Umgebungen mit geringer Datenverfügbarkeit, genutzt werden können.

Grundlage des angewandten Teils der Masterarbeit ist ein Datensatz, welcher Bilddaten unterschiedlicher Klassen militärischer Fahrzeuge umfasst und für eine exemplarische Implementierung der erarbeiteten Verfahren genutzt werden kann.

Thema 5: Open Source AI Landscape – Nutzbarkeit von Daten und Modellen im Sicherheitskontext

Open Source AI Landscape – Nutzbarkeit von Daten und Modellen im Sicherheitskontext

Im Kontext des maschinellen Lernens spielt die freie Verfügbarkeit von Datensätzen und Modellen eine entscheidende Rolle für die Inbetriebnahme und Verbreitung KI-basierter Funktionalitäten. Vor dem Hintergrund dieser Verfügbarkeitsproblematik bilden sich stetig neue Open Source Initiativen im Bereich der Künstlichen Intelligenz, Im Sinne von Netzwerken oder Plattformen (z.B. Hugging Face oder LAION), heraus, die sich zur Aufgabe machen Datensätze, Quellcode und Parameter zur Verwendung und Modifikation bereitzustellen.

Ziel der Masterarbeit soll es sein, bestehende Open Source Initiativen im Bereich der Künstlichen Intelligenz zu identifizieren und diese in eine eigens entwickelte „Open Source AI Landscape“ einzuordnen. Eine solche Landscape soll der inhaltlichen Klassifikation und Charakterisierung frei verfügbarer KI-Module dienen. Zudem soll ein Verfahren entwickelt werden, mit dessen Hilfe Open Source Daten sowie Open Source Modelle und zugehörige Frameworks (aufgeschlüsselt nach Modalitäten, Lizenzbedingungen etc.) zusammengeführt und möglichen Anwendungsfällen aus dem Cybersicherheitskontext zugeordnet werden können. So soll ein Leitfaden bereitgestellt werden, der die Identifikation und Kombination von Open Source Modulen für KI-basierte Entwicklungen vereinfacht und die mit der Entwicklung von ML-Lösungen verbundenen Datenkuratierungs- und Modellentwicklungszeiten verkürzt.

Ein Ergebnis der Arbeit könnte die Zurverfügungstellung einer digitalen „Open Source AI Landscape“ sein, die es durch interaktive Module (z.B. Stichwortsuche, Filter etc.) ermöglicht, frei verfügbare Datensätze und KI-Module für einen definierten Anwendungsfall bzw. spezifizierte Rahmenbedingungen zu identifizieren.

Thema 6: Embodied AI – State-of-the-Art und Entwicklungspotenziale

Embodied AI – State-of-the-Art und Entwicklungspotenziale

Embodied AI bezeichnet eine Form der körperlich verankerten künstlichen Intelligenz, die durch Sensoren, Aktuatoren und Interaktionen mit der physischen Umwelt lernt und handelt. Während große Fortschritte in der traditionellen KI durch datengetriebene Modelle wie Transformer erzielt wurden, steht Embodied AI vor der Herausforderung, kognitive Fähigkeiten mit physischer Wahrnehmung und planerischen Aktionen zu kombinieren. Dies eröffnet neue Möglichkeiten für Robotik, autonome Systeme und menschzentrierte Anwendungen.

Ziel dieser Masterarbeit soll es sein, den aktuellen Stand der Forschung im Bereich Embodied AI umfassend zu analysieren und bestehende Ansätze, Technologien sowie deren Anwendungen zu identifizieren. Ein Fokus soll dabei auf der Integration generativer Verfahren (z.B. Large Language Models, Large Action Models) sowie physik-informierter Modelle liegen, die die Eigen- und Raumwahrnehmung der verkörperten Systeme potenziell erhöhen können. Durch den Einsatz verkörperter KI in vielseitigen Umgebungen sollen zudem Ansätze der Adaptions- und Lernfähigkeit der Systeme in unbekannten Umgebungen betrachtet werden sowie Verfahren der echtzeitnahen Integration multi-modaler Inhalte (z.B. Videosequenzen, Audio, Text) in die Lern- und Ausführungsprozesse. Darüber hinaus sollen Entwicklungspotenziale und zukünftige Forschungsrichtungen spezifisch im Hinblick auf den Sicherheitssektor abgeleitet werden.

Thema 7: AI-Native Computing – Für KI optimierte Hardware und KI-gesteuerte / -generierte Software und Systeme

AI-Native Computing – Für KI optimierte Hardware und KI-gesteuerte / -generierte Software und Systeme

AI-Native Computing bezeichnet ein Paradigma, das auf tiefgreifende Integration von KI-Methoden in alle Schichten der IT-Architektur setzt, womit sich neue Möglichkeiten für adaptives, autonomes und selbstoptimierendes Computing eröffnen. Dies kann neue Standards in Bereichen wie Edge Computing, autonome Systeme und personalisierte digitale Umgebungen schaffen. Zu diesen Technologien zählen u.a. auch AI Operating Systems (KI-basierte Betriebssysteme), bei der künstliche Intelligenz als zentrales Steuerungssystem für Software, Hardware und Anwendungen fungiert und den Nutzern bedarfsgerecht Anwendungen und Interfaces bereitstellt. Erste bekannte Vertreter solcher Technologien sind bspw. das von der Firma Anthropic entwickelte Tool „Computer Use“, das ein KI-Modell bereitstellt, um mit einer Desktop-Umgebung menschenähnlich zu interagieren, oder auch KI-Agenten für die Softwareentwicklung wie Copilot, die die Grundlage für native KI-Funktionalitäten in Computerarchitekturen legen sollen.

Ziel dieser Masterarbeit ist es, den aktuellen Stand der Forschung im Bereich AI-Native Computing zu analysieren und Entwicklungspotenziale sowie zukünftige Anwendungsfelder zu identifizieren. Dabei können unterschiedliche Themen fokussiert werden, wie z.B. KI-gesteuerte Betriebssystemarchitekturen, agentische KI-Systeme oder auch autonome Softwareökosysteme. Ergebnisse der wissenschaftlichen Arbeit können Übersichten und Bewertungen zu bestehenden Systemen sein, die Ableitung von Handlungsempfehlungen für zukünftige KI-Forschung oder die Anfertigung kleinerer Prototypen für Demonstrationszwecke.