Ort:  Darmstadt
Datum:  01.11.2025

Masterarbeit: Lokalisierung von Sicherheitsneuronen in Text2Image-Modellen

Die Fraunhofer-Gesellschaft (www.fraunhofer.de) ist eine der weltweit führenden Organisationen für anwendungsorientierte Forschung. 75 Institute entwickeln wegweisende Technologien für unsere Wirtschaft und Gesellschaft – genauer: 32 000 Menschen aus Technik, Wissenschaft, Verwaltung und IT. Sie wissen: Wer zu Fraunhofer kommt, will und kann etwas verändern. Für sich, für uns und die Märkte von heute und morgen.

 

Das Fraunhofer-Institut für Sichere Informationstechnologie SIT gehört zu den führenden Forschungs- und Entwicklungseinrichtungen für Cyber-Sicherheit in Deutschland und Europa und ist Teil von ATHENE, dem nationalen Forschungszentrum für angewandte Cybersicherheit. ATHENE ist eine Kooperation der Fraunhofer-Gesellschaft mit der TU Darmstadt, der Hochschule Darmstadt und der Goethe-Universität Frankfurt. Unser gemeinsames Ziel: die Welt von morgen sicherer zu machen.

 

Hier sorgst Du für Veränderung

 

LLMs haben in den letzten Jahren große Aufmerksamkeit erlangt, aufgrund ihrer bemerkenswerten Fähigkeiten. Ein ähnliches, jedoch weniger erforschtes Feld konzentriert sich auf Text-zu-Bild (T2I) Modellarchitekturen. Da ein Bild mehr als 1000 Worte sagt, kann man annehmen, dass T2I Modelle mindestens genauso viele Fähigkeiten besitzen wie Text-zu-Text-Modelle (T2T). Daher ist es wichtig, diese Modelle einem "Alignment" Prozess zu unterziehen. In T2T-Modellen werden einige Neuronen in der Architektur zu Sicherheitsneuronen umfunktioniert. Um den Alignmentprozess besser zu verstehen, sollen die Lokalisierungen von Sicherheitsneuronen in beiden Architekturen verglichen werden.

 

Ziel: In der Arbeit sollen die Lokalisierungen von Sicherheitsneuronen in T2I-Modellen untersucht und mit T2T Modellen verglichen werden. Dazu werden die vorgeschlagenen Ansätze zur Lokalisierung von Sicherheitsneuronen von T2T-Modellen auf T2I-Modelle angepasst und implementiert. Schließlich werden Ergebnisse hinsichtlich der Lokalisierung und der Bedeutung der Neuronen analysiert, um Ähnlichkeiten und Unterschiede in den Architekturen hervorzuheben.

 

Ergebnisse: Die Ergebnisse dieser Arbeit sollen die Unterschiede der Modellarchitekturen für die LLM-Sicherheitsforschung konzeptualisieren. Da T2I-Modelle weniger Aufmerksamkeit erhalten, ist es wichtig, weitere Forschungen zu diesen Modellen zu motivieren. Dafür wird im Rahmen der Arbeit ein umfassender Vergleich von verschiedenen Architekturen und der dazugehörigen Sicherheitsneuronen angefertigt. Die Ergebnisse werden durch eine gezielte Deaktivierung der gefundenen Neuronen verifiziert und anschließend mit zufällig deaktivierten Neuronen verglichen.

 

Was Du bei uns tust:

  • Forschen und Implementieren von neuartigen Machine Learning Ansätzen, die die Sicherheit von LLMs steigern
  • Selbstkritische Evaluierung der gefundenen Ergebnisse
  • Präsentieren der Ergebnisse
  • Anfertigen eines Projektberichts in Form einer Masterarbeit

 

Hiermit bringst Du Dich ein

 

  • Kenntnisse im Bereich Machine Learning darunter Training, Inferenz und Optimierung von Transformerarchitekturen
  • Kenntnisse im Bereich ML-Security sind wünschenswert
  • Gute Python Kenntnisse im Speziellen mit Pytorch
  • Wissenschaftliches Interesse und Interesse an aktuellen Forschungsprojekten

 

Was wir für Dich bereithalten

 

  • Selbstständige Arbeitszeiteinteilung
  • Einblicke in das Schnittfeld von akademischer Forschung und industrieller Anwendung

 

Verwandte Arbeiten:

  1. https://arxiv.org/pdf/2404.09932(Relevante Abschnitte 2.2, 2.7, 3.1, 3.2)
  2. https://arxiv.org/pdf/2402.05162
  3. https://arxiv.org/pdf/2406.14144

 

Wir wertschätzen und fördern die Vielfalt der Kompetenzen unserer Mitarbeitenden und begrüßen daher alle Bewerbungen – unabhängig von Alter, Geschlecht, Nationalität, ethnischer und sozialer Herkunft, Religion, Weltanschauung, Behinderung sowie sexueller Orientierung und Identität. Schwerbehinderte Menschen werden bei gleicher Eignung bevorzugt eingestellt. Unsere Aufgaben sind vielfältig und anpassbar – für Bewerber*innen mit Behinderung finden wir gemeinsam Lösungen, die ihre Fähigkeiten optimal fördern. Das Gleiche gilt, wenn sie aufgrund einer Behinderung nicht alle Profilanforderungen erfüllen.

Die wöchentliche Arbeitszeit beträgt 39 Stunden. Die Stelle kann auch in Teilzeit besetzt werden. 

Mit ihrer Fokussierung auf zukunftsrelevante Schlüsseltechnologien sowie auf die Verwertung der Ergebnisse in Wirtschaft und Industrie spielt die Fraunhofer-Gesellschaft eine zentrale Rolle im Innovationsprozess. Als Wegweiser und Impulsgeber für innovative Entwicklungen und wissenschaftliche Exzellenz wirkt sie mit an der Gestaltung unserer Gesellschaft und unserer Zukunft. 

Bereit für Veränderung? Dann bewirb Dich jetzt, und mach einen Unterschied! Nach Eingang Deiner Online-Bewerbung erhältst Du eine automatische Empfangsbestätigung. Dann melden wir uns schnellstmöglich und sagen Dir, wie es weitergeht. 

 

Fraunhofer-Institut für Sichere Informationstechnologie SIT 

www.sit.fraunhofer.de 


Kennziffer: 81219                Bewerbungsfrist: 

 


Stellensegment: Neurology, Healthcare