Ort:  Dortmund
Datum:  20.04.2024

Masterarbeit »Einsatz von Large Language Models (LLMs) zum Data Profiling in Datenkatalogen«

Die Fraunhofer-Gesellschaft (www.fraunhofer.de) betreibt in Deutschland derzeit 76 Institute und Forschungseinrichtungen und ist die weltweit führende Organisation für anwendungsorientierte Forschung. Rund 30 800 Mitarbeitende erarbeiten das jährliche Forschungsvolumen von 3,0 Milliarden Euro.  

Deine Chance auf einen unterstützenden Praxispartner mit einem hochrelevanten Thema für Deine Masterarbeit!


Am Fraunhofer-Institut für Software- und Systemtechnik ISST in Dortmund leisten wir angewandte Spitzenforschung für den Digitalisierungsstandort Europa. Unsere Leidenschaft gilt der Welt der Daten: Wir streben danach, den Wert der Ressource »Daten« voll auszuschöpfen und Datengebenden in Datenräumen (Data Spaces) einen souveränen Umgang mit ihren Daten zu ermöglichen. Dabei setzen wir Standards für eine faire Datenökonomie in Bereichen wie Mobilität, Industrie und Gesundheitswesen. In wegweisenden Projekten schaffen wir innovative Digitalisierungslösungen mit nachhaltigem Mehrwert für die Gesellschaft und Wirtschaft in Deutschland und Europa.


Unsere Mobilität und unsere Städte befinden sich im Wandel. Trends wie die Verkehrswende, der Klima- und demographische Wandel sowie der Wunsch nach mehr Nachhaltigkeit und Lebensqualität, erfordern neue, intelligente Ansätze. In der Abteilung »Mobility & Smart Cities« nutzen wir unsere Kompetenzen und Technologien in den Bereichen Data Sharing und Datenmanagement, um zur Lösung dieser Herausforderungen beizutragen.


Hochrelevante Themen dabei sind Datenkataloge und Large Language Models (LLMs). Um die passenden Daten für die eigenen Unternehmungen zu finden, setzen immer mehr Unternehmen auf Datenkataloge. Datenkataloge speichern Metadaten über Daten und machen diese für Nutzer durchsuchbar. Die Qualität des Suchergebnisses hängt stark von der Verfügbarkeit und Qualität der Metadaten ab. Aufgrund stetig steigender Datenmengen, die in einem Datenkatalog inventarisiert werden müssen, ist ein manuelles Pflegen der Metadaten nicht sinnvoll. Es bedarf an Automatismen, um die Metadaten zu sammeln und zu bestimmen. Häufig ist es jedoch so, dass klassische Algorithmik hierbei an ihre Grenzen stößt. Large Language Models (LLMs) wie etwa ChatGPT können hier einen neuen Ansatzpunkt bieten, die Pflege der Metadaten zu unterstützen.


Du bist kurz vor Abschluss Deines Masterstudiums und suchst nach einem Praxispartner mit einem hochrelevanten Thema für Deine Abschlussarbeit? Du interessierst Dich für die Welt der Daten und einen sinnvollen und effizienten Umgang mit (Meta-)Daten? Dann schreibe Deine Masterarbeit an unserem Institut und profitiere von unserem Wissen und unserer Unterstützung.

 

Was Du bei uns tust

Ziel der Masterarbeit ist es, zu identifizieren, inwiefern Large Language Models (LLMs) eingesetzt werden können, um Metadaten für den Datenkatalog zu erzeugen und zu pflegen. Dabei liegt der Fokus auf denjenigen Metadaten, die auch von DCAT, einem Standardvokabular rund um Datenkataloge, erfasst werden.


Mögliche Aufgaben, die Du im Rahmen deiner Masterarbeit bearbeiten kannst:

  • Analyse existierender Literatur zum Thema Prompt Engineering
  • Identifikation von Anwendungsfällen, in denen LLMs die Metadatengenerierung unterstützen können
  • Entwicklung eigener Prompts, die für die Generierung von Metadaten sinnvoll wiederverwendet werden können
  • Evaluierung der LLM-Metadaten gegenüber dem, was klassische Algorithmen oder die manuelle Eingabe leisten

 

Was Du mitbringst

  • Ein laufendes Masterstudium in Wirtschaftsinformatik, Wirtschaftsingenieurwesen, Wirtschaftswissenschaften, Informatik oder einer vergleichbaren Fachrichtung
  • Erste Erfahrung mit Prompt Engineering (Zero-shot, Few-shot, CoT, ToT Prompting)
  • Idealerweise erste Erfahrungen im Bereich Datenmanagement
  • Einen teamorientierten, sorgfältigen und eigenverantwortlichen Arbeitsstil
  • Gutes Deutsch und Englisch in Wort und Schrift

 

Was Du erwarten kannst

  • Zukunftsgestaltende Tätigkeiten an der Schnittstelle von Wissenschaft und Wirtschaft
  • Die Möglichkeit, Deine Masterarbeit zu einem hochrelevanten und zukunftsweisenden Thema zu verfassen
  • Arbeit in einem aufgeschlossenen und engagierten Team mit offener Atmosphäre und flachen Organisationsstrukturen
  • Viel Freiraum zur Gestaltung und Umsetzung eigener innovativer Ideen
  • Vollständige Remote-Möglichkeit: Du kannst Deine Masterarbeit komplett Remote verfassen. Nur zum Abholen und Abgeben der Hardware und Smartcard müsstest Du je 1x zu uns ins Institut nach Dortmund kommen.
  • Persönliche Betreuung und Unterstützung, wobei Du von unserem großen Erfahrungsschatz profitierst

 

Wir wertschätzen und fördern die Vielfalt der Kompetenzen unserer Mitarbeitenden und begrüßen daher alle Bewerbungen – unabhängig von Alter, Geschlecht, Nationalität, ethnischer und sozialer Herkunft, Religion, Weltanschauung, Behinderung sowie sexueller Orientierung und Identität. Schwerbehinderte Menschen werden bei gleicher Eignung bevorzugt eingestellt.

Die Stelle ist zunächst auf 6 Monate befristet.

Mit ihrer Fokussierung auf zukunftsrelevante Schlüsseltechnologien sowie auf die Verwertung der Ergebnisse in Wirtschaft und Industrie spielt die Fraunhofer-Gesellschaft eine zentrale Rolle im Innovationsprozess. Als Wegweiser und Impulsgeber für innovative Entwicklungen und wissenschaftliche Exzellenz wirkt sie mit an der Gestaltung unserer Gesellschaft und unserer Zukunft. 

Haben wir Dein Interesse geweckt? Dann bewirb Dich jetzt online mit Deinen aussagekräftigen Bewerbungsunterlagen. Wir freuen uns darauf, Dich kennenzulernen! 

 

Fragen zu dieser Position beantwortet Dir gerne:
Daniel Tebernum
daniel.tebernum@isst.fraunhofer.de (Achtung: Diese E-Mail-Adresse kann nur für Rückfragen genutzt werden)

Es können nur Bewerbungen über unser Online-Bewerbungsportal angenommen werden (Button »Jetzt bewerben« am Seitenende). Bewerbungen per E-Mail oder Post können wir leider nicht berücksichtigen.

Fraunhofer-Institut für Software- und Systemtechnik ISST 

www.isst.fraunhofer.de 


Kennziffer: 72853                Bewerbungsfrist: 

 


Stellensegment: Database, Engineer, Technology, Engineering