Ort:  Darmstadt
Datum:  01.12.2022

Thesis Semantic Similarity and Robust Hashing on Social Media (BA/MA)

Die Fraunhofer-Gesellschaft (www.fraunhofer.de) betreibt in Deutschland derzeit 76 Institute und Forschungseinrichtungen und ist die weltweit führende Organisation für anwendungsorientierte Forschung. Rund 30 000 Mitarbeitende erarbeiten das jährliche Forschungsvolumen von 2,9 Milliarden Euro.  

In order to study the spread of information in social media, meta-data like forwards, replies or URLs are usually observed. However, in certain cases, there are no meta-data provided so that reconstruction of dissemination paths becomes challenging. For example, if the original context has been slightly modified and it is posted as an ”original” post without referencing the origin, the invisible connections between the posts are lost. Therefore, the motivation is to use different NLP methods to re-identify social media posts that are slightly modified in order to reconstruct the lost connections.

 

Was Du bei uns tust

The task is to develop a concept based on NLP methods to identify connections on short social media posts. This method is then to be implemented and evaluated on a suitable data set.

The general steps to proceed are as follows:

  • Select a dataset that consists of social media posts (or you can also crawl by yourself) and enlarge the dataset by paraphrasing the original social media posts (here you can use existing online tools). Make sure to check the performance of the chosen paraphraser beforehand.

  • Try and evaluate different methods like semantic similarity, robust hashing, key word extraction etc. (and possibly combinations of them) and compare the performances on the dataset for identifying the correct pairs of original and paraphrased posts.

 

Was Du mitbringst

  • Experience with Python is required.

  • Basic understanding of NLP is required.

  • For BA it is possible to focus on a single method.

 

Was Du erwarten kannst

  • Varied activity at the interface between business and science

  • Possibility to work together with experts

  • Individual support during the preparation of your bachelor thesis by experienced employees

  • Flexible and mobile working as well as the possibility to combine work and private life

 

Wir wertschätzen und fördern die Vielfalt der Kompetenzen unserer Mitarbeitenden und begrüßen daher alle Bewerbungen – unabhängig von Alter, Geschlecht, Nationalität, ethnischer und sozialer Herkunft, Religion, Weltanschauung, Behinderung sowie sexueller Orientierung und Identität. Schwerbehinderte Menschen werden bei gleicher Eignung bevorzugt eingestellt.

Es wird keine Vergütung gezahlt.

Mit ihrer Fokussierung auf zukunftsrelevante Schlüsseltechnologien sowie auf die Verwertung der Ergebnisse in Wirtschaft und Industrie spielt die Fraunhofer-Gesellschaft eine zentrale Rolle im Innovationsprozess. Als Wegweiser und Impulsgeber für innovative Entwicklungen und wissenschaftliche Exzellenz wirkt sie mit an der Gestaltung unserer Gesellschaft und unserer Zukunft. 

Haben wir Dein Interesse geweckt? Dann bewirb Dich jetzt online mit Deinen aussagekräftigen Bewerbungsunterlagen. Wir freuen uns darauf, Dich kennenzulernen! 

 

If you have any further questions do not hesitate to contact:

Jeong-Eun Choi jeong-eun.choi@sit.fraunhofer.de
Karla Schäfer karla.schaefer@sit.fraunhofer.de

Fraunhofer-Institut für Sichere Informationstechnologie SIT 

www.sit.fraunhofer.de 


Kennziffer: 60837                Bewerbungsfrist: 

 


Jobsegment: Social Media, Media, Marketing