Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen:
doi:10.22028/D291-42163
Titel: | An analysis of privacy and group fairness issues of online social network and fitness tracker users |
VerfasserIn: | Rahman, Tahleen Awazid |
Sprache: | Englisch |
Erscheinungsjahr: | 2023 |
DDC-Sachgruppe: | 500 Naturwissenschaften |
Dokumenttyp: | Dissertation |
Abstract: | The advent of smart handheld and wearable device technologies along with advances in the field of Artificial Intelligence and Machine Learning have progressively changed people’s lifestyle immensely over the last decade. Among them, Online Social Networks (OSNs) and fitness trackers have become integral parts of daily lives of millions of people around the world. In addition to oering a wide range of functionalities, these tools allow people to share huge amounts of data everyday, which becomes a serious concern from the privacy point of view. Moreover, the machine learning algorithms which are at the core of many features oered by OSNs and fitness trackers are quite sensitive to bias that is prevalent in the training data. This dissertation presents an analysis of privacy and fairness issues that arise out of downstream processing of such user generated data. We first present an analysis of privacy for multiple scenarios namely: inference of user location, social relationships, sensitive user attributes namely gender, age and education as well as user linkability along the temporal dimension. We demonstrate the severity of the privacy attacks by an extensive evaluation on real life datasets and derive key insights. We introduce a system called Tagvisor, that uses various obfuscation techniques for thwarting one of the attacks, namely location inference from hashtags. Secondly, we analyze the fairness of node2vec, a popular graph embedding method, which we use in our analysis of OSNs. Our experiments demonstrate the existence of bias in node2vec when used for friendship recommendation. We propose a fairness-aware embedding method, namely Fairwalk, which extends node2vec and demonstrate that Fairwalk reduces bias under multiple fairness metrics while still preserving the utility. Das Aufkommen intelligenter Handheld- und Wearable-Gerätetechnologien sowie Fortschritte auf dem Gebiet der künstlichen Intelligenz und des maschinellen Lernens haben den Lebensstil der Menschen im letzten Jahrzehnt nach und nach enorm verändert. Unter ihnen sind Online Social Networks (OSNs) und Fitness-Tracker zu integralen Bestandteilen des täglichen Lebens von Millionen von Menschen auf der ganzen Welt geworden. Diese Tools bieten nicht nur eine breite Palette an Funktionalitäten, sondern ermöglichen es den Menschen auch, jeden Tag riesige Datenmengen zu teilen, was aus Sicht des Datenschutzes ein ernstes Problem darstellt. Darüber hinaus reagieren die Algorithmen des maschinellen Lernens, die den Kern vieler von OSNs und Fitness- Trackern angebotener Funktionen bilden, sehr empfindlich gegenüber Verzerrungen, die in den Trainingsdaten vorherrschen. Diese Dissertation präsentiert eine Analyse von Datenschutz- und Fairness-Problemen, die sich aus der nachgelagerten Verarbeitung solcher benutzergenerierten Daten ergeben. Wir präsentieren zunächst eine Analyse der Privatsphäre für mehrere Szenarien, nämlich: Rückschluss auf den Standort des Benutzers, soziale Beziehungen, sensible Benutzerattribute, nämlich Geschlecht, Alter und Bildung, sowie Benutzerverknüpfbarkeit entlang der zeitlichen Dimension. Wir demonstrieren die Schwere der Datenschutzangriffe durch eine umfassende Auswertung realer Datensätze und leiten daraus wichtige Erkenntnisse ab. Wir stellen ein System namens Tagvisor vor, das verschiedene Verschleierungstechniken verwendet, um einen der Angriffe zu vereiteln, nämlich die Standortinduktion aus Hashtags. Zweitens analysieren wir die Fairness von node2vec, einer beliebten Methode zur Grapheneinbettung, die wir in unserer Analyse von OSNs verwenden. Unsere Experimente zeigen die Existenz von Bias in node2vec, wenn es für Freundschaftsempfehlungen verwendet wird. Wir schlagen eine fairnessbewusste Einbettungsmethode vor, nämlich Fairwalk, die node2vec erweitert und zeigen, dass Fairwalk die Verzerrung unter mehreren Fairness-Metriken reduziert und gleichzeitig den Nutzen beibehält. |
Link zu diesem Datensatz: | urn:nbn:de:bsz:291--ds-421638 hdl:20.500.11880/38204 http://dx.doi.org/10.22028/D291-42163 |
Erstgutachter: | Backes, Michael |
Tag der mündlichen Prüfung: | 14-Mai-2024 |
Datum des Eintrags: | 8-Aug-2024 |
Fakultät: | MI - Fakultät für Mathematik und Informatik |
Fachrichtung: | MI - Informatik |
Professur: | MI - Prof. Dr. Michael Backes |
Sammlung: | SciDok - Der Wissenschaftsserver der Universität des Saarlandes |
Dateien zu diesem Datensatz:
Datei | Beschreibung | Größe | Format | |
---|---|---|---|---|
phdthesis_rahman (2).pdf | phd thesis | 3,68 MB | Adobe PDF | Öffnen/Anzeigen |
Diese Ressource wurde unter folgender Copyright-Bestimmung veröffentlicht: Lizenz von Creative Commons