Datenspuren im Internet 13.04.2010 André Martens André Martens Belanglose Daten gibt es nicht! André Martens Inhalt Das Internet in Zahlen Für wen sind Daten relevant? Datenquellen Unfreiwillige Freiwillige Datenweitergabe Datenweitergabe Schutzmaßnahmen André Martens Das Internet in Zahlen (Stand: 2009, Royal Pingdom) 90 Billionen Emails/Jahr (81% davon Spam) 247 Milliarden Emails/Tag 1,4 Milliarden Email-User weltweit 243 Millionen Websites (47 Mio mehr als 2008) 1,73 Milliarden Internet-User weltweit (18% Wachstum) 126 Millionen Blogs (BlogPulse) 27,3 Millionen Tweets/Tag 350 Millionen User auf Facebook (50% davon loggen sich jeden Tag ein) 4 Milliarden Fotos auf Flickr 2,5 Milliarden Fotos werden jeden Monat bei Facebook hochgeladen 30 Milliarden Fotos/Jahr 1 Milliarde Videos auf YouTube verfügbar 148000 neue Computer in Botnetzen/Tag André Martens Wer hat Interesse an Daten? Personaler genereller Eindruck (Freizeitverhalten) Religion, Familienstand, Krankheitstage, Schwangerschaft, politische Einstellungen, Streikbeteiligungen 28 % der Unternehmen nutzen in 4 von 5 Fällen Social Networks zur Informationsbeschaffung Headhunter Identifikation von Wissensträgern, Innovatoren und inoffiziellen Führungspersonen Unternehmen für gezielte Werbung Ermittlungsbehörden Kommunikation und personelle Netzwerke Banken Kreditwürdigkeit finanzielle Probleme Social Scoring André Martens Wer hat Interesse an Daten? Hacker / Eindringlinge Social Engineering Krankenkassen Lebenswandel Konsumverhalten Drogen- / Medikamentenmissbrauch Journalisten Fotos Hintergrundinformationen Der (böse) Nachbar / Kollege Eltern Bekanntschaften Freizeitverhalten Lehrer Stalker Pädophile Kontakt (Grooming) André Martens Wirklich? Quelle: n24.de, 29.6.2009 Quelle: e-recht24.de, 13.02.2007 Quelle: heise.de, 4.4.2008 Quelle: telepolis.de Quelle: Winfuture André Martens Und dann gibt es noch die Datenschutzpannen Quelle: e-recht24.de, 8.12.2009 Quelle: e-recht24.de, 12.11.2009 Quelle: rp-online.de, 19.10.2009 Quelle: scienceblogs.de Quelle: Winfuture André Martens Offene Datenquellen Blogs Twitter / Identi.ca Private Websites Kommentare in Blogs und Online-Zeitungen eBay-Auktionshistorie Amazon-Wunschzettel / Hochzeitsliste Flickr Dooyoo / Ciao YouTube / Vimeo Newsgroups Mailinglisten IRC last.fm / blip.fm Xing / linkedin Facebook / StudiVZ / SchülerVZ Gowalla / FourSquare myspace.com Social bookmarking (Mister Wong, Delicious, Digg) Yasni / 123people André Martens Halböffentliche Datenquellen Browser-Historie History-Stealing Trojaner „Private“ Daten bei Facebook Zugriff über Apps Crawling-DB über Social Networks Google-Hacks „vertraulich“ filetype:PDF site:www.meinkonkurrent.de inurl:“MultiCameraFrame?Mode=Motion“ live view-axis André Martens Unfreiwillige Übermittlung von Daten André Martens Datenübermittlung durch den Browser Browser-Anfrage: GET /.Bugzilla/php/show_map.php HTTP/1.1 Host: cad:1026 User-Agent: "Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.9.2.3) Gecko/20100401 Firefox/3.6.3 (.NET CLR 3.5.30729)" Accept: text/html;q=0.9,text/plain;q=0.8,image/jpeg,image/gif,*/*;q=0.1 Accept-Language: de-DE, de;q=0.80, en;q=0.60, en-US;q=0.40, en-GB;q=0.20 Accept-Encoding: gzip,deflate,compress;q=0.9 Accept-Charset: ISO-8859-1,utf-8;q=0.66,*;q=0.66 Keep-Alive: 300 Connection: keep-alive Referer: http://cad:1025/ Server-Antwort: HTTP/1.1 200 OK Server: Apache/1.3.29 (Unix) PHP/4.3.4 Content-Length: 7909 Content-Language: de Content-Type: text/html Connection: close (page content) André Martens Logging durch den Webserver /<path to server>/logs/access.log 172.27.217.23 - - [10/Apr/2010:11:48:52 +0200] "GET http://cad:1026/.Bugzilla/php/show_map.php HTTP/1.1" 200 7909 "http://cad:1025/" "Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.9.2.3) Gecko/20100401 Firefox/3.6.3 (.NET CLR 3.5.30729)“ 172.27.217.23 - - [10/Apr/2010:11:48:52 +0200] "GET http://cad:1026/.images/micronas_logo_transparent.gif HTTP/1.1" 200 1343 "http://cad:1026/.Bugzilla/php/show_map.php" "Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.9.2.3) Gecko/20100401 Firefox/3.6.3 (.NET CLR 3.5.30729)" 172.27.217.23 - - [10/Apr/2010:11:48:52 +0200] "GET http://cad:1026/intranet.css HTTP/1.1" 200 2962 "http://cad:1026/.Bugzilla/php/show_map.php" "Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.9.2.3) Gecko/20100401 Firefox/3.6.3 (.NET CLR 3.5.30729)" 172.27.217.23 - - [10/Apr/2010:11:48:52 +0200] "GET http://cad:1026/favicon.ico HTTP/1.1" 200 894 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.9.2.3) Gecko/20100401 Firefox/3.6.3 (.NET CLR 3.5.30729)" André Martens Staatliche Datensammlung: VDS Vorratsdatenspeicherung vorerst durch das Verfassungsgericht ausgesetzt (Urteil vom 2.3.2010) Gesammelte Daten bei Internetnutzung: IP-Adresse Anfang und Ende der Verbindung Email-Header der Korrespondenz (inklusive Subject, Sender, Empfänger) Funkzelle (Aufenthaltsort) bei mobiler Kommunikation Daten werden 6 Monate lang gespeichert André Martens Google Search Speicherung der Such-Historie Cookie zur Wiedererkennung des Nutzers André Martens Google Cache Cache für die Suchmaschine Indirekte Übermittlung wegen ungewollten Kopierens der eigenen Inhalte Erlaubt auch das Finden längst gelöschter Inhalte Erschwert das Löschen von Daten im Netz André Martens Google Analytics Datensammlung für Website-Statistik: Aufenthaltszeit Explorationstiefe Finden langsamer Seiten Wird von 57% der 10000 beliebtesten Websites genutzt. Daten: IP-Adresse, aufgerufene Seiten, Aufenthaltszeit, Referrer (bei Google zentral gespeichert) Google wurde in der Vergangenheit schon mehrfach gehackt André Martens Google – Ein Datenimperium Suchmaschine Google Groups Google Wifi (Mountain View) Google Chrome Google Browser Toolbar Google Energy Google AdSense Google Web Accelerator Picasa google-analytics Google Living Stories Google Image Labeler YouTube Google Fast Flip Google Flu Trends Google Wave Google Go Google Mail Google Earth Google On2 Google Maps Google Voice Google Streetmap Google Search Appliance Google Docs Google Squared Google Drive Google Health Google News Google Bandwagon André Martens (Super-) Cookies Kleine persistente Text-Dateien, die z.B. eine ID enthalten, um den Nutzer auch nach Änderung der IP-Adresse wieder zu erkennen. Browser-Cookies haben ein Verfallsdatum und können explizit gelöscht werden. Super-Cookies werden durch Flash-Plugins erzeugt und haben kein Verfallsdatum. cad TRUE / FALSE 1271203200 userid 0815 André Martens Web-Bugs Unsichtbare Grafiken in der Größe eines Pixels Hinterlassen IP-Adresse im Log des cross-referenzierten Servers Auch in Spam-Mails zur Überprüfung der Adresse auf Gültigkeit Über IP-Geotargeting auch Wohnortermittlung <img src=http://www.adserver.com/images/pic.gif width="1“ height="1"> André Martens URL-Verkürzer bit.ly Verkürzt URLs auf Adressen im Stil von http://bit.ly/8iQB9s Wird oft im Zusammenhang mit Twitter benutzt (140 Zeichen-Limit) Klicks auf bit.ly-Links werden von bit.ly protokolliert. Aufrufstatistiken können von jedem analysiert werden André Martens URL-Verkürzer bit.ly André Martens URL-Verkürzer bit.ly André Martens Browser-Fingerprinting http://panopticlick.eff.org Daten: User Agent HTTP_ACCEPT Header Browser Plugins Time Zone Screen Size and Color Depth System Fonts Cookies enabled? Supercookie test André Martens Offene WLAN-Netze Nutzung offener Netze unterwegs bequem und kostenlos Übertragung Honey-Pot Packet von Passwörtern (z.B. Mailaccount) im Klartext bzw. Phishing-Gefahr Sniffing durch andere Teilnehmer ARP-Spoofing Man-in-the-Middle-Attacken André Martens Freiwillige Übermittlung von Daten und Auswertungsmöglichkeiten in Social Networks André Martens Facebook – Social Network „Freund“ 350 30 Millionen User (Ende 2009) Milliarden neue Fotos pro Jahr User User-Profil Private Daten z.B. Fotos Apps z.B. Spiele André Martens Facebook - Friedfinder Facebook weiß viel über Nicht-Mitglieder. Datenquelle: freiwilliger Upload aller Email-Kontaktdaten André Martens Facebook – Spiele: z.B. Farmville Aufhebung der Privatsphäre André Martens Facebook - Netzwerk Gaydar (Studie am MIT, September 2009) Versuch der Erkennung von homosexuellen Neigungen durch Analyse des Freundschaftsnetzwerks Politische Einstellung (u. a. durch Einbeziehung des Musikgeschmacks) Rasterfahndung Datenschutzprobleme Facebook legte für 30 Minuten die Mail-Adressen der Mitglieder offen (31.03.2010) André Martens Facebook – Änderung der Datenschutzvereinbarung Facebook will Nutzerdaten automatisch weitergeben Weitergabe an pre-approved Websites Dritter Automatische Übermittlung beim Surfen auf anderen Seiten während Facebook-Login noch aktiv Keine Zustimmung durch Nutzer vorgesehen Zitat: Dazu sei das Unternehmen "gezwungen", um seinen Nutzern "die Möglichkeit zu geben, auch außerhalb von Facebook nützliche Erfahrungen im sozialen Bereich machen zu können." (Heise, 27.3.2010) André Martens Xing – Netzwerk A Practical Attack to De-Anonymize Social Network Users (Wondracek, Holz, Kirda und Kruegel) Nutzung von History-Stealing zum Finden von solchen URLs: https://www.xing.com/net/[groupID]/forums+ Erstellung einer Crawling-DB von Xing Identifizierung der User über Gruppen-Schnittmengen André Martens Google Buzz Social Network basierend auf den Daten von Google Mail Häufige Email-Kontakte wurden automatisch zu „Freunden“ im Network. Datenschutzprobleme Nutzern wurde erst nachträglich die Bedeutung klar. Email-Kontakte wurden für alle sichtbar. Arbeitskollegen (auch Chefs) bekamen plötzlich Einblick in als privat freigegebene Daten. André Martens Weitere Risiken von Social Networks Erleichterung von Social Engineering Malware-Verteilung Datendiebstahl über Fake-Accounts Identitätsdiebstahl Nicknapping Social Sentry von Teneros ist ein Service zur Überwachung von Mitarbeitern in Social Networks. Kosten: 2-8 $/Mitarbeiter André Martens StudiVZ - Crawler-Statistik Proof of concept Ende 2006, um auf Sicherheitsmängel bei StudiVZ hinzuweisen Fast Crawling der gesamten DB mit 10 Rechnern in 4 Stunden Datenbestand: 1074574 Profile Nur öffentlich zugängliche Daten Quelle: studivz.irgendwo.org André Martens StudiVZ - Crawler-Statistik Quelle: studivz.irgendwo.org André Martens StudiVZ - Crawler-Statistik Quelle: studivz.irgendwo.org André Martens Twitter 27,3 Millionen Tweets/Tag (Ende 2009) Tweet = Nachricht mit höchstens 140 Zeichen Länge „Following“ bestimmt Zusammensetzung der „Timeline“ Nur Unterscheidung zwischen offenen und geschlossenen Accounts Zusammenstellung einer individuellen Timeline durch „follow“-Funktion Follower-Status aber nicht entscheidend für Leserechte bei offenen Accounts André Martens Twitter / Gowalla - Aufenthaltsort André Martens Twitter - Tagesablauf André Martens Twitter - Tagesablauf André Martens Twitter - Analysewerkzeuge Twitter-Listen: Nutzer kategorisieren andere Nutzer Analyse mit http://twitteranalyzer.com Aufschlüsselung nach Hashtags, @-replies und ProfilAngaben der Follower André Martens Twitter - Analysewerkzeuge Analyse von Follower-Beziehungen http://twitter.mailana.com Analysiert auch Häufigkeit von Kommunikation http://twitnest.appspot.com Erlaubt Gruppierung (Clustering) des Netzwerks in einstellbarer Granularität André Martens Twitter - Analyse André Martens Gegenmaßnahmen Datensparsamkeit Gezielte Datenstreuung Misstrauen Mailclient Browser-Security-Plugins Benutzung von Metager Anonymisierung Verschlüsselung André Martens Datensparsamkeit Immer Kein nur so wenig Daten wie möglich angeben. Vertrauen in „Privacy“-Einstellungen André Martens Gezielte Datenstreuung / Falschinformationen Welches Nicht Bild möchte ich vermitteln? gefunden zu werden ist in einigen Branchen ein No-Go. Einsatz von Phantasiedaten Nutzung von trash-mail.com André Martens Misstrauen Immer hinterfragen: Warum ist ein Dienst kostenlos? Wodurch finanziert er sich? Welche Daten sammelt er? Für wen sind sie interessant? André Martens Mailclient: Abschalten des automatischen Ladens von Grafiken, um Web Bugs zu unterdrücken. Verschlüsselungs-Plugin benutzen André Martens Browser Firefox benutzen! History entweder abstellen oder regelmäßig löschen Cookies regelmäßig löschen Security-Plugins installieren André Martens Browser-Plugin: NoScript Black-/White-List von Websites für die Ausführung von Javascript André Martens Browser-Plugin: RequestPolicy Black-/White-List von erlaubten Cross-Website-Referenzierungen André Martens Browser-Plugin: AdBlockPlus Blacklisting von Werbesites André Martens Browser-Plugin: BetterPrivacy Automatisches Löschen von Super Cookies/LSO André Martens Suchmaschine: MetaGer Meta-Suchmaschine Kein individuelles IP-Logging Keine Cookies für personalisierte Suche André Martens Anonymisierung: Tor Onion Routing zur Verschleierung der IP-Adresse Privoxy verhindert zusätzlich Cookie- und Fingerprint-Daten Bild: torproject.org André Martens Anonymisierung: JAP kommerzieller kostenlose, Anbieter einer Mix-Kaskade aber langsame Mix-Kaskaden verfügbar Sicherheit gegen Überwachung geringer als bei Tor, da MixKaskaden fest höhere Performance als Tor André Martens Anonymisierung: Mixmaster-Remailer Anonymisierungsdienst für Mails Modifiziert den Nachrichten-Header. Entfernt alle Informationen, die auf den Absender schließen lassen. Zerhackt Emails in gleichgroße Portionen, um Rückschlüsse auf die Mailgröße zu verhindern. Knoten in Mixmaster-Ketten kommunizieren verschlüsselt. Mails werden in Pools zwischengespeichert und zeitlich zufällig verschickt. Risiko aber: Wer betreibt den Remailer? André Martens Verschlüsselung: SSH-Tunnel Point-to-Point-Verschlüsselung Benötigt Sicheres Server Nutzen öffentlicher WLAN-Hotspots André Martens Verschlüsselung: GPG Email-Verschlüsselung Plugins Für erhältlich Browser: FireGPG Private/Public Key Verfahren Keyserver Web of Trust Open keine Source Verwendung von patentierten Verfahren André Martens Verschlüsselung: TrueCrypt Verschlüsselt Container und ganze Platten Plausible Deniability Zu empfehlen bei Nutzung von Online-Backup André Martens Vielen Dank für die Aufmerksamkeit! Fragen?