Nachdem AOL reSearch Suchanfragen für wissenschaftliche Zwecke veröffentlicht hatte und inzwischen erkannt hat, dass das ein reines Datenschutz-Desaster war, wird sich ganz unterschiedlich mit den Daten auseinandergesetzt.
Hintergrund
AOL hatte unlängst die Anfragen an die AOL-interne Suchmaschine für wissenschaftliche Zwecke zur Verfügung gestellt. Genauer gesagt handelt es sich um die Statistik des Monats Mai 2006. Die Anfragen sind zwar anonymisiert, jedoch lässt sich nachvollziehen welche Anfragen z.B. ein und derselbe Nutzer in diesen vier Wochen gestellt hat. Damit ist die Anonymität schnell dahin. AOL hat die Daten inzwischen nicht mehr auf seinen Webseiten, aber der (Image)-Schaden ist schon längst angerichtet.
Auswertungen
Es gibt zwei unterschiedliche "Seiten", die sich mit der Auswertung der Daten beschäftigt. Die eine Seite versucht zu zeigen, dass das wirklich ein Datenschutz-Desaster ist und versucht in pseudomäßigem investigativem Journalismus zu zeigen, dass das ja gar nicht so schwer ist, die Menschen hinter der Suchanfrage aus der Anonymität zu holen (das zeigt z.B. die New York Times).
Es mag zwar sein, dass da auch die schöne Absicht hintersteht auf dieses Problem aufmerksam zu machen, auf der anderen Seite wird hier mit meiner Meinung nach recht zweifelhaften Methoden versucht das zu zeigen.
Für mich reicht es völlig aus zu wissen, dass hier der Datenschutz massiv verletzt wird, ich brauche keine Homestory dahinter.
Viel interessanter sind dann wirklich anonymisierte Auswertungen wonach die Menschen bei AOL denn so suchen. Hier gibt es eine wirklich spannende Analyse bei Sistrix.
Und das Ergebnis ist mehr als ernüchternd und sollte vielen einmal zu denken geben. Denn wonach suchen Menschen, kaum zu glauben: sie suchen weder nach sex, porn ... - nein, sie suchen nach Domains und wissen eigentlich meist die URL. Nur statt sie ins Adressfeld des Browsers einzutragen wird die Suchmaschine gefragt.
Ein Blick in die meistgesuchten Keywords, TOP 13:
- ebay
- yahoo
- yahoo.com
- mapquest
- google.com
- myspace.com
- myspace
- www.yahoo.com
- www.google.com
- internet
- http
- my space
(Quelle: Sistrix)
Als Pädagoge zerreißt es mich, das ruft nach Bildungskampagnen. Das erklärt aber auch, weshalb wahrscheinlich Trojaner, Spams, Nigeria Connection etc. weiterhin erfolgreich sind. Eine Vielzahl der Netznutzer wissen wahrscheinlich schlicht nicht, wie dieses Ding "Internet" funktioniert.
Seien wir ehrlich - für die Top 15 der Anfragen braucht niemand eine Suchmaschine, keine tollen Algorithmen, keine Data-Center und erst recht keinen Pagerank. Das macht ein Script vor dem DNS-Server genauso.
In vielen Kommentaren taucht auf, dass das ja nur an AOL liegt und AOL-Nutzer schon immer ... waren. Aber das zielt sicher zu kurz, allerdings fehlt es auch an belastungsfähigen Daten um so etwas zu verallgemeinern.
Auf der anderen Seite bestätigt es meine eigenen Erfahrungen aus vielen Schulungen, die ich in den letzten Jahren gegeben habe. Ich hätte allerdings nicht erwartet, dass das ein derart breites Phänomen ist und dass es heute noch in dem Ausmaß existiert.
Vielleicht sehe ich das zu kritisch und pessimistisch, aber aus meiner Sicht brauchen wir nicht über digitale Spaltung reden, haben die Menschen Zugang sind damit die Probleme auch nicht gelöst.
Informationen zum Artikel