Längst stellt Big Data nicht mehr einfach nur Datenmengen dar, die zu groß oder zu komplex sind, um sie herkömmlichen Methoden der Datenauswertung unterziehen zu können. Big Data kann unser aller täglich Leben beeinflussen. Und tut es bereits jetzt in dieser Sekunde.
Schon mal darüber nachgedacht, dass nicht Menschen sondern irgendwann vielleicht Algorithmen entscheiden werden, ob du einen Job, Kredit, eine Versicherung erhältst? Dass, zugespitzt gesprochen, das Like, das du einer Facebookseite früh morgens, während du deinen Kaffe trinkst, verwendet werden kann, um dich als Person zu analysieren? Dass aus anfangs oberflächlich erscheinenden Datenhaufen binnen kürzester Zeit persönlichste Dinge und Schlüsse deine Person betreffend gezogen werden können? Und dass diese vielleicht zu Beginn wenig verwert- und nutzbar erscheinenden Information ganz schnell Einfluss auf dein Leben nehmen könnten?
What is big Data?
„Big data is high-volume, high-velocity and/or
high-variety information assets that demand cost-effective,
innovative forms of information processing that enable
enhanced insight, decision making, and process automation.“1
Der Begriff Big Data bezeichnet in Öffentlichkeit und Fachwelt einerseits die großen digitalen Da tenmengen selbst, manchmal aber auch deren Analyse und Auswertung. Es gibt keine etablierte wissenschaftliche Definition für den Begriff, er ist unscharf und gilt als Schlagwort. Nach einer Definition von Gartner bezieht sich das „Big“ im Begriff Big Data auf die drei Dimensionen volume (Umfang, Datenmenge), velocity (Geschwindigkeit, mit der die Daten generiert und transferiert werden) und variety (Bandbreite der Datentypen und -quellen). Das Beratungsunternehmen McKinsey verwendet eine „absichtlich subjektive“ Definition und spricht von Datenbeständen, die mit „typischen Datenbanken“ nicht mehr erfasst, gespeichert, verwaltet und analysiert werden können.2
Data Mining als Analysewerkzeug
Im Zeitalter von Big Data werden immer häufiger statistische Methoden eingesetzt, um große Mengen an NutzerInnendaten zu analysieren, darin Muster und Zusammenhänge zu erkennen, und daraus über die Ausgangsinformationen weit hinausgehende Einschätzungen über die NutzerInnen oder Prognosen über deren zukünftiges Verhalten zu treffen. Die dabei genutzten Technologien und Methoden werden unter dem Begriff Data Mining zusammengefasst. Data Mining zielt darauf ab, bestimmte Verhaltensweisen und „Marker“ zu identifizieren, die als zuverlässige Indikatoren für Zukunftsprognosen dienen.3
Der als Technology Engineer bei Procter & Gamble beschäftigte David Kriesel arbeitet sowohl an strategischen als auch an hands-on-Themen im Umfeld der DataScience, des Machine Learning und der Advanced Analytics4 und hat mit seinem Vortrag über die Möglichkeiten von Data Mining aufgezeigt, wie „einfach“ aus rohen Daten Verhaltensweisen, Zusammenhänge und Muster ausgewertet werden können:
Daten und Gesellschaft
„Jeder, der nicht die letzten fünf Jahre auf dem Mond gelebt hat, kennt den Begriff ‚Big Data‘. Big Data bedeutet auch, dass alles, was wir treiben, ob im Netz oder ausserhalb, digitale Spuren hinterlässt. Jeder Einkauf mit der Karte, jede Google-Anfrage, jede Bewegung mit dem Handy in der Tasche, jeder Like wird gespeichert. Besonders jeder Like. Lange war nicht ganz klar, wozu diese Daten gut sein sollen – ausser dass in unserem Facebook-Feed Blutdrucksenker beworben werden, weil wir grad ‚Blutdruck senken‘ gegoogelt haben. Unklar war auch, ob Big Data eine grosse Gefahr oder ein grosser Gewinn für die Menschheit ist.“5
Mathematikern und Data Scientist Cathy O’Neil erläutert in ihrem Ted Talk, warum die Ära des Vertrauens in Big Data ein Ende finden muss und zeigt auf, wie „objektive“ Algorithmen unser Leben beeinflussen und steuern.6
Quellen
1 https://www.gartner.com/it-glossary/big-data
2 http://crackedlabs.org/dl/Studie_Digitale_Ueberwachung.pdf, S. 12
3 http://crackedlabs.org/dl/Studie_Digitale_Ueberwachung.pdf, S. 13
4 Vgl. http://www.dkriesel.com/person
5 https://www.dasmagazin.ch/2016/12/03/ich-habe-nur-gezeigt-dass-es-die-bombe-gibt/
6 Vgl. https://www.ted.com/speakers/cathy_o_neil
Literatur
http://crackedlabs.org/dl/Studie_Digitale_Ueberwachung.pdf
http://www.dkriesel.com/_media/blog/2016/spiegelmining-33c3-davidkriesel.pdf
https://www.dasmagazin.ch/2016/12/03/ich-habe-nur-gezeigt-dass-es-die-bombe-gibt/