slidenumbers: true
Diese Folien sollen NGOs erklären, was Data Science ist und wie sie davon profitieren können.
ist das Ableiten von Erkenntnissen aus Daten. [...] Es werden Techniken und Theorien aus vielen Bereichen der Mathematik, Statistik, Informatik, Maschinellem Lernen, [...] verwendet, aus denen praxisnahe und benutzerfreundliche Vorhersagemodelle entwickelt werden. [...]
-- http://en.wikipedia.org/wiki/Data_science
Begrenzte Ressourcen müssen möglichst optimal auf Kandidaten (Personen/Gruppen/Regionen) verteilt werden.
Ein Vorhersagemodell wird auf Basis von historischen Daten erstellt um die Kandidaten zu bewerten und dadurch in eine Rangfolge zu bringen.
Die Kandidaten, die dem Modell nach am stärksten profitieren, können priorisiert werden.
Das spart Kosten und maximiert den Impact.
We're tackling the world's biggest problems through data science. -- http://www.datakind.org
DataKind bringt Wohltätigkeitsorganisationen auf zwei-tägigen Data Dives mit Data Scientists zusammen, die dort pro bono an Datenproblemen der Organisationen arbeiten.
DataKind hat GiveDirectly - einer NGO, die bedingungslos Geld an bedürftige Haushalte in Kenia und Uganda überweist1 - geholfen, besonders arme Dörfer durch die automatisierte Analyse von Satellitenbildern zu identifizieren2.
https://www.youtube.com/watch?v=CxENxESpBtk
Um zu helfen, die vielen Nachrichten, die über Amnesty Internationals Urgent Action Network eingehen, zu priorisieren, haben Freiwillige von DataKind ein Vorhersagemodell erstellt, welches die Nachrichtentexte analysiert, um auf das Eskalationspotential der Situation zu schließen.34
Freiwillige von Datakind haben Shooting Star Chase, die schwerbehinderte Kinder und ihre Familien begleiten, geholfen u.A. aktuelle und zukünftige Versorgungsengpässe in ihren Hospizen mithilfe der Vereinigung von demographischen Daten und Daten aus dem Gesundheitssektor vorherzusagen.5
Diese Projekte sind zum großen Teil von freiwilligen Data Scientists, die sonst bei Firmen wie Google, Facebook, Microsoft, uvm. arbeiten, an zwei-tägigen Data Dives6 umgesetzt worden.
Noch gibt es leider keine Organisation in Deutschland, die diese Art von zivilgesellschaftlichem Engagement organisiert. Das wollen wir ändern.
Wir sind Mathematiker, Statistiker, Ökonomen, Informatiker, etc. die nicht mehr nur Werbung optimieren wollen.
Daniel Kirsch (Mathematik), Marit Brademann, Dr. Alexander Weiß (Mathematik), Dr. Tobias Pfaff (Ökonomie), Irina Dettmann, Paulius Stakenas, Marija Vlajic (Physik)
- Klaas Bollhöfer, Chief Data Scientist, The Unbelievable Machine Company
- Adam Drake, Chief Data Scientist, Zanox
Wir organisieren pro Jahr mindestens einen Data Dive mit bis zu drei sozialen Organisationen als Partner. Dort lösen freiwillige Data Scientists Probleme der Partner mit Data Science.
Aus dem Erfolg der Data Science for Social Good-Bewegung in den USA und England (und seit Oktober 2014 auch in Indien, Irland, und Singapur) lässt sich ableiten, dass es kein Problem sein wird, Data Scientists zu mobilisieren.
Die größte Schwierigkeit für soziale Organisationen besteht darin, dass ihnen die Expertise fehlt — personell (Data Scientists) wie materiell (Big Data Technologie) — um aus ihren Daten zu lernen.
Damit einher geht die Schwierigkeit zu erkennen, welche Probleme Daten überhaupt lösen können. Wir hoffen durch die vorhergehenden Beispiele einen Anstoß geben zu können.
Daniel Kirsch [email protected] @kirel http://dssg-berlin.github.io
(durch freiwillige Datenbotschafter in Zusammenarbeit mit der Organisation – Vorlauf bis zu zwei Monate)
- Anonymisierung/Pseudonymisierung
- Säuberung/Fehlerbereinigung
- Sicherstellen der Maschinenlesbarkeit der Daten-Formate
Daten offenbaren nicht auf magische Weise ihre Geheimnisse. Die richtigen Fragen müssen vorher gestellt werden, damit eine Analyse beim Data Dive Antworten liefern kann.7
Die teilnehmenden Organisationen „pitchen“ ihre Datenprobleme woraufhin sich die teilnehmenden freiwilligen Data Scientists um die Datenbotschafter sammeln, die der Organisation zur Seite stehen, um mithilfe von Vorhersagemodellen und Visualisierungen innerhalb eines Wochenendes Lösungen zu entwickeln.
Auch nach dem Data Dive stehen die Datenbotschafter den Organisationen zur Seite, um die prototypischen Lösungen, die auf dem Data Dive entstanden sind, in den produktiven Einsatz zu überführen.
Um den Kreis zu schließen, müssen die implementierten Modelle nach einiger Zeit im Produktiveinsatz auf ihren Nutzen überprüft werden. Hat sich der Einsatz bewährt? Wo muss nachjustiert werden? Besteht weiteres/neues Potential aus den Daten zu lernen?
- http://www.nominettrust.org.uk/knowledge-centre/articles/big-data-and-social-organisations
- http://datakind.org
- http://dssg.io
Footnotes
-
http://www.ted.com/talks/joy_sun_should_you_donate_differently ↩
-
http://www.datakind.org/projects/using-the-simple-to-be-radical/ ↩
-
http://www.datakind.org/projects/using-predictive-analytics-to-prevent-human-rights-abuses/ ↩
-
http://www.washingtonpost.com/business/on-it/amnesty-international-considers-using-big-data-to-predict-human-rights-violations/2013/11/22/3f4f1a1e-5388-11e3-a7f0-b790929232e1_story.html ↩
-
http://www.shootingstarchase.org.uk/our-care/info-for-families/ ↩
-
Dazu später mehr. ↩