Wie man kriminelle Twitter-Nutzer entdeckt

Wie Machine Learning dabei helfen kann, kriminelle Twitter-Nutzer zu entlarven, zeigen Forscher der südafrikanischen Universität Pretoria am kommenden Mittwoch in Potsdam: Sie nutzen für ihre Big-Data-Analysen das Spitzenforschungslabor "HPI Future SOC Lab", dessen leistungsstarke IT-Infrastruktur vom Hasso-Plattner-Institut (HPI) kostenfrei zur Verfügung gestellt wird.

Beim "HPI Future SOC Lab Day" am 15. November diskutieren IT-Experten aus Universitäten, Forschungsinstituten und Unternehmen am SAP Innovation Center Potsdam aktuelle Ergebnisse, die sie mithilfe der Potsdamer Serversysteme erarbeitet haben. Gastgeber sind HPI-Direktor Professor Christoph Meinel und Professor Andreas Polze, Leiter des Fachgebiets Betriebssysteme und Middleware.

So werten die Wissenschaftler aus Pretoria die Daten von mehr als 200'000 Twitter-Accounts mithilfe von verschiedenen Machine-Learning-Algorithmen aus, um diejenigen herauszufiltern, die falsche Angaben machen. So will das Team Pädophile aufspüren, die online den Kontakt zu Kindern und Jugendlichen suchen. Ein "Identity Deception Score" soll dabei die Wahrscheinlichkeit ermitteln, mit der die Account-Daten von der Realität abweichen.

Ähnliche Daten in verschiedenen Fachgebieten

Ähnliche Datenmassen werden auch in ganz anderen Fachgebieten bearbeitet, zeigen etwa Forscher der brasilianischen Universidade Federal do Pará: Sie analysieren mithilfe des HPI Future SOC Lab die Sensordaten, die während des Metallverarbeitungsprozesses anfallen. Informatiker des Hasso-Plattner-Instituts präsentieren Möglichkeiten, Grafikprozessoren für Machine-Learning-Berechnungen in Unternehmen anzuwenden.

Seit Eröffnung des HPI-Spitzenforschungslabors 2010 haben Experten aus über 20 Nationen die Infrastruktur für rund 370 Forschungsprojekte genutzt. Am Mittwoch entscheidet die Steuerungsgruppe des HPI-Spitzenforschungslabors über 32 neue Projektanträge, die aus 22 verschiedenen Forschungsinstituten aus aller Welt am HPI Future SOC Lab eingereicht wurden. Das Labor bietet Wissenschaftlern kostenlos die neuesten Technologien für die Erforschung und die Analyse riesiger Datenmengen in Echtzeit.

Artikelfoto: Photo-Mix (CC0 Creative Commons)