Perspektive Computing

Die Arbeitsgruppe befasst sich mit der Analyse von Daten des ALICE-Experiments.

Auch nach sehr drastischer Auswahl und Reduktion der von den Detektoren der LHC-Experimente gesammelten Daten bleiben am CERN Datenzentrum im Durchschnitt etwa ein Petabyte Daten pro Tag zu verarbeiten. Die LHC-Experimente speichern etwa 90 Petabyte Daten pro Jahr. Diese Daten werden vom CERN aus im Worldwide LHC Computing Grid verteilt. In diesem Netzwerk sind etwa 900 000 Computer-Prozessoren in 170 Rechenzentren in 42 Ländern zusammengeschaltet, um die mehr als 12 000 Physiker*innen, die mit den LHC-Daten weltweit arbeiten, mit den nötigen Rechnerkapazitäten zu versorgen, um die Daten speichern und analysieren zu können. Im Grid-Netzwerk laufen jeden Tag etwa 2 Millionen Rechenjobs mit einer Transferrate von 60 GB/s.

Um nun in dieser Datenmenge die für die Bachelor-, Master- oder auch Doktorarbeit wichtigen Daten herausfiltern und zur Datenanalyse nutzen zu können, sind aufwendige Analyseumgebungen entworfen worden (ALIROOT), die auf dem CERN Analyse-Baukasten ROOT aufbauen. Im Rahmen dieser Umgebung lassen sich dann mit Programmen und Routinen in der Programmiersprache C++ Datenanalysen durchführen.

Die Beschreibung der Infrastruktur und notwendigen technischen Maschinerie klingt beeindruckend und doch ist es möglich, bereits in der Bachelor- oder Masterarbeit auch ohne anfängliche Programmier- oder Computerkenntnisse schnell Fuß zu fassen und auf der technologischen Klaviatur der LHC-Datenanalysen mitzuspielen. Im Rahmen einer Bachelor- oder Masterarbeit in der Arbeitsgruppe wird man an die dafür notwendigen Kenntnisse und Fähigkeiten nach und nach herangeführt. Man kann dann relativ schnell eigene Analysen durchführen und lernt, wenn man möchte, mit der Zeit, komplexere Probleme zu bewältigen.

Die am CERN und GRID zur Verfügung stehende Infrastruktur, Arbeits- und Programmierumgebung bietet somit ein einzigartiges Umfeld, diese Arbeitsweise kennenzulernen und Erfahrungen in der systematischen Analyse großer Datenmengen zu sammeln, die in Wissenschaft und Industrie immer größere Anwendung findet. Die häufig unter dem Label BIG DATA zusammengeführten Tätigkeitsbeschreibungen werden neben dem Einsatz in der Wissenschaft für immer mehr Unternehmen wichtig und nachgefragt.

© CERN


Im Rahmen einer Bachelor-, Master- oder auch Doktorarbeit in der Arbeitsgruppe bietet sich so gegebenenfalls die Möglichkeit, neben der Physik je nach Interesse, Neigung oder Talent zusätzliche Ausbildungsschwerpunkte zu setzen, sei es in der Datenanalyse selbst oder auch in der hardwarenahen Programmierung oder beispielsweise Computer-, Infrastruktur-, Datenbank- oder Netzwerkadministration, um nur einige Möglichkeiten zu nennen.