Computing

Computing

Wesentliche Grundlagen für erfolgreiche Arbeiten in der Rechnergestützten Physik sind offensichtlich der Zugang zu ausreichenden Rechnerressourcen sowie die Beherrschung der Techniken (High-Performance Computing, IT-Management) zu deren effizientem Einsatz. Allgemein ist Informationsmanagement eine wichtige Aufgabe in der Führung von Arbeitsgruppen und Kollaborationen, insbesondere in der Wissenschaft (mit einer ständigen Fluktuation von Team-Mitgliedern) sowie in der Selbstorganisation. Im Folgenden diskutiere ich einige Aspekte, die für meine Gruppe besonders relevant sind oder von allgemeinem Interesse sein könnten. Successful work in Computational Physics obviously requires access to sufficient computing resources and state-of-the-art techniques in computing and IT management. More generally, information management is (or should be) a prime task in leading groups and collaborations, especially in science (with a steady fluctuation in team members), and in self-organization. In the following, I discuss some aspects that are either particularly relevant for my group and/or might be helpful for others.

Gruppen-HPC-Cluster

Meine Gruppe nutzt und betreibt einen eigenen (im Rechenzentrum untergebrachten) HPC-Linux-Cluster mit mehr als 200 CPU-Kernen, aktuell mit der folgenden Hardware:

Group HPC cluster

My group owns and uses a dedicated Linux cluster for High-Performance Computing (hosted by the university data center) with more than 200 CPU cores, comprised of the following hardware:
Setup: ZDV housing

cluster load (last year) cluster load (last week)
    Previous clusters (with P. van Dongen)
  • 16 nodes with 2x AMD AthlonMP 1200, 2 GB, Tyan S2460 (year 2001-2006)
  • 7 nodes with 2x AMD AthlonMP 2200, 1 GB, Tyan S2466 (year 2002-2006)
  • 4 nodes with 2x AMD Opteron 244, 2 GB, Rioworks HDAMA (year 2003)
  • 10 nodes with 2x AMD Opteron 246, 2 GB, Tyan S2882 (year 2004)
  • 4 nodes with 2x AMD Opteron 270, 2 GB (year 2005)
  • 8 nodes with 2x AMD Opteron 2216, 4 GB (year 2006)
  • file servers (years 2001, 2005)
  • Rembo boot server, PBS Pro / OpenPBS queueing system
compute cluster 2003
Group HPC cluster in 2003
compute cluster 2003
Group HPC cluster ~ 2008

Information management

Usage of supercomputers and central HPC clusters

My experience with supercomputers and central HPC clusters dates back to 1995 and includes the following machines: For better overview over jobs at different sites, I had created a portal for supercomputer batch queues.

Code development

Research codes and tools

Sample codes and templates

See also course pages on computer simulations and numerical methods listed on my lectures page.

Parallelization, tuning, porting, and benchmarking

(to be continued, sample benchmark results shown below)
benchmark Intel and AMD benchmark JUGENE

Miscellaneous