Paralleles Rechnen auf Hochleistungsbeschleunigern (GPUs)
Bei den Prozessorarchitekturen hat sich ein Paradigmenwechsel hin zur On-Chip-Parallelisierung vollzogen, die in Many-Core-Beschleunigern (z. B. GPUs) perfektioniert wurde. Solche Prozessoren sind der Schlüssel zu energieeffizientem Rechnen, doch ihre Programmierung wird durch das hierarchische Design und die Vielfalt der hardwarespezifischen Compiler und Bibliotheken erschwert. Deshalb haben wir die Software HAL’s MD-Paket [1, 2] entwickelt, ein effizientes, getestetes und vielseitiges Werkzeug für hochpräzise Simulationen komplexer Teilchenmodelle für die Forschung in der statistischen Physik, den Materialwissenschaften und der agentenbasierten Modellierung. Es bietet nahtlose Arbeitsabläufe zur Berechnung komplexer Observablen aus Teilchenmodellen. Es besitzt einen kleinen E/A-Fußabdruck und nutzt eine effiziente Datenhaltung [3] und dient damit auch als Referenzimplementierung von Algorithmen und in der Lehre als Vorbild für gute Praktiken. Die Codebasis besteht aus etwa 700 Dateien, sie ist frei und quelloffen und unterstützt offene Standards. Aktuelle Entwicklungsziele sind Demonstrationenmaterial für Tutorien, optimierte geometrische Integratoren, Simulation reaktiver Strömungen, Interoperabilität mit Materialmodellen unter Verwendung maschinell erlernter Wechselwirkungspotentiale und die herstellerunabhängige Unterstützung von Beschleunigerhardware [4].
[1] Highly Accelerated Large-scale Molecular Dynamics package (2007–2025), https://halmd.org.
[2] P. H. Colberg and F. Höfling, Comput. Phys. Commun. 182, 1120 (2011).
[3] P. de Buyl, P. H. Colberg, and F. Höfling, Comput. Phys. Commun. 185, 1546 (2014).
[4] V. Skoblin, F. Höfling, and S. Christgau, in 29th PARS Workshop (2023), vol. 36 of Mitteilungen - Gesellschaft für Informatik e.V., Parallel-Algorithmen und Rechnerstrukturen.
Übersetzt mit Unterstützung von DeepL.com (kostenlose Version)