Anleitung zur Benutzung der Parallelrechner am PC2 Paderborn Center for Parallel Computing { PC2: Das PC2 ist ein Institut an der Universitat-GH Paderborn, welches mehrere Parallelrechner zur allgemeinen Verfugung anbietet: Rechner Prozessortyp MHz MByte Prozessoren Bemerkungen SC-320 T800 25 4 320 Prozessornetze frei kon gurierbar GCel T805 30 4 1024 GC/PP MPC 601 80 64 32 je zwei PowerPC in einem Knoten Einloggen: rlogin -l <username> pc2gate Kommandos der CCS-Schnittstelle: Die Ressourceverwaltung wird durch CCS (Computing Center Software) geregelt. Die Kommandos der Schnittstelle zu den Parallelrechnern lauten: ccsalloc Hiermit kann man Prozessornetze anfordern, Programme starten, Reservierungen machen und Batchjobs starten. ccsrun Startet Programme, nachdem zuvor mit ccsalloc ein Prozessornetz geholt wurde. ccsbind Stellt die Verbindung zu einem zuvor geschalteten Prozessornetz her (falls diese unterbrochen war, bzw. zu uber eine Reservierung geschaltet wurde). ccskill Stoppt laufende Programme bzw. gibt Prozessornetze vorzeitig frei. ccsinfo Liefert den aktuellen Status der eigenen Netze bzw. Informationen uber andere Benutzer und die von denen gehaltenen Ressourcen. ccsgis Ein X-Programm zum betrachten der Queue, d.h. aller aktuellen und beantragten Ressourceanforderungen fur die entsprechenden Rechner. Das Starten von Programmen: Nach dem Einloggen in Paderborn verschat man sich zunachst einen Uberblick uber die freien Ressourcen. Das Kommando ccsinfo -c liefert den Status der beiden durch CCS verwalteten Rechner. Dies ist zum einen der GCel (gcel), zum anderen der GC/PP (gcpp). ccsinfo -q zeigt den Status der Queues, in denen die laufenden und wartenden Ressourceanforderungen fur beide Maschinen auftauchen. Weitere Informationen uber die anderen Nutzer und die von ihnen belegten Ressourcen liefert ccsinfo -u, insbesondere kann man an der Ausgabe auch sehen, wie lang die Dauer der einzelnen Ressourceanforderungen ist. Auskunft uber die eigenen Ressourcen liefert ccsinfo -a. 1 Hat man nun ein Programm hier in Osnabruck entwickelt und getestet, so mu man lediglich das Binary per ftp nach Paderborn schaen und kann es auf den dortigen Parallelrechnern ausfuhren. Die Syntax fur das Kommando ccsalloc zum Anfordern und anschlieendem Ausfuhren lautet: ccsalloc -n <nprocs> -m <machine> -t <time> <worker> <prog> <args>] Als <machine> sollte gcel oder gcpp angegeben werden, als <worker> parix oder mpi. Die Zeit kann in Stunden oder Minuten (h bzw. m) angegeben werden. Die Ressourcen werden { falls moglich { sofort bereitgestellt, ansonsten an die entsprechende Queue angehangt. Sobald die Anforderung erfullt wird, wird das Programm gestartet. Direkt nach Programmende bzw. spatestens nach der unter <time> angegebenen Zeit werden die Prozessoren wieder freigegeben. Der Programmlauf kann mittels Ctrl-C abgebrochen werden, Ctrl-Z schickt den Programmlauf in den Hintergrund, die Ausgabe wird in ein File umgeleitet, durch das Kommando ccsbind kann dieses wieder ruckgangig gemacht werden. Ausgaben konnen durch die Option -o <file> in ein File umgelenkt werden. Das Abarbeiten von Batch-Files ist ebenfalls moglich: ccsalloc -f batchfile -o outfile -m gcel -n 256 -t 4h -name TEST Hier werden auf dem GCel fur maximal vier Stunden 256 Prozessoren geschaltet, die Kommandos im File batchfile ausgefuhrt und die Ausgabe in das File outfile umgelenkt. Das File batchfile konnte etwa den folgenden Inhalt haben: parix parix parix parix prog1.px prog2.px prog1.px prog2.px 30 30 10 10 40 40 10 10 30 30 20 20 Virtuelle Prozessoren: Ein Knoten des GC/PowerPlus (GC/PP) besteht aus zwei Motorola MPC601 und vier Inmos T805 Prozessoren. Fur PARIX besteht jeder Knoten nur aus einem Prozessor, hat in Wirklichkeit jedoch zwei MPC601, die { etwa durch mehrere parallele Threads { genutzt werden konnen. Um beide Prozessoren auszunutzen sollte man mit virtuellen Prozessoren arbeiten. Hierzu mu vor dem Linken des Programmes die Environment-Variable PX USEVP auf 1 gesetzt werden, damit die entsprechenden Versionen der Parix-Bibliotheken verwendet werden. Ein Programmaufruf lautet anschlieend etwa: ccsalloc -n 16 -t 1h -m gcpp parix -vrun v 8 4 prog.px Hier werden auf 16 Knoten des GCPP 32 Kopien des Programmes prog.px gestartet und tatsachlich parallel ausgefuhrt. Weitere Informationen zu CCS in den entsprechenden Manual-Pages oder unter: http://www.uni-paderborn.de/pcpc/ccs/index.html 2