next up previous contents
Nächste Seite: Netzqualität Aufwärts: Beispiel Vorherige Seite: Beispiel   Inhalt


Laufzeitverhalten

Die Gesamtlaufzeit der parallelen Berechnung setzt sich aus mehreren Teilen zusammen. Ein Teil ist die Netzgenerierung, ein anderer Teil die Geometrieaufteilung. Der restliche Teil setzt sich unter anderem aus dem Einlesen der Daten, Bestimmen der Netzqualität und Ausgeben der Ergebnisdaten zusammen. In Abbildung 4.12 sind die Zeiten für beide Diskretisierungen für jeweils 2 und 32 Prozessoren dargestellt. Das sequentiell ablaufende Teilen der Geometrie dauert bei einer größeren Anzahl von Elementen absolut gesehen länger. Da die Gesamtzeit bei einer höheren Prozessorenanzahl geringer ist, wirkt sich dieser Anteil relativ gesehen noch stärker aus. Die zu vernetzende Fläche ist bei höheren Elementanzahlen kleiner. Hierdurch verringert sich die Zeit für das parallel ablaufende Vernetzen bei größerer Prozessorenanzahl.

Die dargestellten Zeitmessungen wurden auf einem Linux-Cluster mit Pentium-II 350 MHz Prozessoren mit jeweils 128 MB Speicher und einem 100 MBit Switch Netzwerk durchgeführt.

Für Diskretisierung 1 beträgt der Zeitanteil für das Teilen der Geometrie 1.89 % bei zwei Prozessoren und 19.19 % bei 32 Prozessoren. Das parallel ablaufende Vernetzen braucht 75.8 % bzw. 67.6 % der Laufzeit. Hierdurch ändert sich das Verhältnis ,,Netz generieren`` zu ,,Geometrie teilen`` von $1:40.1$ auf $1:3.5$. Für die Diskretisierung 2 beträgt der Anteil für das Teilen 1.45 % sowie 6.92 % der Zeit und der Anteil für das Netzgenerieren 81.0 % bzw. 72.2 %. Das Verhältnis Netzgenerieren zu Geometrieteilen ist daher $1:55.8$ sowie $1:10.4$.

Abbildung 4.13: Speed-up
\begin{figure}
\centerline {\psfig{figure=2D/speed-up-f7.eps,width=100mm}}\end{figure}

Abbildung 4.14: Effizienz
\begin{figure}
\centerline {\psfig{figure=2D/eff-f7.eps,width=100mm}}\end{figure}

In der Effizienz (Abbildung 4.14) und im Speed-up (Abbildung 4.13) schlagen sich diese Verhältnisse nieder. Die Effizienz der Diskretisierung liegt bei zwei Prozessoren bei 96.2 % und bei 32 Prozessoren bei 85.6 %. Bei der Diskretisierung 1 sieht man, dass eine parallele Berechnung des Netzes mit mehr als vier Prozessoren ungünstig ist. Bei mehr als vier Prozessoren fällt die Kurve der Effizienz stark ab, da hier der sequentielle Anteil durch Teilen bzw. Einlesen und Rausschreiben einen zu großen Anteil an der Gesamtzeit beansprucht. Die Effizienz bei 32 Prozessoren liegt daher bei 35.2 %, was einer Leistung von nur 11.2 Prozessoren entspricht.


next up previous contents
Nächste Seite: Netzqualität Aufwärts: Beispiel Vorherige Seite: Beispiel   Inhalt