Wie viel Zeit kostet ein Fork in Bash?

Auf einem modernen Linux-System etwa 1–5 Millisekunden pro Fork. Bei 1000 Iterationen mit je einem Fork summiert sich das auf 1–5 Sekunden reinen Fork-Overhead, ohne dass die eigentliche Arbeit berücksichtigt ist.

Wie messe ich, wie viele Forks mein Skript macht?

strace -c -e trace=clone ./skript.sh zeigt die Anzahl der clone-Syscalls (Forks) und deren kumulierte Zeit. Eine hohe clone-Anzahl bei geringer user-Zeit in time ist ein klarer Indikator für Fork-Overhead als Bottleneck.

Wie ersetze ich basename in einer Schleife durch einen Builtin?

${f##*/} ist die Bash-Parameter-Expansion für basename: entfernt alles bis einschließlich letztem /. ${f%/*} entspricht dirname. Beide sind Builtins ohne Fork.

Wann sollte ich trotzdem externe Tools verwenden?

Für komplexe reguläre Ausdrücke (PCRE), Floating-Point-Arithmetik, Stream-Verarbeitung großer Dateien und Aufgaben, für die awk oder sed die deutlich lesbarere Lösung sind. Das Ziel ist nicht, externe Tools zu vermeiden, sondern sie einmal auf der gesamten Eingabe aufzurufen statt pro Iteration.

Wie implementiere ich Caching für wiederholte Berechnungen?

Einfachstes Caching: readonly VAR=$(teurer_befehl) am Skriptanfang. Für TTL-Caching eine Datei mit Timestamp und gespeichertem Wert nutzen, Gültigkeit gegen aktuellen Timestamp prüfen. Für Funktions-Memoization ein assoziatives Array als Cache-Map.

Warum gehen Variablen nach einer while-Schleife mit Pipe verloren?

Jedes Pipe-Element läuft in einer eigenen Subshell. Variablenzuweisungen im while-Body sind nur in dieser Subshell sichtbar. Lösung: < <(befehl) statt befehl | while — der while-Body läuft dann in der Parent-Shell.

Wie profilie ich ein Bash-Skript auf Zeilenebene?

PS4='+ $(date +%s%3N) ${BASH_SOURCE[0]}:${LINENO}: ' setzen, dann bash -x skript.sh 2>trace.log. Die Timestamps in trace.log zeigen, zwischen welchen Zeilen die meiste Zeit vergeht.

Bringt Parallelisierung immer eine bessere Performance?

Nein. Parallelisierung hilft bei unabhängigen Aufgaben mit CPU- oder Netzwerk-Bottleneck. Bei sequentiellen Abhängigkeiten oder wenn alle Jobs denselben I/O-Engpass teilen (z.B. einzelne HDD), kann Parallelisierung die Performance verschlechtern. Immer erst messen.

Performance von Bash-Skripten verbessern

Q: Erzeugt jede Pipe eine Subshell?

Ja. Jedes Element einer Pipe läuft in einer eigenen Subshell. Variablenzuweisungen im letzten Pipe-Element sind nach der Pipe verloren. Für while-Schleifen, die Variablen setzen: < <(befehl) statt befehl | while verwenden.

Q: Ist $(( )) eine Subshell?

Nein. $(( )) ist arithmetische Expansion — eine Subshell. (( )) ohne $ ist ein arithmetischer Befehl — kein Fork, kein Kindprozess. Für Berechnungen, die keinen Rückgabewert als String benötigen, immer (( )) bevorzugen.

Q: Wie profilie ich ein Bash-Skript auf Zeilenebene?

PS4='+ $(date +%s%3N) ${BASH_SOURCE[0]}:${LINENO}: ' setzen, dann bash -x skript.sh 2>trace.log. Die Timestamps in trace.log zeigen, zwischen welchen Zeilen die meiste Zeit vergeht.

Bash · Performance · Builtins · Subshell · DevOps

Performance von Bash-Skripten verbessern
Subshell-Vermeidung, Builtins, Caching und Fork-Overhead messen

Ein Shell-Skript, das für tausend Dateien tausend externe Prozesse startet, ist kein Performance-Problem — es ist ein Design-Problem. Wer versteht, wie viel ein Fork kostet, welche Operationen Builtins abdecken und wie Caching in der Shell funktioniert, schreibt Skripte, die Sekunden statt Minuten benötigen.

15 Min. Lesezeit Subshell · Builtins · Fork · Caching · Profiling Bash 4.x · 5.x · Linux · macOS

Inhaltsverzeichnis

1. Wo in Bash-Skripten Performance verloren geht
2. Fork-Overhead verstehen und messen
3. Subshell-Vermeidung: welche Konstrukte Subshells erzeugen
4. Builtins statt externe Prozesse: was Bash selbst kann
5. String-Operationen ohne externe Tools
6. Caching in Shell-Skripten: Ergebnisse wiederverwenden
7. Profiling mit time, strace und bash -x
8. Schleifen-Optimierung: externe Tools aus Schleifen raushalten
9. Subshell vs. Builtin im Direktvergleich
10. Zusammenfassung
11. FAQ

1. Wo in Bash-Skripten Performance verloren geht

Die häufigste Ursache für schlechte Performance von Bash-Skripten ist nicht die Shell selbst, sondern der unkontrollierte Einsatz externer Prozesse in Schleifen. Jedes $(befehl), jedes echo "text" | sed und jedes cat datei | awk in einer Schleife startet einen neuen Kindprozess — mit einem vollständigen fork-exec-Syscall-Zyklus. Auf einem modernen Linux-System kostet ein einzelner Fork etwa 1–5 Millisekunden. Eine Schleife, die für jede von tausend Dateien ein $(basename) aufruft, verbringt damit allein durch Fork-Overhead eine bis fünf Sekunden — ohne die eigentliche Arbeit geleistet zu haben.

Die zweite große Ursache schlechter Bash-Performance sind unnötige Subshells in Pipes. Jedes Element einer Pipe läuft in einer eigenen Subshell. Die Konstruktion cat datei | grep muster | wc -l startet drei Prozesse, wo grep -c muster datei einen startet. Der Unterschied bei einer einzelnen Ausführung ist marginal — in einer Schleife über tausend Dateien ist er messbar. Das Verständnis, welche Shell-Konstrukte implizit Subshells erzeugen, ist die Grundlage für gezielte Performance-Verbesserungen in Bash-Skripten.

Die dritte Ursache ist das Fehlen von Caching für wiederholte Berechnungen. Wer in einer Schleife dreimal $(date +%s) aufruft, startet dreimal den date-Prozess, obwohl ein einmaliger Aufruf am Schleifenanfang ausreicht. Analog werden in vielen Skripten Befehle wie $(hostname), $(whoami) oder $(git rev-parse HEAD) wiederholt aufgerufen, obwohl ihr Ergebnis sich innerhalb des Skriptlaufs nicht ändert. Das einmalige Cachen dieser Werte in einer Variable ist eine der einfachsten und wirkungsvollsten Performance-Optimierungen für Bash-Skripte.

2. Fork-Overhead verstehen und messen

Um den Fork-Overhead in Bash-Skripten zu verstehen und zu messen, hilft ein direkter Benchmark. Die Shell bietet mit time ein einfaches Werkzeug: time for i in {1..1000}; do true; done misst den Overhead einer Shell-Builtin (true ist in Bash ein Builtin). Im Vergleich dazu: time for i in {1..1000}; do /bin/true; done misst denselben Schleifeninhalt mit dem externen /bin/true. Der Unterschied — typischerweise ein Faktor 10 bis 50 — macht den reinen Fork-Overhead sichtbar, losgelöst von der eigentlichen Aufgabe.

Für detailliertere Performance-Messung in Bash-Skripten bietet strace -c ./skript.sh eine Systemaufruf-Statistik: Wie viele clone-Syscalls (Forks) wurden ausgeführt, wie viel Zeit entfiel auf sie? Das macht unsichtbaren Overhead sichtbar. Eine Schleife mit 1000 Iterationen, die jeweils einen Fork enthält, erscheint in strace -c als 1000 clone-Aufrufe und zeigt sofort, dass hier eine Optimierung nötig ist. Die Bash-Option set -x zeigt jeden ausgeführten Befehl — wer dabei sieht, dass bei einer Iteration eines Schleifen-Bodys fünf oder mehr externe Befehle starten, hat einen starken Indikator für vermeidbaren Fork-Overhead.


#!/usr/bin/env bash
# benchmark-fork.sh — Measure fork overhead vs. builtin overhead
set -euo pipefail

ITERATIONS=1000

echo "=== Benchmark: Fork overhead vs. Bash Builtin ==="

# Method 1: External process per iteration (fork + exec each time)
time_external() {
  local count=0
  for (( i = 0; i < ITERATIONS; i++ )); do
    count="$(echo $((count + 1)))"  # Spawns a subshell + /bin/echo
  done
  echo "External result: $count"
}

# Method 2: Pure Bash arithmetic builtin (no fork)
time_builtin() {
  local count=0
  for (( i = 0; i < ITERATIONS; i++ )); do
    (( count++ ))  # Bash arithmetic builtin — zero fork overhead
  done
  echo "Builtin result: $count"
}

echo "--- External process per iteration ---"
time time_external

echo ""
echo "--- Bash arithmetic builtin ---"
time time_builtin

# Measure: how many forks does a script make?
# strace -c -e trace=clone ./script.sh
# Look at 'clone' syscall count in the summary

3. Subshell-Vermeidung: welche Konstrukte Subshells erzeugen

Nicht alle Shell-Konstrukte, die wie Subshells aussehen, erzeugen tatsächlich eine. Und umgekehrt: Einige harmlos aussehende Konstrukte erzeugen implizit eine Subshell. Das Verstehen dieser Unterschiede ist zentral für die Performance-Verbesserung von Bash-Skripten. Klare Subshell-Erzeuger: $(befehl), Pipe-Elemente, explizite (befehl)-Gruppen und <(process substitution). Keine Subshell: { befehl; } (geschweifte Klammern), ((arithmetik)), [[ bedingung ]] und Funktionsaufrufe in derselben Shell.

Besonders trügerisch ist die Pipe: while read line; do ...; done < <(befehl) erzeugt eine Subshell für den befehl in Process Substitution, aber der while-Body läuft in der Eltern-Shell — Variablenzuweisungen im Body sind nach der Schleife sichtbar. Im Gegensatz dazu: befehl | while read line; do ...; done erzeugt sowohl für befehl als auch für den while-Body Subshells. Variablenzuweisungen im Pipe-while-Body sind nach der Schleife verloren — eine häufige Quelle von Bugs in Skripten, die versuchen, Ergebnisse aus der Schleife zu sammeln. Für Bash-Performance wie für Korrektheit ist < <() die bessere Wahl.

4. Builtins statt externe Prozesse: was Bash selbst kann

Bash verfügt über eine umfangreiche Sammlung von Builtins, die ohne Fork auskommen und für häufige Aufgaben externe Tools ersetzen. Das wichtigste Set für die Performance-Verbesserung von Bash-Skripten: Arithmetik mit (( )) statt expr oder bc; String-Länge mit ${#var} statt echo -n "$var" | wc -c; Substring-Extraktion mit ${var:offset:length} statt cut; Musterersetzung mit ${var//alt/neu} statt sed; Regex-Prüfung mit [[ "$var" =~ regex ]] statt grep. Jeder dieser Builtins spart einen vollständigen Fork-Exec-Zyklus pro Aufruf.

Für Dateioperationen bietet Bash read, printf und hier-Strings als Builtins. printf ist in Bash ein Builtin (im Gegensatz zu /usr/bin/printf), ebenso echo. Das bedeutet: printf "%s\n" "$var" startet keinen Kindprozess. read -r line <<< "$string" (here-string) liest einen String als Eingabe ohne Subshell. Diese Kombination ersetzt häufig echo "$string" | read var — was eine Pipe mit Subshell erzeugt — durch eine reine Builtin-Operation. Für mathematische Operationen über Ganzzahlen reicht (( )) in Bash vollständig aus; erst für Gleitkomma-Arithmetik oder große Zahlen ist bc oder awk nötig.


#!/usr/bin/env bash
# builtins-vs-external.sh — Replace external tools with Bash builtins
set -euo pipefail

TEXT="Hello, World! This is a sample string for testing Bash builtins."

echo "=== String operations: Builtin vs. External ==="

# String length
len_external=$(echo -n "$TEXT" | wc -c)    # Fork: echo + wc
len_builtin="${#TEXT}"                      # No fork: Bash builtin
echo "Length (external): $len_external | (builtin): $len_builtin"

# Substring extraction
sub_external=$(echo "$TEXT" | cut -c1-5)   # Fork: echo + cut
sub_builtin="${TEXT:0:5}"                  # No fork: parameter expansion
echo "Substr (external): $sub_external | (builtin): $sub_builtin"

# String replacement
rep_external=$(echo "$TEXT" | sed 's/sample/example/g')  # Fork: echo + sed
rep_builtin="${TEXT//sample/example}"                     # No fork: expansion
echo "Replace (external): $rep_external"
echo "Replace (builtin):  $rep_builtin"

# Uppercase conversion (Bash 4.0+)
upper_external=$(echo "$TEXT" | tr '[:lower:]' '[:upper:]')  # Fork
upper_builtin="${TEXT^^}"                                     # No fork
echo "Upper (external): $upper_external"
echo "Upper (builtin):  $upper_builtin"

# Arithmetic
a=42; b=17
sum_external=$(expr "$a" + "$b")  # Fork
sum_builtin=$(( a + b ))          # No fork (arithmetic expansion uses subshell)
(( sum_pure = a + b ))            # No fork, no subshell — fastest
echo "Sum: $sum_external | $sum_builtin | $sum_pure"

5. String-Operationen ohne externe Tools

String-Manipulation ist eine der häufigsten Quellen unnötiger Prozesse in Bash-Skripten. Für einfache Transformationen bietet Bash's Parameter-Expansion alles, was benötigt wird — und das ohne einen einzigen Fork. Das Muster ${var#muster} entfernt das kürzeste Präfix, ${var##muster} das längste. ${var%muster} und ${var%%muster} tun dasselbe für Suffixe. Diese vier Expansionen ersetzen in vielen Skripten regelmäßige sed- oder awk-Aufrufe für einfache Pfad- und Dateinamen-Manipulation. Die Bash-Performance verbessert sich direkt proportional dazu, wie viele dieser Expansionen in Schleifen externe Befehle ersetzen.

Für komplexere String-Operationen, die echte Regex benötigen, ist [[ "$var" =~ (regex) ]] mit den BASH_REMATCH-Gruppen das korrekte Builtin. BASH_REMATCH[0] enthält den vollständigen Match, BASH_REMATCH[1] die erste Gruppe. Das ersetzt Aufrufe wie echo "$var" | grep -oP '(regex)' in Loops durch eine Builtin-Operation ohne Fork. Wichtig: POSIX-Character-Classes funktionieren in Bash-Regex, Perl-Regex (PCRE) jedoch nicht — wer \d, \w etc. braucht, muss bei grep -P bleiben, auch wenn das einen Fork bedeutet.

6. Caching in Shell-Skripten: Ergebnisse wiederverwenden

Caching in der Shell bedeutet: den Wert eines teuren Befehls einmal in einer Variable speichern und alle weiteren Verwendungen gegen die Variable referenzieren statt den Befehl erneut aufzurufen. Das klingt trivial, wird aber in der Praxis häufig ignoriert. Besonders häufig gesehen: $(hostname), $(date +%Y%m%d), $(id -u), $(git rev-parse HEAD) werden in einem Skript fünf- oder zehnmal aufgerufen. Jeder Aufruf startet einen neuen Prozess. Ein einmaliges Cachen — readonly HOSTNAME_CACHE="$(hostname)" am Skriptanfang — eliminiert alle folgenden Forks für denselben Wert.

Für Ergebnisse, die sich während des Skriptlaufs ändern können, aber nur selten neu berechnet werden müssen, eignet sich ein einfaches TTL-basiertes Caching mit temporären Dateien. Das Muster: Prüfe, ob eine Cache-Datei existiert und jünger als N Sekunden ist; falls ja, lies aus der Cache-Datei; falls nein, führe den Befehl aus, speichere das Ergebnis und setze den Timestamp. Dieses Muster ist besonders nützlich für Skripte, die wiederholt ausgeführt werden — zum Beispiel Monitoring-Skripte, die alle 30 Sekunden laufen und dabei wiederholte nslookup- oder curl-Aufrufe auf dasselbe Ziel mit gecachten Ergebnissen ersetzen können.


#!/usr/bin/env bash
# caching-patterns.sh — Result caching to avoid repeated expensive calls
set -euo pipefail

CACHE_DIR="/tmp/bash_cache_$$"
mkdir -p "$CACHE_DIR"
trap 'rm -rf "$CACHE_DIR"' EXIT

# Simple variable caching — cache expensive calls once at script start
readonly CURRENT_DATE="$(date +%Y%m%d)"
readonly CURRENT_USER="$(id -un)"
readonly GIT_HEAD="$(git -C /var/www/html rev-parse --short HEAD 2>/dev/null || echo 'unknown')"
readonly DISK_FREE="$(df -h / | awk 'NR==2{print $4}')"

echo "Date: $CURRENT_DATE | User: $CURRENT_USER | Git: $GIT_HEAD | Disk: $DISK_FREE"

# TTL-based file cache — reuse result for N seconds
cached_dns_lookup() {
  local host="$1"
  local ttl="${2:-300}"  # 5 minutes default
  local cache_file="${CACHE_DIR}/dns_${host//[^a-zA-Z0-9]/_}"

  if [[ -f "$cache_file" ]]; then
    local age=$(( $(date +%s) - $(stat -c %Y "$cache_file") ))
    if (( age < ttl )); then
      cat "$cache_file"
      return 0
    fi
  fi

  # Cache miss: perform lookup and store result
  local result
  result="$(dig +short "$host" A | head -1)"
  printf '%s' "$result" > "$cache_file"
  echo "$result"
}

# Memoized function — remember results per argument
declare -A _memo_cache=()
memo_get_file_hash() {
  local file="$1"
  if [[ -z "${_memo_cache[$file]+_}" ]]; then
    _memo_cache["$file"]="$(sha256sum "$file" | cut -d' ' -f1)"
  fi
  echo "${_memo_cache[$file]}"
}

# Use memo cache in a loop — each file hashed only once
for f in /etc/passwd /etc/hosts /etc/hostname; do
  echo "$(memo_get_file_hash "$f")  $f"
done

7. Profiling mit time, strace und bash -x

Gezieltes Profiling ist die Voraussetzung für sinnvolle Performance-Verbesserungen in Bash-Skripten. Ohne zu messen, welche Teile eines Skripts tatsächlich langsam sind, riskiert man, Zeit in Optimierungen zu investieren, die kaum Auswirkungen haben. Das grundlegendste Werkzeug ist das Bash-Builtin time: time ./skript.sh zeigt real (Wanduhrzeit), user (CPU-Zeit im Userspace) und sys (CPU-Zeit für Syscalls). Ein Skript, das hohe sys-Zeit bei niedrigem user hat, ist ein starker Indikator für exzessiven Fork-Overhead — viele Syscalls für Prozess-Erzeugung, wenig eigentliche Berechnungsarbeit.

Für detaillierteres Profiling bietet Bash das PS4-Variable-Muster in Kombination mit set -x. Mit PS4='+ $(date +%s%3N) ${BASH_SOURCE[0]}:${LINENO}: ' wird vor jeder Trace-Zeile ein Millisekunden-Timestamp ausgegeben. Das Ergebnis in eine Datei umleiten (bash -x skript.sh 2>trace.log) und dann analysieren: Wo liegen die größten Zeitsprünge zwischen zwei aufeinanderfolgenden Trace-Zeilen? Das markiert die langsamsten Befehle. Für noch feineres Profiling bietet strace -c eine Systemaufruf-Statistik, die zeigt, welche Syscalls am häufigsten und teuersten sind.

8. Schleifen-Optimierung: externe Tools aus Schleifen raushalten

Die wichtigste Faustregel für Bash-Performance lautet: externe Tools aus Schleifen heraushalten. Wenn ein Tool auf eine Liste von Eingaben angewendet werden soll, ist es fast immer effizienter, dem Tool die gesamte Liste auf einmal zu übergeben, statt es in einer Schleife für jede Eingabe einzeln aufzurufen. sed 's/foo/bar/g' *.txt verarbeitet alle Dateien in einem Prozess. for f in *.txt; do sed 's/foo/bar/g' "$f" > "${f%.txt}.new"; done startet für jede Datei einen neuen sed-Prozess — bei hundert Dateien hundert Forks.

Für Fälle, in denen die Schleife unvermeidlich ist — weil jede Datei unterschiedlich verarbeitet werden muss — sollte man prüfen, ob innerhalb des Schleifen-Bodys alle externen Aufrufe durch Builtins ersetzt werden können. Ein typisches Muster: Statt $(basename "$f") in der Schleife nutzt man ${f##*/}, statt $(dirname "$f") nutzt man ${f%/*}, statt $(echo "${name}" | tr '[:upper:]' '[:lower:]') nutzt man ${name,,}. Jede dieser Ersetzungen eliminiert einen Fork pro Schleifen-Iteration — bei tausend Iterationen tausend eingesparte Forks.

9. Subshell vs. Builtin im Direktvergleich

Die folgende Tabelle zeigt die häufigsten Antipattern bei der Bash-Performance und die entsprechenden Builtin-Alternativen. Alle Builtin-Varianten erzeugen keinen Fork und sind damit unabhängig von der Systemlast zuverlässig schnell.

Aufgabe	Subshell / Extern (langsam)	Bash Builtin (schnell)	Forks gespart
String-Länge	`$(echo -n "$s" \| wc -c)`	`${#s}`	2 (echo + wc)
Dateiname ohne Pfad	`$(basename "$f")`	`${f##*/}`	1 (basename)
Kleinbuchstaben	`$(echo "$s" \| tr A-Z a-z)`	`${s,,}` (Bash 4.0+)	2 (echo + tr)
Addition	`$(expr $a + $b)`	`(( sum = a + b ))`	1 (expr)
Regex-Prüfung	`echo "$s" \| grep -qP 'regex'`	`[[ "$s" =~ regex ]]`	2 (echo + grep)
Dateiinhalt lesen	`$(cat datei)`	`read -r var < datei`	1 (cat)

Nicht alle externen Tools lassen sich durch Builtins ersetzen. Für komplexe Regexp, Floating-Point-Arithmetik oder Stream-Verarbeitung großer Dateien sind awk, sed oder python3 weiterhin die bessere Wahl — einmalig aufgerufen auf der gesamten Eingabe, nicht in einer Schleife pro Element. Die Regel lautet nicht "niemals externe Tools", sondern "externe Tools so selten und mit so viel Eingabe wie möglich aufrufen".

Mironsoft

Shell-Performance-Optimierung, Profiling und Skript-Refactoring

Bash-Skripte, die Minuten brauchen, aber Sekunden sollten?

Wir analysieren bestehende Shell-Skripte mit Profiling-Tools, identifizieren Fork-Overhead und Subshell-Antipattern und refaktorieren sie auf Builtin-basierte Lösungen — mit messbaren Laufzeitgewinnen für eure Deployment- und Batch-Pipelines.

Performance-Audit

Profiling mit strace und bash -x, Identifikation von Fork-Hotspots

Builtin-Refactoring

Externe Prozesse durch Bash-Builtins ersetzen — messbare Laufzeitgewinne

Caching-Strategie

Wiederholte Berechnungen cachen und Schleifenbodies optimieren

Kostenloses Erstgespräch Shell-Performance anfragen

10. Zusammenfassung

Die wichtigsten Hebel zur Performance-Verbesserung von Bash-Skripten sind klar priorisierbar: Zunächst messen, wo die Zeit tatsächlich verloren geht — mit time, strace -c und PS4-Tracing. Dann externe Prozesse in Schleifen durch Builtins ersetzen: Parameter-Expansion statt sed, basename, cut; Bash-Arithmetik statt expr; Regex-Matching mit [[ =~ ]] statt grep. Wiederholte Berechnungen cachen — insbesondere Aufrufe wie hostname, date und git rev-parse, die sich innerhalb eines Skriptlaufs nicht ändern.

Die Subshell-Falle in Pipes vermeiden: Bei while-Schleifen, die Variablen im Body setzen, immer < <(befehl) statt befehl | while verwenden. Externe Tools, die unvermeidlich sind, einmal auf der gesamten Eingabe aufrufen statt in einer Schleife pro Element. Mit diesen Techniken lassen sich Bash-Skripte oft um einen Faktor 5–50 beschleunigen — ohne die Skriptlogik zu verändern, nur durch bessere Tool-Wahl.

Bash-Performance verbessern — Das Wichtigste auf einen Blick

Fork-Overhead messen

strace -c ./skript.sh zeigt clone-Syscall-Anzahl. PS4='$(date +%s%3N)' + bash -x zeigt Millisekunden pro Befehl.

Builtins nutzen

${#var}, ${var##*/}, ${var,,}, (( )), [[ =~ ]] — keine Forks, kein Kindprozess, sofort verfügbar.

Caching

Teure Befehle einmal aufrufen und in readonly-Variablen cachen. TTL-Dateicache für Werte mit kurzer Gültigkeit.

Schleifen-Regel

Externe Tools aus Schleifen heraus, auf gesamte Eingabe anwenden. < <() statt Pipe-while für Variable-Sichtbarkeit.

11. FAQ: Performance von Bash-Skripten verbessern

1Wie viel kostet ein Fork in Bash?

1–5 Millisekunden pro Fork auf modernem Linux. 1000 Iterationen mit je einem Fork: 1–5 Sekunden reiner Overhead ohne eigentliche Arbeit.

2Fork-Anzahl eines Skripts messen?

strace -c -e trace=clone ./skript.sh zeigt clone-Syscall-Anzahl und kumulierte Zeit. Hohe clone-Zahl bei geringer user-Zeit = Fork-Overhead als Bottleneck.

3Erzeugt jede Pipe eine Subshell?

Ja. Jedes Pipe-Element läuft in eigener Subshell. Variablen im while-Body gehen verloren. Lösung: < <(befehl) statt Pipe-while.

4Ist $(( )) eine Subshell?

$(( )) ist arithmetische Expansion mit Subshell. (( )) ohne $ ist arithmetischer Befehl — kein Fork. Für Berechnungen ohne Rückgabewert als String immer (( )) bevorzugen.

5basename als Builtin ersetzen?

${f##*/} entspricht basename (entfernt Pfad). ${f%/*} entspricht dirname. Beide sind Parameter-Expansionen ohne Fork.

6Wann trotzdem externe Tools verwenden?

PCRE, Floating-Point-Arithmetik, große Datei-Streams. Regel: einmal auf gesamter Eingabe aufrufen, nicht pro Iteration in Schleife.

7Caching für wiederholte Berechnungen?

readonly VAR=$(teurer_befehl) einmal am Anfang. TTL-Datei-Cache für Werte mit kurzer Gültigkeit. Assoziatives Array als Memoization-Cache für Funktionen.

8Variablen nach Pipe-while verloren?

while-Body in Pipe läuft in Subshell — Variablen gehen verloren. Lösung: < <(befehl) — while-Body läuft in Parent-Shell, Variablen bleiben erhalten.

9Skript auf Zeilenebene profilieren?

PS4='+ $(date +%s%3N) ${BASH_SOURCE[0]}:${LINENO}: ' setzen, dann bash -x skript.sh 2>trace.log. Größte Zeitsprünge zwischen Zeilen = Bottlenecks.

10Bringt Parallelisierung immer bessere Performance?

Nein. Nur bei unabhängigen Aufgaben mit CPU- oder Netzwerk-Bottleneck. Bei gemeinsamen I/O-Engpässen kann Parallelisierung verschlechtern. Immer erst messen.