Autoscaling
Zuletzt aktualisiert: 3. April 2026
In der Runtime Configuration legst du fest, wie viele Ressourcen dein App Service nutzen darf und wie er bei Last skaliert.

Resource Limits
Resource Limits definieren, wie viel CPU und Memory jede Instanz deines App Services nutzen kann. Der CPU Request gibt an, wie viele Millicores pro Container reserviert werden (1000m = 1 Core, Minimum: 50). Das Memory Limit bestimmt den maximal zugewiesenen Arbeitsspeicher in MiB (Minimum: 64 MiB).
Autoscaling (HPA)
Du kannst zwischen zwei Modi wählen: Mit deaktiviertem Autoscaling läuft dein App Service mit einer festen Anzahl an Instanzen. Aktivierst du Autoscaling, skaliert Kubernetes die Anzahl der Instanzen automatisch basierend auf der CPU-Auslastung (Zielwert: 80%). Du legst dabei die minimale und maximale Anzahl an Instanzen fest.
Änderungen werden beim nächsten Deployment wirksam.
