Kubernetes Autoscaling Architecture

System Components

1. Metrics Server

Collects resource metrics from kubelets
Exposes metrics through Metrics API
Required for HPA functionality

2. Horizontal Pod Autoscaler

Monitors specified metrics
Calculates desired replica count
Adjusts deployment scale

3. NGINX Deployment

Runs containerized web server
Configured with resource constraints
Scales based on HPA decisions

Workflow

Metrics Server collects utilization data
HPA queries metrics every 15 seconds
HPA calculates desired replica count
Deployment scales pods up/down
Process repeats continuously

Resource Calculations

CPU: Target 65% of requested (50m)

Target CPU per pod = 50m * 0.65 = 32.5m

Memory: Target 1Gi absolute
```
Scale if: avg_memory_usage > 1Gi
```

Scaling Logic

graph TD
    A[Metrics Server] -->|Collect Metrics| B[HPA]
    B -->|Check Thresholds| C{Scale?}
    C -->|Yes| D[Calculate Replicas]
    D -->|Update| E[Deployment]
    C -->|No| F[Wait 15s]
    F -->|Repeat| B

Loading

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ARCHITECTURE.md

ARCHITECTURE.md

Kubernetes Autoscaling Architecture

System Components

1. Metrics Server

2. Horizontal Pod Autoscaler

3. NGINX Deployment

Workflow

Resource Calculations

Scaling Logic

Files

ARCHITECTURE.md

Latest commit

History

ARCHITECTURE.md

File metadata and controls

Kubernetes Autoscaling Architecture

System Components

1. Metrics Server

2. Horizontal Pod Autoscaler

3. NGINX Deployment

Workflow

Resource Calculations

Scaling Logic