Horizontal Pod Autoscaling,简称HPA,是Kubernetes中实现POD水平自动伸缩的功能。自动扩展主要分为两种:
- 水平扩展(scale out),针对于实例数目的增减
- 垂直扩展(scal up),即单个实例可以使用的资源的增减, 比如增加cpu和增大内存
HPA属于前者。它可以根据CPU使用率或应用自定义metrics自动扩展Pod数量(支持 replication controller、deployment 和 replica set)
-
Heapster: heapster收集Node节点上的cAdvisor数据,并按照kubernetes的资源类型来集合资源。但是在v1.11中已经被废弃(heapster监控数据可用,但HPA不再从heapster拿数据)
-
metric-server: 在v1.8版本中引入,官方将其作为heapster的替代者。metric-server依赖于kube-aggregator,因此需要在apiserver中开启相关参数。v1.11中HPA从metric-server获取监控数据
- 1.创建HPA资源,设定目标CPU使用率限额,以及最大、最小实例数, 一定要设置Pod的资源限制参数: request, 负责HPA不会工作。
- 2.控制管理器每隔30s(可以通过–horizontal-pod-autoscaler-sync-period修改)查询metrics的资源使用情况
- 3.然后与创建时设定的值和指标做对比(平均值之和/限额),求出目标调整的实例个数
- 4.目标调整的实例数不能超过1中设定的最大、最小实例数,如果没有超过,则扩容;超过,则扩容至最大的实例个数
- 1.6-1.10版本默认使用heapster
- 1.11版本及以上默认使用metric-server
1.部署和运行php-apache并将其暴露成为服务
2.创建HPA
如果为1.8及以下的k8s集群,指标正常,如果为1.11集群,需要执行如下操作。
4.向php-apache服务增加负载,验证自动扩缩容 启动一个容器,并通过一个循环向php-apache服务器发送无限的查询请求(请在另一个终端中运行以下命令)
5.观察HPA是否生效