【Ray使用环境】生产
【Ray版本和类库】
Ray: 2.0.0
【问题描述】
我们的ray集群初始化有几个worker,但是当ray job达到一定量后,worker不能自动扩缩容。
我们的ray worker有配置如下
workerGroupSpecs:
- rayStartParams:
block: “true”
node-ip-address: “$MY_POD_IP”
redis-password: “LetMeInRay”
replicas: 2
minReplicas: 1
maxReplicas: 10
groupName: cpu-only-group