整体上看资源还可以,就都变成ray::IDLE进程了。
我看log里gcs_job_manager.cc:229: Failed to get is_running_tasks from core worker: GrpcUnavailable: RPC Error message: failed to connect to all addresses; last error: UNKNOWN会有这种错误。
以及你知道Global stats: 3744864 total (1 active) 里Global stats后面的数值是代表的什么。感谢你的建议