Ray log

Ray日志体验
使用Ray运行任务和服务的时候难免会遇到一些问题,这个时候需要查找日志进行排查,但是Ray的日志感觉是茫茫多:Driver logs、Job logs、Worker logs等等。
Ray 日志相关文档介绍:Logging — Ray 2.2.0
使用kuberay进行部署的时候如果有问题还需要翻operator的日志,甚至有时候RayService部署失败不会显示原因,一直hung住,还要到ray worker pod里面翻日志。
使用下来感觉查找日志排查问题特别麻烦,咨询一下有什么日志使用和体验上的优化和建议吗 :slightly_smiling_face:

有人讨论这个问题吗 :upside_down_face:

这个话题比较大,也不好全面的回答。
目前从我们个人的问题排查来看,基本还是非常依赖于对ray的运行流程比较清晰的情况下,去查找日志。

@建议还是最好当出现问题的时候,我们抛出来梳理讨论,最佳实践的银弹短期之内还不好总结。