调度到含有特定资源或标签的节点,但不消耗对应的资源
|
|
3
|
797
|
March 6, 2023
|
运行时指定自定义资源
|
|
3
|
1111
|
February 23, 2023
|
Ray在执行训练过程中频繁出现SYSTEM_ERROR_EXIT0
|
|
9
|
2374
|
February 21, 2023
|
本地提交任务给remote cluster的方法
|
|
1
|
766
|
February 21, 2023
|
ray timeline执行失败
|
|
4
|
625
|
February 16, 2023
|
ray是不是支持故障恢复?如果执行task的节点oom了,该task不应该是转移到其他正常的节点重新执行吗?为什么测试下来,发现了driver端报错了。
|
|
4
|
1756
|
February 15, 2023
|
ray service 性能分析
|
|
2
|
955
|
February 14, 2023
|
如何检测ray的actor任务在其它节点上运行
|
|
3
|
719
|
February 14, 2023
|
如何让Actor的task任务并行执行
|
|
3
|
1243
|
February 14, 2023
|
Ray Woker Node Object Memory 为0的问题
|
|
1
|
637
|
February 13, 2023
|
在ray C++ 远程调用的参数中如何使用自定义的数据类型? 比如struct
|
|
1
|
608
|
February 10, 2023
|
Actor的get方法效率很差,是否正常
|
|
2
|
664
|
February 9, 2023
|
Ray Plasma数据Put操作在内存中放大十几倍,求教原因
|
|
10
|
1104
|
February 3, 2023
|
ray 1.8.0运行卡住
|
|
2
|
1768
|
February 3, 2023
|
使用ray 2.2.0版本,运行出错!
|
|
6
|
1794
|
February 3, 2023
|
Java客户端代码可以上传依赖代码,提交Job到ray集群吗
|
|
4
|
704
|
February 1, 2023
|
ray start指定资源cpu,会给raylet预留,如何预留
|
|
3
|
864
|
January 16, 2023
|
使用add_node和remove_node在头节点上添加和删除节点
|
|
1
|
889
|
January 13, 2023
|
Python_ray: worker actor 引用so中的module失败【求助】
|
|
2
|
769
|
January 13, 2023
|
关于Ray C++中 外部代码部署问题
|
|
2
|
478
|
January 12, 2023
|
单节点物理机上多个Ray集群的GPU资源隔离问题
|
|
1
|
1048
|
January 10, 2023
|
ray client主动断开连接后,ray head的gcs中不更新block的demand resource
|
|
7
|
837
|
January 5, 2023
|
多个ray service如何部署维护
|
|
1
|
848
|
January 4, 2023
|
ray集群调度过程中如何支持内存配额策略,类似cgroup 的 memory limit
|
|
2
|
605
|
January 3, 2023
|
ray cluster 启动时候head node 如何不作为计算节点
|
|
4
|
1744
|
January 3, 2023
|
ray集群,国内云部署
|
|
1
|
705
|
January 3, 2023
|
节点间对象传输的实现
|
|
1
|
797
|
December 28, 2022
|