关于“RayCore&RayClusters”类别
|
|
0
|
413
|
2022 年12 月 14 日
|
单节点上GPU类型异构情况下是否支持将task调度到指定类型的GPU上
|
|
0
|
27
|
2025 年8 月 6 日
|
单节点物理机上多个Ray集群的GPU资源隔离问题
|
|
2
|
1153
|
2025 年8 月 5 日
|
ray java api 远程提交task时报错
|
|
1
|
24
|
2025 年7 月 29 日
|
容器中Java程序初始化连接另一个容器中Ray实例报错,大佬帮看看
|
|
3
|
1757
|
2025 年7 月 29 日
|
为什么有些rayjob的JOB id不存在
|
|
1
|
129
|
2025 年4 月 28 日
|
提交的job的执行顺序不是先到先得,后提交的任务先运行
|
|
1
|
317
|
2025 年4 月 15 日
|
关于在Cluster下Task重复执行的问题
|
|
2
|
279
|
2025 年4 月 14 日
|
c++ remote函数调用如何传入vector<ObjectRef>
|
|
1
|
199
|
2025 年4 月 14 日
|
[求助] 不同网络下ray节点无法工作(丢失心跳导致node被标为dead)
|
|
1
|
711
|
2024 年12 月 18 日
|
求助,ray cpu任务越跑越慢的可能原因
|
|
3
|
1258
|
2024 年11 月 21 日
|
求助,kuberay的ray cluster怎么加载本地的大模型
|
|
0
|
342
|
2024 年11 月 19 日
|
ray集群800节点规模,head节点gcs内存泄露
|
|
0
|
618
|
2024 年11 月 13 日
|
所有rayserve一直处于DEPLOYING ,重启head节点后才能恢复
|
|
0
|
396
|
2024 年9 月 20 日
|
节点崩溃的可能原因有什么
|
|
0
|
572
|
2024 年9 月 6 日
|
求助,为何我的任务只在head里面执行?
|
|
0
|
473
|
2024 年9 月 2 日
|
求助,使用k8s安装kuberay 的问题
|
|
1
|
546
|
2024 年7 月 24 日
|
ray worker节点资源oom问题
|
|
0
|
1346
|
2024 年7 月 16 日
|
如何加速 ray.get() 从另一个节点获取大对象?
|
|
0
|
695
|
2024 年5 月 24 日
|
actor传输过程中会有残余的隐性内存占用,阻碍后续程序运行?怎么彻底清除内存呢?
|
|
25
|
3146
|
2024 年5 月 23 日
|
Failed to download runtime_env file package
|
|
5
|
2097
|
2024 年5 月 22 日
|
【PlacementGroup】PlacementGroup的Resize能力支持,目前有什么计划或考虑吗?
|
|
0
|
552
|
2024 年4 月 22 日
|
调用ray的c++ api,在在不同节点间传输large data(例如4GB大小),适合用什么数据类型?目前采用vector,太大会报错。另外,速度非常的慢,比起python传输numpy数据,慢了几百倍。
|
|
1
|
589
|
2024 年4 月 18 日
|
runtime_env container启动报错
|
|
0
|
542
|
2024 年4 月 17 日
|
ray task 在同一个 node 上共享内存
|
|
0
|
617
|
2024 年3 月 13 日
|
使用KubeRay,同时每个RayJob启用AutoScaler,导致多个RayJob有资源申请瓶颈
|
|
1
|
675
|
2023 年12 月 13 日
|
现在ray支持在slurm或者其他batch命令模式起来的集群上进行autoscale吗?
|
|
1
|
630
|
2023 年12 月 13 日
|
使用ray client连接远程ray集群,提交shell命令,在ray节点上执行报错
|
|
1
|
1283
|
2023 年12 月 13 日
|
ray-dashboard启动异常
|
|
1
|
1288
|
2023 年12 月 13 日
|
ray 有job queue这类功能么,以及如何实现像 优先级任务调度?
|
|
1
|
844
|
2023 年12 月 13 日
|