职位描述:
团队介绍:批式计算团队负责字节跳动离线数据处理&分布式训练,支撑公司内离线ETL&机器学习等业务场景,涉及的组件包括离线计算引擎Spark/自研分布式训练框架Primus/特征存储Feature Store(如Iceberg)/Ray等。面对字节超大规模的场景,在Spark/Primus/Feature Store/Ray等方面都做了大量的功能&性能优化。Ray作为新一代分布式计算引擎,在字节跳动内部支持机器学习尤其是大模型的应用场景。
1、参与公司内基于Ray的分布式计算场景的方案设计以及研发,包括机器学习、大模型、图等场景;
2、参与Ray内核/Kuberay以及相关上层生态框架的功能开发&性能优化;
3、参与Ray在K8S上的弹性/潮汐资源集群稳定性/可观测性/平台化对接等能力建设;
4、参与Ray开源社区的建设。
职位要求:
1、本科及以上学历,计算机相关专业优先;
2、精通Python/C++/Go等编程语言;
3、具有Ray内核或者Ray相关框架应用经验者优先;
4、熟悉常见的分布式计算框架(如Spark/Flink等),有机器学习相关背景优先。
微信联系了解更多:
扫码内推: