蚂蚁集团-分布式 AI 服务框架研发专家/高级专家[杭州/北京]

团队介绍

我们是蚂蚁 AI 平台技术团队,我们的使命是让 AI 生产和应用变得更简单! Gartner 认为 AI 编排和自动化平台( AIOps )和模型操作化( ModelOps )正加快 AI 的应用速度,我们正践行这一趋势,让 AI 在蚂蚁集团的各种业务场景中快速落地。 团队拥有资深的机器学习和工程架构的专家,来自国内外大厂的“老兵”,也有来自 Hadoop/Spark/Kubeflow 等开源社区的 committer ,和各个开源社区都保持着良好的合作关系,欢迎过来一起在社区刷 code 。 团队欢迎有志于发展自己 AI 算法、工程等高维能力的同学,一起参与“云 + 大数据 + AI + 应用” 的组合颠覆创新风暴。

职位描述

  1. 负责建设打造多模型 /多媒体 /多模态的 AI 服务框架,设计和开发高性能分布式服务系统,支撑搜推 /多媒体 /NLP 模型场景;
  2. 负责蚂蚁集团分布式在线框架服务化、部署调度、隔离等方向,包括设计、研发图化框架、服务框架、Serverless 分布式调度、利用率优化和智能运维等等,参与 Ray/Triton 等开源社区建设;
  3. 保障和承担蚂蚁集团 AI 服务相关业务的稳定性,参与所有蚂蚁集团相关的大型技术活动(如双 11 ,双 12 ,新春红包等),确保每一次活动的平稳顺利渡过;

职位要求

  1. 精通 Linux C++编程开发,有 Python 开发经验,具有优秀的架构设计能力,优秀的编程能力及优良的开发习惯;
  2. 具备强烈的进取心、求知欲及团队合作精神,具有良好的沟通能力;
  3. 熟悉大规模分布式服务框架开发者优先,有开源 RPC 开发经验者优先如 gRPC/brpc ,有开源分布式系统开发经验者优先如 Ray/Kubernetes 等;
  4. 熟悉主流深度学习框架开发和使用经验优先,如 PyTorch/Triton/TF/TF Serving ;
  5. 熟悉主流推理后端使用优先,如 ONNXRuntime/TensorRT/OpenVino 。

如有意向欢迎联系邮箱 tengweicai@gmail.com 或微信 cai_tengwei.