蚂蚁集团 — 强化学习技术专家 [杭州/北京]

团队介绍

蚂蚁集团计算智能技术部(ComputingIntelligence)是整个蚂蚁集团数据引擎的底盘,为整个集团的各项业务发展保驾护航。依托蚂蚁集团丰富的数字金融和数字生活场景,我们打造了蚂蚁集团计算存储基础架构,其技术核心包括金融大数据的开放计算体系,金融智能机器学习平台及系统架构,适合金融场景的多模融合计算引擎,实时计算,科学计算以及云原生弹性系统。

我们所属的Ray团队,以跟加州伯克利大学RISELAB实验室合作开发的分布式计算引擎Ray为通用底盘,打造下一代大规模分布式计算引擎与生态产品,服务于数字金融、网商科技、安全风控、知识图谱、科学计算、在线学习、图计算、隐私计算、运筹计算等蚂蚁大部分业务与技术场景。

欢迎对技术有极致的追求和热爱,对分布式系统、大规模任务调度、大规模数据传输、高性能计算、内存计算、深度学习、强化学习等感兴趣的同学加入我们。

职位描述

1.对RLlib进行二次开发和维护,负责其模块的改进和bug修复;
2.研究和开发强化学习算法,如DQN、DDPG和PPO等,将其应用到实际场景,通过对比实验验证其性能,结合强化学习算法,解决实际问题和提供创新应用;
3.参与开源社区的讨论和贡献,共同推进强化学习领域的发展;
4.探索Ray在AI领域的发展;
5.有超强的分布式计算相关基础知识和分布式调度、存储、深度学习、强化学习等方面的实践经验;
6.聪明、乐观、皮实、自省、有追求卓越的心和强大的自我驱动力。

职位要求

1.极佳的工程实现能力,熟练掌握C/C++、Java、Python等至少一门语言;
2.熟悉强化学习理论和应用,掌握深度学习框架(如TensorFlow、Pytorch、JAX等);
3.常用的强化学习算法和工具,如A3C、Q-learning、Deep Q-Networks、PPO等;
4.学习能力强,对新事物保有好奇心,并能快速适应新环境;
5.良好的沟通能力和团队协同能力;能与他人合作,共同完成目标;
6.对所在领域有热情,相信方法总比困难多,善于独立思考并反思总结。

如有意向欢迎联系邮箱 wumuzi520@126.com 或微信 wumuzi520