超大规模后训练关键技术研究-A Star-杭州
薪资面议
超大规模后训练关键技术研究-A Star-杭州 薪资面议
杭州
本科
26届
发布于 8月5日
职位描述
我们持续关注大模型后训练的多种场景,重点优化攻坚下面场景:
1、支持超长序列的模型的高效训练;
2、支持推理模型的高效训练,支持包括Agent RL、Search RL等多种有挑战的训练范式;
3、研发训推分离的RL框架,结合阿里云Cloud的基础设施来最大化提升训练的迭代速度。


职位要求
1、熟悉深度学习基本原理、主流深度学习算法及应用、以及至少一种主流框架(PyTorch、TensorFlow等);
2、熟悉Megatron、vLLM、Sglang、VERL、ROLL等框架技术,并在研究或实习项目中有相应的实践经历;
3、熟悉RL的基础算法,包括PPO、GRPO等经典RL算法;
4、具备扎实的计算机基础知识、C++/Python编程能力,熟悉常见数据结构和设计模式;
5、具有很强的学习能力、复杂问题归纳梳理能力、沟通和团队协作能力,具备能够深度钻研技术的耐心。
【加分项】
1、有很强的学术研究能力和优秀的学术成果(AI领域顶会/顶刊论文);
2、熟悉体系结构,并有扎实的高性能计算/AI编译器/推理框架/模型优化经验。