职位描述
PythonPyTorch人工智能机器人硬件
【职责描述】
1、强化学习算法研发与优化
(1)设计并实现适用于人形机器人的强化学习算法(如 PPO、SAC、TD3、RLHF 等);
(2)探索基于模仿学习、分层强化学习 等方法提升训练效率和泛化能力。
2、仿真环境构建与训练调试
(1)熟练使用 Isaac Gym、Isaac Lab、MuJoCo 等构建高保真仿真环境;
(2)搭建从感知到控制的闭环 RL 训练系统,包括奖励设计、状态定义、终止条件等模块;
(3)在仿真中对人形机器人进行行走、站立、奔跑、上下坡、障碍避让等技能的训练和调试。
3、算法评估与系统优化
(1)设计通用评估指标评估策略稳定性、收敛速度、鲁棒性等;
(2)对训练 pipeline 进行系统优化(如并行采样、分布式训练、重参数化等)。
4、与机器人硬件团队协作
(1)推动仿真到真实(Sim2Real)落地,参与策略在真实人形机器人上的迁移与调试;
(2)参与系统集成和调试,包括控制接口适配与策略部署。
【任职要求】
1、学历要求:硕士及以上学历,具有机器人、控制、人工智能、计算机、自动化等相关背景;
2、技术能力:
(1)扎实的强化学习理论基础,熟悉主流算法(如 PPO、TD3、SAC、Behavior Cloning 等);
(2)熟悉 PyTorch、Isaac Gym、Isaac Lab、MuJoCo、Gym、RLlib 等工具和框架;
(3)熟悉运动控制、动力学建模、人形机器人运动规划等相关知识;
(4)熟悉并行训练、分布式采样、多环境仿真等加速训练手段。
3、编程能力:精通 Python,熟悉C++ 加分;良好的代码组织和工程化能力。
4、英文能力:能阅读英文论文和文档,跟进前沿研究成果。
工作地址
广东省/深圳市/南山区 深圳湾科技生态园12栋B座