强化学习算法实习生(A250217)
250-500/天
强化学习算法实习生(A250217) 250-500/天
深圳
硕士
5天/周
3个月
发布于 10月15日
职位描述
PythonPyTorch人工智能机器人硬件
【职责描述】 1、强化学习算法研发与优化 (1)设计并实现适用于人形机器人的强化学习算法(如 PPO、SAC、TD3、RLHF 等); (2)探索基于模仿学习、分层强化学习 等方法提升训练效率和泛化能力。 2、仿真环境构建与训练调试 (1)熟练使用 Isaac Gym、Isaac Lab、MuJoCo 等构建高保真仿真环境; (2)搭建从感知到控制的闭环 RL 训练系统,包括奖励设计、状态定义、终止条件等模块; (3)在仿真中对人形机器人进行行走、站立、奔跑、上下坡、障碍避让等技能的训练和调试。 3、算法评估与系统优化 (1)设计通用评估指标评估策略稳定性、收敛速度、鲁棒性等; (2)对训练 pipeline 进行系统优化(如并行采样、分布式训练、重参数化等)。 4、与机器人硬件团队协作 (1)推动仿真到真实(Sim2Real)落地,参与策略在真实人形机器人上的迁移与调试; (2)参与系统集成和调试,包括控制接口适配与策略部署。 【任职要求】 1、学历要求:硕士及以上学历,具有机器人、控制、人工智能、计算机、自动化等相关背景; 2、技术能力: (1)扎实的强化学习理论基础,熟悉主流算法(如 PPO、TD3、SAC、Behavior Cloning 等); (2)熟悉 PyTorch、Isaac Gym、Isaac Lab、MuJoCo、Gym、RLlib 等工具和框架; (3)熟悉运动控制、动力学建模、人形机器人运动规划等相关知识; (4)熟悉并行训练、分布式采样、多环境仿真等加速训练手段。 3、编程能力:精通 Python,熟悉C++ 加分;良好的代码组织和工程化能力。 4、英文能力:能阅读英文论文和文档,跟进前沿研究成果。
工作地址
广东省/深圳市/南山区 深圳湾科技生态园12栋B座
韩女士本月活跃
小鹏汽车 - 人力资源主管

韩女士 - 人力资源主管

Hi~对我发布的职位感兴趣吗?打开App和我聊聊吧~
公司信息
小鹏汽车
汽车
民企
500-999人
公司介绍 小鹏汽车成立于2014年中,以“三电一屏”开发为切入点,进行互联网汽车核心系统开发。小鹏汽车成立的初衷是:“造年轻人喜爱的互联网汽车”,我们期待用全新的技术和服务,来改变用户购买、使用和维护汽车的模式,计划2017年内首批车辆上市。 融资进展 小鹏汽车项目一启动即获得阿里巴巴、YY等互联网公司高管数百万美元的天使投资; 2016年3月,团队完成Pre-A轮融资,更多互联网精英及VC机构成为小鹏汽车投资人。 2017年6月,小鹏汽车获得优车产业基金22亿元的A轮投资。小鹏汽车将与神州优车集团联手打造完整汽车服务体系,完成从研发、生产、销售到售后的完整布局。 员工福利 小鹏汽车为员工提供优渥的薪资和期权。同时随着小鹏汽车的不断壮大,地方政府对科技创新企业的重视及帮持,小鹏汽车还为员工提供上百套高级人才公寓,包括50㎡的单身公寓、90㎡家庭公寓、140㎡豪华公寓。 企业文化 小鹏汽车以独特的“班级文化”作为企业文化的基石,推崇平等、开放,同事之间以“同学”相称,使得大家拥有更轻松的工作氛围。同时丰富的社团活动,也让大家工作之余能更好地享受生活。 酷玩小分队:VR、无人机、机器人等智能硬件提前尝鲜; 豪驾俱乐部:游艇、豪车不定期体验; 小鹏读书会:员工队伍快速学习与迭代; 鹏派音乐:以歌会友; 人才构成 团队成员主要来自广汽、比亚迪、福特、宝马、德尔福等知名整车与大型零部件公司,以及阿里巴巴、腾讯、三星、华为等互联网公司与科技公司。 人才招聘 快速发展中的小鹏汽车目前拥有近三百名员工,伴随着创新技术的驱动,当下的汽车产业面对电动化、智能化、网联化等全新的发展趋势,充满了未知的机遇,也伴随着许多挑战。因此,我们希望找到人群中那个勇敢的、有创新精神的、与众不同的你加入小鹏汽车,一起拥抱变化,迎接未来。
公司在招职位 查看全部