VLA/Vision Agent算法实习生
120-200/天
VLA/Vision Agent算法实习生 120-200/天
北京
硕士
3天/周
6个月及以上
发布于 8月8日
职位描述
Go机器人
核心职责 1. 开发视觉驱动的Agent决策系统 - 基于VLA框架(如RT-X, Gato, VoxPoser)构建视觉-动作映射模型,实现语言指令→场景理解→动作生成闭环; - 设计多模态状态表示模块(图像/点云/语言嵌入的融合与压缩); 2. 工程化部署与优化 - 在仿真环境(Isaac Gym, iGibson)或真实机器人平台部署Agent策略,解决实时推理延迟问题; - 开发动作安全校验机制,防止机械臂碰撞、自动驾驶误操作等风险; 3. 构建评估体系 - 设计具身智能评测基准(任务成功率、指令泛化性、异常恢复能力); - 开发可视化调试工具,实时追踪Agent的注意力和决策路径; 任职要求 - 熟悉视觉-语言模型(VLMs) 的微调与部署(如OpenFlamingo, LLaVA); - 具备机器人动作控制基础(运动学建模、轨迹规划、ROS通信) 1. 项目经验 - 有以下任一实践: ✅ 机器人抓取/导航任务的端到端训练 ✅ 决策模型开发 ✅ 仿真环境中的具身智能体训练 加分项 - 在真实机器人(UR5/机械狗/无人车)部署过决策模型; - 有3D视觉处理经验(NeRF, 点云动作生成); - 熟悉大规模具身智能数据集(如RT-1, Open X-Embodiment)。 其他: 地点:北京/青岛西海岸西区(德国企业中心) 实习期不少于6个月 每周时间>=3天
工作地址
北京市/北京市/朝阳区 望京中环南路7号F楼
相似职位推荐
褚先生本月活跃
西门子 - 人事

褚先生 - 人事

Hi~对我发布的职位感兴趣吗?打开App和我聊聊吧~
匹配度分析 立即分析

三个月内共 87 位应聘者投递了该职位,您的简历与该职位的匹配度为:323

较低
一般
较为匹配
非常匹配
公司信息
西门子
外企
10000人以上
西门子股份公司(SIEMENS AG)是总部位于柏林和慕尼黑的世界上最大的电子和电气工程公司之一,主要业务集中在工业、能源和医疗领域。1847年由维尔纳·冯·西门子建立。西门子股份公司是在法兰克福证券交易所和纽约证券交易所上市的公司。截至2010年4月,西门子公司拥有大约40.5万名员工,在2009财年(截至2009年9月30日),西门子公司总营收达到767亿欧元,净收入达到25亿欧元。 自2008年1月起,公司被划分为工业部门、能源行业、医疗设备共三个部门。其中工业部门下设6个分部门,包括工业自动化、动力控制、楼宇科技、工业解决方案、移动;能源行业下设6个分部门,包括火力发电、可再生能源、石油与天然气、旋转设备服务、输电和配电;医疗设备下设3个子部门,包括影像及资讯科技、工作流程、解决方案与诊断。此外还有两个其他组织,西门子IT解决方案和服务与西门子财务服务人本集团,提供客户其他类型服务。 西门子公司的五个业务领域的业务涵盖自动化与控制(自动化与驱动、工业解决方案与服务、西门子楼宇科技);动力、交通;铁路(西门子交通技术集团)、汽车;医疗(西门子医疗解决方案);信息与通信(西门子通信、西门子IT解决方案和服务);照明(欧司朗)。
公司在招职位 查看全部