多模态大模型强化学习实习生
400-500/天
多模态大模型强化学习实习生 400-500/天
上海
本科
4天/周
6个月及以上
发布于 7月10日
职位描述
PythonScala人工智能
岗位职责 探索研究多模态理解+生成、多模态推理、RL强化学习策略、世界模型、自主学习 等前沿技术; 深入理解强化学习的知识体系,熟悉PPO/DPO/GRPO/DAPO等主流强化学习算法 探索大规模/超大规模多模态理解与生成交织的基础模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、模型优化;提升数据合成、Scalable oversight、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力; 探索突破包括而不限于多模态推理、视觉COT等在内的多模态模型、世界模型进阶能力; 任职要求 本科及以上学历,计算机、自动化、计算机视觉、人工智能等相关专业; 具备扎实的编程技能和扎实的算法基础,熟悉Python语言,具有一定的深度学习项目实践经验。 热爱技术、自驱力强、拥有出色的问题分析和解决能力,能够深入挖掘并解决探索过程中遇到的难题。 对当前主流LLM/VLM/VLA/RL技术原理、模型架构以及应用场景有深入了解者优先; 在人工智能/计算机视觉等领域(CVPR、ICLR、ICRA、ALC、NIPS等)发表过学术论文或技术报告者优先; 每周可保证至少实习4天及以上,实习时间大于 6 个月优先;
工作地址
上海市/上海市/嘉定区 汽车·创新港
相似职位推荐
李女士本月活跃
蔚来汽车 - 人事总监

李女士 - 人事总监

Hi~对我发布的职位感兴趣吗?打开App和我聊聊吧~
匹配度分析 立即分析

三个月内共 87 位应聘者投递了该职位,您的简历与该职位的匹配度为:323

较低
一般
较为匹配
非常匹配
公司信息
蔚来汽车
汽车
外企
1000-9999人
蔚来于2014年11月成立于上海,致力于通过提供高性能的智能电动汽车与极致用户体验,为用户创造愉悦的生活方式。经过五年多的发展,蔚来已成为全球领先的高端智能电动汽车企业之一,并于2018年9月12日在美国纽交所(“NYSE”)上市。 蔚来专注于核心技术的正向研发,目前已获得授权专利及已公开专利申请4000多件,同时建立了一套完整的包括电机、电控、电池包、智能网关、智能座舱、自动辅助驾驶系统等核心技术的独立研发体系。蔚来在上海、合肥、北京、圣何塞、慕尼黑以及牛津等地设立了研发与生产机构,并建设了完备的销售服务体系,覆盖全国300多个城市的用户。 蔚来先后于2018年、2019年推出了两款定位于中高端市场的电动SUV,智能电动旗舰SUV ES8和智能电动全能SUV ES6,并在2019年12月正式发布了智能电动轿跑SUV EC6。 在蔚来,每一位新伙伴都会参与到蔚来“着陆计划”入职体验融入之旅,听蔚来核心创始团队成员给我们讲述我们创业的初心、我们的商业模式,以及我们将如何与每一位期待创造不同的伙伴一起,打造全球用户满意度最高的 “用户企业”。
公司在招职位 查看全部