职位描述
Python人工智能机器人
【职责描述】
我们正在寻找对大语言模型(LLM)的应用落地、效果调优和系统效能提升充满热情的工程师。您将加入我们的核心研发团队,主要负责将先进的 LLM 技术转化为实际的业务价值,特别是在指令微调(SFT)、智能体(AI Agent)的设计与部署,以及应用基础设施(Infra)的优化。我们的目标是打造高效、可靠、智能的 LLM 应用解决方案,加速模型在人形机器人、自动驾驶、多模态等前沿领域的落地。
【工作职责】
1. LLM 微调与应用落地:负责设计并执行 LLM 的指令微调(SFT)和对齐(如 RLHF/DPO)实验,以提升模型在特定应用场景(如代码生成、复杂推理、对话)的表现。主导模型效果的评估体系搭建和优化,确保模型输出的准确性、安全性和一致性。
2. 云端训练框架与效率优化:主导 LLM 微调(SFT/对齐)流程在云端环境下的效率优化,包括数据加载、多机通信、资源调度、框架稳定性等方面,确保 SFT 流程的高效、稳定和低成本运行。
3. 前沿应用技术追踪:紧密追踪 LLM 在 Agent 框架、长上下文处理、多模态交互等应用层面的最新研究与工程实践,并将其快速引入到产品线。
4. AI Agent 研发与部署:探索并实践基于 LLM 的 AI Agent(智能体) 框架,包括工具调用(Tool Use/Function Calling)、规划(Planning)、记忆(Memory)等核心模块的设计与实现。将开发的 Agent 系统集成到实际产品或业务流程中,提升自动化和智能决策能力。
5. 跨团队协作:与算法、数据和产品团队紧密合作,将模型优化成果快速产品化,并收集应用层的反馈来指导下一轮模型迭代。
【任职要求】
1. 教育背景: 计算机、人工智能、软件工程等相关专业本科及以上学位。
2. 模型实战经验: 具备 LLM(如 LLaMA, GPT, Qwen 等)的实际使用、调优或应用开发经验。
3. 核心技能: (至少熟悉以下一项)
- 有实际的 LLM SFT/RLHF 等微调经验,熟悉主流的微调框架(如 verl, Trinity-RFT, Axolotl, etc)。
- 有大规模应用服务部署经验,熟悉 Kubernetes、Docker 等容器化技术。
- 有 LLM 推理服务部署和优化经验,熟悉 vLLM/SGLang/Ray Serve 等。
- 有将 LLM 应用于人形机器人或自动驾驶相关项目的经验。
4. 编程与框架: 熟练掌握 Python,熟悉 PyTorch 等深度学习框架。具备良好的软件工程和代码习惯。
5. 沟通协作: 具备良好的沟通和团队合作精神,能快速学习和适应新技术。
工作地址
上海市/上海市/浦东新区 上海市浦东新区育仁路188弄3号张江科学之门T5