用户平台部-算法实习生
250-300/天
用户平台部-算法实习生 250-300/天
北京
硕士
3天/周
3个月
发布于 8月4日
职位描述
PythonSQLPyTorchCTO
岗位职责(具体工作内容) 大模型训练工程师 工作内容: 深入参与垂类场景Agent大模型的预训练和后训练,构建领域对话大模型。 具体内容: 1. 支持预训练和后训练任务,并在导师指导下完成 PPO/DPO/GRPO 等算法应用及改进,支持大模型分布式训练实验。 2. 协助构建奖励模型:偏好数据清洗、特征工程、鲁棒性测试,跟踪实验指标及可视化分析。 3. 驱动效果闭环:搭建离线多维度指标与在线 A/B 体系,打造自迭代数据飞轮。 任职资格(学历、目标院校、语言、技能、性格等要求) 任职要求: - 计算机/AI相关专业本科或硕士在读,至少可实习 3 个月、每周至少3 天。 - 熟练Linux 系统常用命令、Python 、PyTorch、SQL - 熟悉 NLP 基本任务、深度学习、强化学习 - 熟悉大模型基本原理,有大模型训练经验。 - 对 RLHF、奖励模型等有浓厚兴趣,自主钻研。 加分项: - 7b以上LLM训练经验 - 熟悉典型训练框架,如:LLaMA-Factory、Unsloth、VeRL、Deepspeed、Megatron-LM等 - NLP顶会论文优先,密切跟进Post-Training方向最新论文 - 对语言模型、大模型、AGI、人机交互等兴趣浓厚
工作地址
北京
相似职位推荐