训练平台性能优化工程师实习生(A45035)
250-400/天
训练平台性能优化工程师实习生(A45035) 250-400/天
北京
本科
5天/周
3个月
发布于 7月22日
职位描述
职责描述: 深度优化训练流程 主导模型训练全链路性能分析与优化,设计GPU资源弹性调度策略 开发自动化训练加速工具链,构建可扩展的云端训练框架 研发混合精度训练、梯度压缩等前沿技术,突破训练吞吐瓶颈 构建训练优化体系 制定标准化训练效能评估体系,建立成本-效率量化模型 设计可复用的训练加速组件库,沉淀最佳实践方法论 开发训练过程性能分析平台,实现性能问题智能诊断 赋能业务研发 优化多任务资源调度策略,提升GPU集群整体利用率 为算法团队提供训练加速解决方案,缩短模型迭代周期 任职要求: 1.精通深度学习训练加速技术,熟悉分布式训练框架设计 2.掌握CUDA编程及GPU性能分析工具(Nsight/Profiler) 3.熟练使用PyTorch框架,具备训练流程优化实战经验 4.熟悉常见模型压缩技术(量化/剪枝/蒸馏)及落地应用 5.具备大规模集群资源调度系统开发经验者优先 【技术加分项】 1.有mmengine/mmcv等训练框架开发经验 2.熟悉MPI/NCCL等分布式通信协议 3.在MLSys/ICLR等顶会发表过训练优化相关论文
工作地址
北京市/北京市/海淀区
相似职位推荐