职位描述
大模型推理优化
岗位职责
负责 AI推理加速关键竞争力构筑,支持产品演进过程中的性能需求:
1. 负责模型压缩加速算法的能力构筑,包括模型量化、裁剪、蒸馏、投机推理、分布式推理等模型压缩加速算法,构筑高效的模型推理优化平台;
2. 负责AI算子开发关键能力构筑,根据NPU/GPU硬件特点,开发高性能单算子,或对特定单算子、融合算子进行调优,构筑高性能算子开发竞争力;
岗位要求
1、 计算机、数学、统计学等相关专业博士学历;
2、熟悉常用的机器学习算法、深度学习压缩与加速算法,包括LLM量化、剪枝、蒸馏算法,
3、 熟悉深度学习框架和调度优化,例如DeepSpeed、Megatron等,熟悉大模型预训练、分布式并行、TP/PP/DP/EP、分布式通信优化、低参调优等技术;
4、熟悉NPU AscendC、TIK等算子开发语言,或了解GPU CUDA开发,编译优化等;
5、具备快速学习和解决问题的能力,能够不断学习最新的技术和解决实际问题
满足2、3、4中的一条及以上,曾在国际编程大赛或AI类比赛中获得名次可作为额外加分项
投递截止
2026-03-31