AI算子开发工程师-(A163261)
薪资面议
AI算子开发工程师-(A163261) 薪资面议
北京
本科
0
发布于 8月7日
职位描述
Python硬件
工作内容: 1. 设计、开发并优化面向NPU的高性能算子库,覆盖卷积、矩阵运算、归一化等核心算子; 2. 基于类CUDA编程语言或NPU专用指令集,实现算子极致性能优化,降低延迟与功耗; 3. 深入理解NPU硬件架构(如计算单元、内存层级、数据流),针对硬件特性进行算子级优化; 4.与芯片团队紧密协作,反馈算子性能瓶颈并提出硬件改进建议; 5.编写高性能计算代码、汇编级优化及Benchmark测试。 任职要求: 1. 计算机科学、电子工程、数学等相关专业,本科及以上学历; 2. 熟悉cuda/C++/Python中至少一种编程语言; 3. 具备类CUDA编程经验(CUDA/OpenCL/HIP等)或NPU SDK开发经验; 4. 熟悉并行计算体系结构,有NPU/GPU开发和优化经验优先; 5. 对性能优化有极致追求,能通过Profiling工具(如Nsight、VTune)定位瓶颈; 6. 良好的团队沟通能力,责任心强。
工作地址
北京/北京/海淀区 西二旗中路33号小米移动互联网产业园
相似职位推荐