大模型推理优化工程师-(A134140)
薪资面议
大模型推理优化工程师-(A134140) 薪资面议
北京
本科
0
发布于 8月7日
职位描述
Python硬件
工作内容: 1. 负责大模型算法在手机、平板等移动设备平台部署,打造业界领先的全平台推理引擎 2. 分析性能瓶颈,提出系统性优化方案,将算法落地到汽车、手机、小爱等集团业务线 3. 设计先进的推理引擎架构,极致优化高性能算子与推理流水线 4. 了解移动端硬件特性,分析推理性能瓶颈,提出系统性解决方案 5. 充分挖掘硬件平台异构算力,优化资源占用 4. 负责AI项目交付、算法SDK编写、维护、技术文档撰写等工作 任职要求: 1. 本科及以上学历,计算机/电子/信息/通信/自动化/软件等相关专业 2. 掌握Python、C、C++等编程语言,精通数据结构算法,具备优秀的编程习惯 3. 了解CNN、LLM、Transformer、ViT等算法原理 4. 熟悉常见深度学习或LLM推理框架,如:TensorRT、ncnn、mnn、llama、cpp、vllm等 5. 对模型量化、定点化、低比特表示有深入研究和理解 6. 有CUDA、NEON、SIMD指令编程经验 7. 加分项:阅读过任意一种推理框架源码、对高性能计算感兴趣者优先
工作地址
北京/北京/海淀区 西二旗中路33号小米移动互联网产业园
相似职位推荐