职位描述
PythonC++硬件
职责描述:
1. 负责大模型算法在手机、平板等移动设备平台部署,打造业界领先的全平台推理引擎
2. 分析性能瓶颈,提出系统性优化方案,将算法落地到汽车、手机、小爱等集团业务线
3. 设计先进的推理引擎架构,极致优化高性能算子与推理流水线
4. 了解移动端硬件特性,分析推理性能瓶颈,提出系统性解决方案
5. 充分挖掘硬件平台异构算力,优化资源占用
6. 负责AI项目交付、算法库开发、升级优化、技术文档撰写等工作
任职要求:
1. 本科及以上学历,计算机/电子/信息/通信/自动化/软件等相关专业
2. 掌握Python、C、C++等编程语言,精通数据结构算法,具备优秀的编程习惯
3. 了解CNN、LLM、Transformer、ViT等算法原理
4. 熟悉常见深度学习或LLM推理框架,如:TensorRT、ncnn、mnn、llama、cpp、vllm等
5. 对模型量化、定点化、低比特表示有深入研究和理解
6. 有CUDA、NEON、SIMD指令编程经验
7. 加分项:阅读过任意一种推理框架源码、对高性能计算感兴趣者优先